Python 數據處理的 Some tips --- 索引

原創

2020-02-20 13:43

《利用Python進行數據分析》筆記

我個人覺得有些東西是需要用到的時候查一下就行的，比如矩陣求逆，矩陣轉置，但是一些更加常用的東西還是要掃一遍書的，記錄下來一些印象深刻的點，以後查着方便。

蛋疼，其實就是簡單學一下索引，不然取數據都不會

寫下的東西並不官方，也不敢說會幫助什麼人，覺得還是自己的一些筆記而已

yield:
生成時才調用，有點C++裏面動態綁定的意味

Numpy:

Numpy的數組切片是原始數組的視圖，數據不會複製，改變會體現在原有的數據上
如果想要複製的話，要用.copy

數組的文件輸入輸出

np.save() #將 ndarray 存儲爲二進制文件，擴展名爲 .npy
np.load() #加載 .npy 文件到程序中，返回值爲 ndarray

Pandas:

index對象是不可修改的

Series :
個人感覺就相當於一個有序的dict
使用的時候分別調用 .index 和 .value 會返回兩個列表

Series本身和索引都有name屬性

Series運算會自動對齊

DataFrame
可以看作，每一列是一個Series，每一行也是一個Series
所有的取出切片操作，也是在原數據的視圖上操作

直接 obj[index] 是取一列

用行索引取一行
.ix['index']

所以取單個元素 a(2,3)
可以用 a[3][2] 或者 a.ix[2][3] 或者 a.ix[2,3]

刪除一列 del

根據index取行或者列 .xs() 常用的參數(key, axis)
http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.xs.html

坑啊，看書原來icol，irow 是 deprecated….
統一用iloc[x, y]，都是返回一個Series或者直接定位到具體數值

先到這吧…

發佈了105 篇原創文章 · 獲贊 159 · 訪問量 15萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

愛奇藝數據湖實戰 - 實時湖倉一體化

01 概述數據是洞察用戶、市場、運營決策的基礎資料，在愛奇藝被廣泛應用在推薦、廣告、用戶增長、營銷等場景中。愛奇藝大數據業務之前採用 Lambda 架構，滿足海量

愛奇藝技術產品團隊

2024-05-09 01:18:23

京東科技數字化營銷能力的演進與最佳實踐| 京東雲技術團隊

1.導讀在當今數字化時代，全球互聯網用戶已超過50億人，中國的互聯網用戶數量更是達到10.5億，這爲企業提供了巨大的市場機遇和挑戰。根據市場研究公司的最新報告，全球數字營銷費用支出預計將在未來五年內進一步大幅增加，這表明數字化營銷已成爲

2024-05-07 23:17:11

AI 001 號員工通義靈碼入職阿里雲丨阿里云云原生 4 月產品月報

雲原生月度動態雲原生是企業數字創新的最短路徑。《阿里云云原生每月動態》，從趨勢熱點、產品新功能、服務客戶、開源與開發者動態等方面，爲企業提供數字化的路徑與指南。趨勢熱點 🥇 Cloud Native Day - Indonesia 成

2024-05-07 21:12:05

CCE雲原生混部場景下的測試案例

本文分享自華爲雲社區《CCE雲原生混部場景下在線任務搶佔、壓制離線任務CPU資源、保障在線任務服務質量效果測試》，作者：可以交個朋友。背景企業的 IT 環境通常運行兩大類進程，一類是在線服務，一類是離線作業。在線任務：運行時間長，服

2024-05-07 10:33:03

如何通過前端表格控件在10分鐘內完成一張分組報表？

前言：當今時代，報表作爲信息化系統的重要組成部分，在日常的使用中發揮着關鍵作用。藉助報表工具使得數據錄入、分析和傳遞的過程被數字化和智能化，大大提高了數據的準確性及利用的高效性。而在此過程中，信息化系統能夠實現對數據的實時監控和更新，爲管

2024-05-06 10:22:56

巧用 TiCDC Syncpiont 構建銀行實時交易和準實時計算一體化架構

本文闡述了某商業銀行如何利用 TiCDC Syncpoint 功能，在 TiDB 平臺上構建一個既能處理實時交易又能進行準實時計算的一體化架構，用以優化其零售資格業務系統的實踐。通過遷移到 TiDB 並巧妙應用 Syncpoint，該銀行成

2024-04-30 22:24:58

Apache DolphinScheduler支持Flink嗎？

隨着大數據技術的快速發展，很多企業開始將Flink引入到生產環境中，以滿足日益複雜的數據處理需求。而作爲一款企業級的數據調度平臺，Apache DolphinScheduler也跟上了時代步伐，推出了對Flink任務類型的支持。 Flink

2024-04-30 11:49:27

從原始邊列表到鄰接矩陣Python實現圖數據處理的完整指南

本文分享自華爲雲社區《從原始邊列表到鄰接矩陣Python實現圖數據處理的完整指南》，作者：檸檬味擁抱。在圖論和網絡分析中，圖是一種非常重要的數據結構，它由節點（或頂點）和連接這些節點的邊組成。在Python中，我們可以使用鄰接矩陣來表示

2024-04-30 10:34:05

如何通過前後端交互的方式製作Excel報表

前言 Excel擁有在辦公領域最廣泛的受衆羣體，以其強大的數據處理和可視化功能，成了無可替代的工具。它不僅可以呈現數據清晰明瞭，還能進行數據分析、圖表製作和數據透視等操作，爲用戶提供了全面的數據展示和分析能力。今天小編就爲大家介紹一下，如

2024-04-30 10:24:12

Python爬蟲技術與數據可視化：Numpy、pandas、Matplotlib的黃金組合

前言在當今信息爆炸的時代，數據已成爲企業決策和發展的關鍵。而互聯網作爲信息的主要來源，網頁中蘊含着大量的數據等待被挖掘。Python爬蟲技術和數據可視化工具的結合，爲我們提供了一個強大的工具箱，可以幫助我們從網絡中抓取數據，並將其可視

2024-04-29 23:26:28

大模型將進一步推動AI數據發展，行業數據類型更加豐富

爲支撐加快推進新型工業化，發展新質生產力，探索數據要素與智能算力網絡協同發展路徑，促進數字技術與實體經濟深度融合，中國信息通信研究院作爲新型基礎設施建設者，科技創新的領軍者，在2024星火生態大會期間，舉辦了"數據要素及智能算力網絡創新專題

2024-04-29 00:55:15

1 名工程師輕鬆管理 20 個工作流，創業企業用 Serverless 讓數據處理流程提效

作者：嶽洋、陳德全、劉靜娜北京語勢科技有限公司成立於 2023 年 6 月，語勢科技定位爲“智能投資時代的主題入口”，在資管行業從以機構爲核心轉向以用戶爲核心的變革時代，通過打造主題投資引擎，賦能普惠投資一體化，打造以投資者和資管機構爲主

2024-04-28 21:12:22

大數據小白的測試成長之路

引言 22年校招入職京東後，我一直在數據中臺測試部從事測試開發的工作。畢業後，寫的最多的文檔是測試計劃和測試報告，鮮有機會就自己的成長碼字進行回顧和總結。借“up技術人”欄目，也終於是在工作之餘回頭望，對自己這近兩年時光進行一個小總結

2024-04-28 11:17:19

賦能開發者，騰訊雲與你共探AI提升十倍生產力之路

引言 AI 技術發展迅速，對於開發者而言，AI 既可能是提高生產力的神兵利器，也可能成爲職業生涯潛在的“威脅”。開發者如何與 AI 協同進化，提升個人能力和價值；如何利用提高 AI 生產力，推動企業創新，實現降本提效

2024-04-28 11:11:17

京東廣告研發——效率爲王：廣告統一檢索平臺實踐

1、系統概述實踐證明，將互聯網流量變現的在線廣告是互聯網最成功的商業模式，而電商場景是在線廣告的核心場景。京東服務中國數億的用戶和大量的商家，商品池海量。平臺在兼顧用戶體驗、平臺、廣告主收益的前提推送商品具有挑戰性。京東廣告檢索平臺

2024-04-25 23:17:47

24小時熱門文章

最新文章

最新評論文章