pandas入門(一)

原創

2020-07-02 01:20

pandas介紹

它含有使數據清洗和分析工作變得更快更簡單的數據結構和操作工具。pandas經常和其它工具一同使用，如數值計算工具NumPy和SciPy，分析庫statsmodels和scikit-learn，和數據可視化庫matplotlib。pandas是基於NumPy數組構建的，特別是基於數組的函數和不使用for循環的數據處理。

pandas的數據結構

兩個主要數據結構：Series和DataFrame。爲大多數應用提供了一種可靠的、易於使用的基礎。

Series

Series是一種類似於一維數組的對象，它由一組數據（各種NumPy數據類型）以及一組與之相關的數據標籤（即索引）組成。
可僅由一組數據即可產生最簡單的Series

=====================================

Series的字符串表現形式爲：索引在左邊，值在右邊。由於我們沒有爲數據指定索引，於是會自動創建一個0到N-1（N爲數據的長度）的整數型索引。通過Series 的values和index屬性獲取其數組表示形式和索引對象

=====================================

創建的Series帶有一個可以對各個數據點進行標記的索引

=====================================

通過索引的方式選取Series中的單個或一組值

[‘s’, ‘d’, ‘x’]是索引列表，即使它包含的是字符串而不是整數。使用NumPy函數或類似NumPy的運算（如根據布爾型數組進行過濾、標量乘法、應用數學函數等）都會保留索引值的鏈接

=====================================

=====================================

還可以將Series看成是一個定長的有序字典，因爲它是索引值到數據值的一個映射。它可以用在許多原本需要字典參數的函數中

=====================================

如果數據被存放在一個Python字典中，也可以直接通過這個字典來創建Series

=====================================

如果只傳入一個字典，則結果Series中的索引就是原字典的鍵（有序排列）。你可以傳入排好序的字典的鍵以改變順序

=====================================

將使用缺失（missing）或NA表示缺失數據。pandas的isnull和notnull函數可用於檢測缺失數據

=====================================

Series也有類似的實例方法

=====================================

Series最重要的一個功能是，它會根據運算的索引標籤自動對齊數據

=====================================

Series對象本身及其索引都有一個name屬性，該屬性跟pandas其他的關鍵功能關係非常密切

=====================================

Series的索引可以通過賦值的方式就地修改

++++++++++++++++++++++++++++++++++++

下一篇：pandas入門(二)

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Python的while循環

1.while循環的格式 while 條件: 條件滿足時，做的事情1 條件滿足時，做的事情2 條件滿足時，做的事情3 ...(省略)... demo

2023-10-10 11:37:31

python初識第二天

認識現實世界與虛擬世界的橋樑感受python帶來的魔力數據類型 Python裏，最常用的數據類型有三種——字符串(str)、整數(int)和浮點數(float) 字符串，字符串英文string，簡寫str 字符串的識別方式非常簡單—

2023-02-01 22:01:30

Python 的十大特性

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

Rupam Choudhary

2021-12-16 16:04:03

Python開發工程師[金融方向] Remote/Singapore (20k - 45k)

簡單介紹：要做的事：同交易員一起開發交易相關係統；能力要求：能獨立解決問題，完成項目開發，有較強的學習能力（技術和業務）品格正直，較強的心裏承壓能力；職業前景：能提供給你完全不同於互聯網公司的報酬上限，職業途徑；與一流交易員溝通機會，瞭解他

2021-12-09 17:53:05

JavaScript 瀏覽器統治地位不保？Python 有望取代

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-02 17:58:57

懶人暢聽網，有聲小說類目數據採集，多線程速採案例，Python爬蟲120例之23例

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

梦想橡皮擦

2021-11-23 11:18:54

Python爬蟲技術與數據可視化：Numpy、pandas、Matplotlib的黃金組合

前言在當今信息爆炸的時代，數據已成爲企業決策和發展的關鍵。而互聯網作爲信息的主要來源，網頁中蘊含着大量的數據等待被挖掘。Python爬蟲技術和數據可視化工具的結合，爲我們提供了一個強大的工具箱，可以幫助我們從網絡中抓取數據，並將其可視

2024-04-29 23:26:28

五一假期暢遊指南：Python技術構建的熱門景點分析系統解讀

導言五一假期即將到來，作爲一名熱愛旅遊的技術達人，我總是希望能夠通過技術手段更好地規劃我的旅行路線。在這篇文章中，我將向大家介紹一款基於Python技術的熱門景點分析系統，幫助您在五一假期中游玩得更加盡興！ 1. 系統概述熱門景點

2024-04-16 23:25:46

從靜態到動態化，Python數據可視化中的Matplotlib和Seaborn

本文分享自華爲雲社區《Python數據可視化大揭祕：Matplotlib和Seaborn高效應用指南》，作者：檸檬味擁抱。安裝Matplotlib和Seaborn 首先，確保你已經安裝了Matplotlib和Seaborn庫。如果沒有

2024-03-25 11:01:41

05-快速理解SparkSQL的DataSet

1 定義一個數據集是分佈式的數據集合。Spark 1.6增加新接口Dataset，提供 RDD的優點：強類型、能夠使用強大lambda函數 Spark SQL優化執行引擎的優點可從JVM對象構造Dataset，然後函數式轉換（map

2024-03-25 02:48:38

大模型推理框架：從理論到實踐的全面解析

在數據驅動的時代，深度學習技術已經滲透到各個行業，從圖像識別到自然語言處理，從推薦系統到智能客服，其應用無處不在。然而，深度學習模型的訓練和推理過程往往涉及大量數據和複雜計算，傳統的計算框架難以滿足需求。因此，大模型推理框架應運而生，成爲解

2024-03-23 00:31:01

盤點一個Pandas處理json數據的實戰案例

大家好，我是Python進階者。一、前言前幾天在Python最強王者交流羣【黑科技·鼓包】問了一個Pandas處理json數據的問題。問題如下：大佬們請教下一個很簡單的問題，因爲我半瓢水也不知道該怎麼解決，問AI好像也寫不好描述，麻煩幫

2024-03-06 22:16:06

微博數據可視化分析：利用Python構建信息圖表展示話題熱度

1. 引言隨着社交媒體的迅速發展，微博已成爲人們交流觀點、表達情感的重要平臺之一。微博評論數據蘊含着豐富的信息，通過對這些數據進行分析和可視化，我們可以深入瞭解用戶對特定話題的關注程度和情感傾向。本文將介紹如何利用Python進行微博

2024-02-20 00:22:15

盤點一個txt文檔合併的實戰需求（方法三）

大家好，我是皮皮。一、前言前幾天在Python最強王者交流羣【FiNε_】問了一個Pandas數據合併的問題。問題如下圖所示：上一篇文章中我們已經看到了3個方法，這一篇文章我們一起來看看另外一個方法。二、實現過程這裏【吳超建】斗

2024-02-04 21:53:00

盤點一個txt文檔合併的實戰需求（方法一）

大家好，我是皮皮。一、前言前幾天在Python最強王者交流羣【FiNε_】問了一個Pandas數據合併的問題。問題如下圖所示：二、實現過程這裏【隔壁😼山楂】給了一個指導，如下所示：並給出瞭如下代碼： from pathlib

2024-02-02 21:54:46

24小時熱門文章

最新文章

最新評論文章