原创 Python數據分析實戰【第三章】3.5-Matplotlib子圖【python】

【課程3.5】 子圖 在matplotlib中,整個圖像爲一個Figure對象 在Figure對象中可以包含一個或者多個Axes對象 每個Axes(ax)對象都是一個擁有自己座標系統的繪圖區域 plt.figure, plt.su

原创 Python數據分析實戰【第三章】3.1-Matplotlib簡介及圖表窗口【python】

【課程3.1】 Matplotlib簡介及圖表窗口 Matplotlib → 一個python版的matlab繪圖接口,以2D爲主,支持python、numpy、pandas基本數據結構,運營高效且有較豐富的圖表庫 1.圖表窗口1

原创 Python數據分析實戰【第三章】3.4-Matplotlib 刻度、註解、圖表輸出【python】

【課程3.4】 刻度、註解、圖表輸出 主刻度、次刻度 1.刻度 from matplotlib.ticker import MultipleLocator, FormatStrFormatter t = np.arange(0.

原创 Python數據分析實戰【第三章】2.21-透視表及交叉表【python】

【課程2.21】 透視表及交叉表 類似excel數據透視 - pivot table / crosstab 1.透視表:pivot_table # pd.pivot_table(data, values=None, index=

原创 Python數據分析實戰【第三章】2.18-Pandas去重及替換【python】

【課程2.18】 去重及替換 1.去重 .duplicated .duplicated / .replace s = pd.Series([1,1,1,1,2,2,2,3,4,5,5,5,5]) print(s.duplicat

原创 Python數據分析實戰【第三章】2.21-Pandas數據讀取【python】

【課程2.22】 數據讀取 核心:read_table, read_csv, read_excel 1.讀取普通分隔數據:read_table # 可以讀取txt,csv import os os.chdir('C:/Users

原创 Python數據分析實戰【第三章】2.20-分組轉換及一般性“拆分-應用-合併”【python】

【課程2.20 分組轉換及一般性“拆分-應用-合併”】 課程作業 1.數據分組轉換,transform df = pd.DataFrame({'data1':np.random.rand(5),

原创 Python數據分析實戰【第三章】2.16-Pandas合併 merge、join【python】

【課程2.16】 合併 merge、join Pandas具有全功能的,高性能內存中連接操作,與SQL等關係數據庫非常相似 1.merge合併 → 類似excel的vlookup df1 = pd.DataFrame({'key

原创 Python數據分析實戰【第三章】2.19-Pandas數據分組【python】

【課程2.19】 數據分組 分組統計 - groupby功能 ① 根據某些條件將數據拆分成組 ② 對每個組獨立應用函數 ③ 將結果合併到一個數據結構中 1.分組 df = pd.DataFrame({'A' : ['foo',

原创 Python數據分析實戰【第三章】2.15-文本數據【python】

【課程2.15】 文本數據 Pandas針對字符串配備的一套方法,使其易於對數組的每個元素進行操作 1.通過str訪問,且自動排除丟失/ NA值 s = pd.Series(['A','b','C','bbhello','123'

原创 Python數據分析實戰【第三章】2.14-數值計算和統計基礎【python】

【課程2.14】 數值計算和統計基礎 常用數學、統計方法 1.基本參數:axis、skipna import numpy as np import pandas as pd df = pd.DataFrame({'key1':

原创 Python數據分析實戰【第三章】2.17-Pandas連接與修補 concat、combine_first【python】

【課程2.17】 連接與修補 concat、combine_first 連接 - 沿軸執行連接操作 1.連接:concat s1 = pd.Series([1,2,3]) s2 = pd.Series([2,3,4]) s3 =

原创 Python數據分析實戰【第三章】2.9-Pandas時刻數據:Timestamp【python】

【課程2.9】 Pandas時刻數據:Timestamp 時刻數據代表時間點,是pandas的數據類型,是將值與時間點相關聯的最基本類型的時間序列數據 pandas.Timestamp() 1.pd.Timestamp() im

原创 Python數據分析實戰【第三章】2.6-Pandas數據結構Dataframe:索引【python】

【課程2.6】 Pandas數據結構Dataframe:索引 Dataframe既有行索引也有列索引,可以被看做由Series組成的字典(共用一個索引) 選擇列 / 選擇行 / 切片 / 布爾判斷 1.選擇行與列 df = pd

原创 Python數據分析實戰【第三章】2.7-Pandas數據結構Dataframe:基本技巧【python】

【課程2.7】 Pandas數據結構Dataframe:基本技巧 數據查看、轉置 / 添加、修改、刪除值 / 對齊 / 排序 1.數據查看、轉置 df = pd.DataFrame(np.random.rand(16).resha