原创 Python-搞懂多種函數參數的用法

Python-搞懂多種函數參數的用法 參數作爲函數調用中傳遞給函數體的數據,具有多種形式,在函數定義中可分爲:普通參數、默認值參數、args參數、kwargs參數,在函數調用中:位置參數、關鍵字參數。 接下來,該博文敘述上述參數的用法

原创 Pandas詳解二十五之聚合運算agg

約定: import pandas as pd 聚合運算 在數據分析中,對數據聚合(求和、平均值等)通常是不可避免的。在將數據分組(groupby)後,新手若不知函數 agg() 的情況下,

原创 SVN checckout 失敗:Error: REPORT request on '/svn/signature/!svn/me' failed 的解決辦法

SVN checckout 失敗:Error: REPORT request on ‘/svn/signature/!svn/me’ failed 的解決辦法 錯誤如下: 步驟: 1 解鎖 右擊checkout的文件->tortoise

原创 Pandas詳解二十六之Apply--對行、列用函數處理

約定: import pandas as pd Apply–對行、列用函數處理 俗話說,工欲善其事,必先利其器。在這裏形容apply函數再合適不過了,apply函數,可以說是pandas中自

原创 Pandas詳解二十之Merge、Join、Concat方式-詳解Pandas對象合併、連接

約定: import pandas as pd Merge-數據庫風格的合併 數據的合併(merge)和連接(join)是我們在數據分析和挖掘中不可或缺的,是通過一個或一個以上的鍵連接的。p

原创 Pandas詳解二十一之移除重複數據

約定 import pandas as pd 移除重複數據 DataFrame中經常會出現重複行,利用duplicated()函數返回每一行判斷是否重複的結果(重複則爲True),drop_duplicates([key1,key2,..

原创 Pandas詳解二十三之讀取CSV、Excel文件

約定: import pandas as pd 讀取CSV文件 csv文件以.csv後綴結尾,默認用’,’作爲分隔符,pandas提供了pd.read_csv()函數供我們讀取csv文件:

原创 Pandas詳解十九之軸向連接Pandas對象-Concat

約定: import pandas as pd 軸向連接-Concat 在數據處理中,通常將原始數據分開幾個部分進行處理而得到相似結構的Series或DataFrame對象,我們該如何進行縱

原创 Pandas詳解十六之groupby分組後分開運算

約定 import pandas as pd import numpy as np groupby分組後分開運算 Groupby對象支持迭代,當我們分組後想保存分組結果而不想運算,或者分別對每組進行不同的運算,這時是十分有用的。 1 創建

原创 Pandas詳解二十二之離散化(分組、區間化)

約定 import pandas as pd 離散化 通常對於我們不想要連續的數值,我們可將其離散化,離散化也可稱爲分組、區間化。 Pandas爲我們提供了方便的函數cut(): pd.cut(x, bins, right=True, l

原创 Pandas詳解二十四之寫入CSV、Excel文件

約定: import pandas as pd import numpy as np import sys 寫入CSV文件 寫入csv文件是最常用的,csv文件默認用’,’作爲分隔符。 df1.to_csv(path_or_buf=Non

原创 超Easy正則表達式實戰教程---入門 :匹配多種形式浮點數

超Easy正則表達式實戰教程—入門 :匹配多種形式浮點數 浮點數多種形式,包括如下: 3.6 , +3.14 , -3.14 , .7 正確匹配上述浮點數,正確姿勢如下: ~ [+-]?[0-9]+.[0-9]+|\.[0-9]+ ~

原创 Pandas詳解十八之DataFrame對象的-Join合併

約定: import pandas as pd 對象的實例方法-Join DataFrame對象有個df.join()方法也能進行pd.merge()的合併,它能更加方便地按照對象df的索引

原创 Pandas詳解十三之多級索引MultiIndex(層次化索引)

約定: import pandas as pd import numpy as np 多級索引 多級索引(也稱層次化索引)是pandas的重要功能,可以在Series、DataFrame對象

原创 Urllib3+BeautifulSoup+Thread:多線程爬蟲教程(爬取西刺代理IP)

導入模塊 from bs4 import BeautifulSoup import urllib3 import urllib import threading Urllib3+BeautifulSoup+Thread:多線程爬蟲教程(