pandas隨機抽樣

DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)

n是要抽取的行數。(例如n=20000時,抽取其中的2W行)

frac是抽取的比列。(有一些時候,我們並對具體抽取的行數不關係,我們想抽取其中的百分比,這個時候就可以選擇使用frac,例如frac=0.8,就是抽取其中80%)

replace:是否爲有放回抽樣,取replace=True時爲有放回抽樣。replace=False(默認就是False)是無放回的採樣,當採樣數n大於樣本數且沒有設置replace=True時,會出現異常

weights:指定樣本抽中的概率,默認等概論抽樣;

random_state:指定抽樣的隨機種子,可以使得每次抽樣的種子一樣,每次抽樣結果一樣

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章