pandas 排序和排名

Series和DataFrame可以按照索引進行排序,也可以按照值來排序,對值也可以進行排名。

一,按照索引排序(sort by index)

對於一個Series或DataFrame,可以按照索引進行排序,使用sort_index()函數來實現索引的排序:

DataFrame.sort_index(axis=0, level=None, ascending=True, inplace=False, kind='quicksort', na_position='last', sort_remaining=True, ignore_index=False, key=None)

參數axis用於指定用於排序的軸,默認值是0(行),也可以設置爲1(列)。

舉個例子,有如下的序列:

obj = Series([1,2,3,4],index=['d','a','b','c'])
print(obj.sort_index())

 

對於一個DataFrame,列索引和行索引都是索引,既可以按照行索引排序,也可以按照列索引排序。

二,按照值排序 ( sort by values)

DataFrame 和Series也可以使用sort_values()函數對數據值進行排序:

DataFrame.sort_values(by, axis=0, ascending=True, inplace=False, kind='quicksort', na_position='last', ignore_index=False, key=None)

參數axis用於指定用於排序的軸,默認值是0(行),也可以設置爲1(列)。如果axis=0,那麼參數by用於指定某一個行索引的名稱;如果axis=1,那麼參數by用於指定某一個列名。

obj = Series([1,4,3,2],index=['d','a','b','c'])
print(obj.sort_values())

三,排名(rank)

排名是指爲數據進行一個排名,排名的順序從1開始,依次加1遞增。

DataFrame.rank(axis=0, method='average', numeric_only=NoDefault.no_default, na_option='keep', ascending=True, pct=False)

舉個例子,按照Number_legs對數據進行排序:

df = pd.DataFrame(data={'Animal': ['cat', 'penguin', 'dog',
                                   'spider', 'snake'],
                        'Number_legs': [4, 2, 4, 8, np.nan]})

df['default_rank'] = df['Number_legs'].rank(method='dense')

 

 

參考文檔:

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章