Series和DataFrame可以按照索引進行排序,也可以按照值來排序,對值也可以進行排名。
一,按照索引排序(sort by index)
對於一個Series或DataFrame,可以按照索引進行排序,使用sort_index()函數來實現索引的排序:
DataFrame.sort_index(axis=0, level=None, ascending=True, inplace=False, kind='quicksort', na_position='last', sort_remaining=True, ignore_index=False, key=None)
參數axis用於指定用於排序的軸,默認值是0(行),也可以設置爲1(列)。
舉個例子,有如下的序列:
obj = Series([1,2,3,4],index=['d','a','b','c']) print(obj.sort_index())
對於一個DataFrame,列索引和行索引都是索引,既可以按照行索引排序,也可以按照列索引排序。
二,按照值排序 ( sort by values)
DataFrame 和Series也可以使用sort_values()函數對數據值進行排序:
DataFrame.sort_values(by, axis=0, ascending=True, inplace=False, kind='quicksort', na_position='last', ignore_index=False, key=None)
參數axis用於指定用於排序的軸,默認值是0(行),也可以設置爲1(列)。如果axis=0,那麼參數by用於指定某一個行索引的名稱;如果axis=1,那麼參數by用於指定某一個列名。
obj = Series([1,4,3,2],index=['d','a','b','c']) print(obj.sort_values())
三,排名(rank)
排名是指爲數據進行一個排名,排名的順序從1開始,依次加1遞增。
DataFrame.rank(axis=0, method='average', numeric_only=NoDefault.no_default, na_option='keep', ascending=True, pct=False)
舉個例子,按照Number_legs對數據進行排序:
df = pd.DataFrame(data={'Animal': ['cat', 'penguin', 'dog', 'spider', 'snake'], 'Number_legs': [4, 2, 4, 8, np.nan]}) df['default_rank'] = df['Number_legs'].rank(method='dense')
參考文檔: