理解pandas.get_dummies

  • get_dummies

    pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None,sparse=False, drop_first=False, dtype=None) -> 'DataFrame'

    Convert categorical variable into dummy/indicator variables.

    It’s a function which can turn a categprical variable into a series of zeros and ones, which makes them a lot easier to quantify and compare.

    不管是輸入的是Series還是DataFrameget_dummies()提取兩個關鍵概念,return 一個DataFrame。

    返回的DataFrame,columns是所有元素的枚舉,index是源數據的記錄條目數。如果源數據中爲NaN,則新增一條記錄,全0。

  • References

  1. pandas
  2. The Dummy’s Guide to Creating Dummy Variables
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章