Pandas中Series與Dataframe的初始化

原創

2021-04-27 12:59

（一）Series初始化

1.通過列表，index自動生成

se = pd.Series(['Tom', 'Nancy', 'Jack', 'Tony'])
print(se)

2.通過列表，指定index

se = pd.Series(['Tom', 'Nancy', 'Jack', 'Tony'], index=['idx_a', 'idx_b', 'idx_c', 'idx_d'])
print(se)

3.通過字典，字典的key爲Series的index

se = pd.Series({'a': 'Tom', 'b': 'Nancy', 'c': 'Jack', 'd': 'Tony'})
print(se)

4.通過迭代器，index自動生成

se = pd.Series(range(4))
print(se)

5.通過numpy.arange，index自動生成

se = pd.Series(np.arange(4))
print(se)

（二）Dataframe初始化

1.1 通過列表，columns及index自動生成

df = pd.DataFrame([['Tom', 16], ['Nancy', 18], ['Jack', 15]])
print(df)

1.2 通過列表，指定columns

df = pd.DataFrame([['Tom', 16], ['Nancy', 18], ['Jack', 15]], columns=['stu_name', 'stu_age'])
print(df)

1.3 通過列表，指定index

df = pd.DataFrame([['Tom', 16], ['Nancy', 18], ['Jack', 15]], index=['idx_a', 'idx_b', 'idx_c'])
print(df)

1.4 通過列表，指定columns跟index

df = pd.DataFrame([['Tom', 16], ['Nancy', 18], ['Jack', 15]], columns=['stu_name', 'stu_age'], index=['idx_a', 'idx_b', 'idx_c'])
print(df)

2.1 通過字典，字典key爲column，index自動生成

df = pd.DataFrame({'stu_name': ['Tom', 'Nancy', 'Jack', 'Tony'], 'stu_age': [16, 18, 15, 20]})
print(df)

2.2 通過字典，字典key爲column，並指定index

df = pd.DataFrame({'stu_name': ['Tom', 'Nancy', 'Jack', 'Tony'], 'stu_age': [16, 18, 15, 20]}, index=['a', 'b', 'c', 'd'])
print(df)

3. 通過值爲字典的列表，一個字典爲一行，列數目不相等自動補充NaN

df = pd.DataFrame([{'col1': 1, 'col2': 2}, {'col1': 5, 'col2': 10, 'col3': 20}, {'col1': 98, 'col2': 99}])
print(df)

4. 通過迭代器

df = pd.DataFrame({'col1': range(3), 'col2': range(3)})
print(df)

5. 通過numpy.arange

df = pd.DataFrame({'col1': np.arange(3), 'col2': np.arange(5, 8)})
print(df)

6. 讀取csv

df = pd.read_csv('test.csv')

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Pandas中Series與Dataframe的初始化

（一）Series初始化

1.通過列表，index自動生成

2.通過列表，指定index

3.通過字典，字典的key爲Series的index

4.通過迭代器，index自動生成

5.通過numpy.arange，index自動生成

（二）Dataframe初始化

1.1 通過列表，columns及index自動生成

1.2 通過列表，指定columns

1.3 通過列表，指定index

1.4 通過列表，指定columns跟index

2.1 通過字典，字典key爲column，index自動生成

2.2 通過字典，字典key爲column，並指定index

3. 通過值爲字典的列表，一個字典爲一行，列數目不相等自動補充NaN

4. 通過迭代器

5. 通過numpy.arange

6. 讀取csv

前端使用 Konva 實現可視化設計器（13）- 折線 - 最優路徑應用【思路篇】

Linux htop 命令詳解

SQL的事務

MySQL生成數字序列/日期序列

kafka的auto.offset.reset詳解與測試

Could not find artifact org.pentaho:pentaho-aggdesigner-algorithm:pom:5.1.5-jhyde ... 解決方式

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結