Pandas中Series與Dataframe的初始化

(一)Series初始化

1.通過列表,index自動生成

se = pd.Series(['Tom', 'Nancy', 'Jack', 'Tony'])
print(se)

2.通過列表,指定index

se = pd.Series(['Tom', 'Nancy', 'Jack', 'Tony'], index=['idx_a', 'idx_b', 'idx_c', 'idx_d'])
print(se)

3.通過字典,字典的key爲Series的index

se = pd.Series({'a': 'Tom', 'b': 'Nancy', 'c': 'Jack', 'd': 'Tony'})
print(se)

4.通過迭代器,index自動生成

se = pd.Series(range(4))
print(se)

5.通過numpy.arange,index自動生成

se = pd.Series(np.arange(4))
print(se)

 

(二)Dataframe初始化

1.1 通過列表,columns及index自動生成

df = pd.DataFrame([['Tom', 16], ['Nancy', 18], ['Jack', 15]])
print(df)

1.2 通過列表,指定columns

df = pd.DataFrame([['Tom', 16], ['Nancy', 18], ['Jack', 15]], columns=['stu_name', 'stu_age'])
print(df)

1.3 通過列表,指定index

df = pd.DataFrame([['Tom', 16], ['Nancy', 18], ['Jack', 15]], index=['idx_a', 'idx_b', 'idx_c'])
print(df)

1.4 通過列表,指定columns跟index

df = pd.DataFrame([['Tom', 16], ['Nancy', 18], ['Jack', 15]], columns=['stu_name', 'stu_age'], index=['idx_a', 'idx_b', 'idx_c'])
print(df)

2.1 通過字典,字典key爲column,index自動生成

df = pd.DataFrame({'stu_name': ['Tom', 'Nancy', 'Jack', 'Tony'], 'stu_age': [16, 18, 15, 20]})
print(df)

2.2 通過字典,字典key爲column,並指定index

df = pd.DataFrame({'stu_name': ['Tom', 'Nancy', 'Jack', 'Tony'], 'stu_age': [16, 18, 15, 20]}, index=['a', 'b', 'c', 'd'])
print(df)

3. 通過值爲字典的列表,一個字典爲一行,列數目不相等自動補充NaN

df = pd.DataFrame([{'col1': 1, 'col2': 2}, {'col1': 5, 'col2': 10, 'col3': 20}, {'col1': 98, 'col2': 99}])
print(df)

4. 通過迭代器

df = pd.DataFrame({'col1': range(3), 'col2': range(3)})
print(df)

5. 通過numpy.arange

df = pd.DataFrame({'col1': np.arange(3), 'col2': np.arange(5, 8)})
print(df)

 6. 讀取csv

df = pd.read_csv('test.csv')

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章