數據挖掘工具pandas（四）DataFrame的屬性

原創

2020-05-23 08:01

一，DataFrame的基本屬性：

shape、dtypes、ndim、index、columns、values、T

import pandas as pd
import numpy as np
# from sqlalchemy import create_engine
# engine = create_engine('mysql+pymysql://root:root@localhost:3306/yoyo')
# sql = """select * from role_info;"""
# df = pd.read_sql(sql,engine)
day_data = np.random.normal(0,1,(500,507))
stock_list = ["股票"+ str(i) for i in range(day_data.shape[0])]
date = ["第"+ str(i)+"天" for i in range(day_data.shape[1])]

df = pd.DataFrame(day_data,index=stock_list,columns=date)

# 1,pandas-dataframe的type
# print(type(df))

# 2,shape dataframe的形狀（行數、列數）
# print(df.shape)

# 3,dtypes 每一列的數據類型
# print(df.dtypes)

# 4,ndim 數據維度
# print(df.ndim)

# 5,index 行索引
# print(df.index,df.index[0])

# 6,columns 列索引
# print(df.columns,df.columns[0])

# 7,values 對象值，二維ndarray數組
# print(df.values)

# 8, T , transpose() 兩種轉置
# print(df.T)
print(df.transpose())

二，DataFrame的整體情況：

head()，tail()，info()，describe()
import pandas as pd
import numpy as np
# from sqlalchemy import create_engine
# engine = create_engine('mysql+pymysql://root:root@localhost:3306/yoyo')
# sql = """select * from role_info;"""
# df = pd.read_sql(sql,engine)
day_data = np.random.normal(0,1,(500,507))
stock_list = ["股票"+ str(i) for i in range(day_data.shape[0])]
date = ["第"+ str(i)+"天" for i in range(day_data.shape[1])]
df = pd.DataFrame(day_data,index=stock_list,columns=date)

# 1,head(nums) 顯示頭部幾行，默認5行
# print(df.head(3))

# 2,tail(nums) 顯示末尾幾行，默認5行
# print(df.tail(3))

# 3,info() 相關信息概覽：行數，列數，列索引，列非空值個數、列類型、內存佔用
# print(df.info())

# 4,describe() 快速綜合統計帶有數值的結果。計數、均值、標準差、最大值、四分位數、最小值
print(df.describe())

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

數據挖掘工具pandas（四）DataFrame的屬性

一，DataFrame的基本屬性：

二，DataFrame的整體情況：

如何使用軟碟通製作啓動U盤

django配置多進程按日期分割處理日誌

Package ‘zipp’ requires a different Python：3.5.2 not in ‘ 大於等於3.6’

Ubuntu apt-get和pip源更換以及apt update和upgrade 的區別

關於GIT，你只需要看這篇文章。

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結