数据挖掘工具pandas（四）DataFrame的属性

原創

2020-05-23 08:01

一，DataFrame的基本属性：

shape、dtypes、ndim、index、columns、values、T

import pandas as pd
import numpy as np
# from sqlalchemy import create_engine
# engine = create_engine('mysql+pymysql://root:root@localhost:3306/yoyo')
# sql = """select * from role_info;"""
# df = pd.read_sql(sql,engine)
day_data = np.random.normal(0,1,(500,507))
stock_list = ["股票"+ str(i) for i in range(day_data.shape[0])]
date = ["第"+ str(i)+"天" for i in range(day_data.shape[1])]

df = pd.DataFrame(day_data,index=stock_list,columns=date)

# 1,pandas-dataframe的type
# print(type(df))

# 2,shape dataframe的形状（行数、列数）
# print(df.shape)

# 3,dtypes 每一列的数据类型
# print(df.dtypes)

# 4,ndim 数据维度
# print(df.ndim)

# 5,index 行索引
# print(df.index,df.index[0])

# 6,columns 列索引
# print(df.columns,df.columns[0])

# 7,values 对象值，二维ndarray数组
# print(df.values)

# 8, T , transpose() 两种转置
# print(df.T)
print(df.transpose())

二，DataFrame的整体情况：

head()，tail()，info()，describe()
import pandas as pd
import numpy as np
# from sqlalchemy import create_engine
# engine = create_engine('mysql+pymysql://root:root@localhost:3306/yoyo')
# sql = """select * from role_info;"""
# df = pd.read_sql(sql,engine)
day_data = np.random.normal(0,1,(500,507))
stock_list = ["股票"+ str(i) for i in range(day_data.shape[0])]
date = ["第"+ str(i)+"天" for i in range(day_data.shape[1])]
df = pd.DataFrame(day_data,index=stock_list,columns=date)

# 1,head(nums) 显示头部几行，默认5行
# print(df.head(3))

# 2,tail(nums) 显示末尾几行，默认5行
# print(df.tail(3))

# 3,info() 相关信息概览：行数，列数，列索引，列非空值个数、列类型、内存占用
# print(df.info())

# 4,describe() 快速综合统计带有数值的结果。计数、均值、标准差、最大值、四分位数、最小值
print(df.describe())

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

数据挖掘工具pandas（四）DataFrame的属性

一，DataFrame的基本属性：

二，DataFrame的整体情况：

如何使用軟碟通製作啓動U盤

django配置多進程按日期分割處理日誌

Package ‘zipp’ requires a different Python：3.5.2 not in ‘ 大於等於3.6’

Ubuntu apt-get和pip源更換以及apt update和upgrade 的區別

關於GIT，你只需要看這篇文章。

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結