導入csv數據
csv是一種常見的數據存儲格式,基本上我們遇到的數據都可以轉爲這種存儲格式。在Python數據分析中,可以通過pandas模塊導入csv數據
i= pd.read_csv("文件地址")
print(i.describe())
# 按照某一列進行排序
i.sort_values(by='列名')
i.head(10)
導入excel數據
i = pd.read_excel('文件名')
導入MySQL數據
import pymysql
conn = pymysql.connect(host='********',user='***',passwd='****',db='數據庫名')
i = pd.read_sql('查詢語句',conn)
i.head(10)
導入html數據
使用pandas,可以直接從html網頁中加載對應table表格中的數據,但是在使用read_html()之前,需要先安裝html5lib模塊和beautifulsoup4模塊
pd.read_html('網頁地址,可以是本地也可以是網頁上的') # 可以過濾其他,直接提取網頁上的數據
導入文本數據
pd.read_table('文件路徑')