Python數據分析——數據導入

導入csv數據

csv是一種常見的數據存儲格式,基本上我們遇到的數據都可以轉爲這種存儲格式。在Python數據分析中,可以通過pandas模塊導入csv數據

i= pd.read_csv("文件地址")
print(i.describe())
# 按照某一列進行排序
i.sort_values(by='列名')
i.head(10)

導入excel數據

i = pd.read_excel('文件名')

導入MySQL數據

import pymysql
conn = pymysql.connect(host='********',user='***',passwd='****',db='數據庫名')
i = pd.read_sql('查詢語句',conn)
i.head(10)

導入html數據

使用pandas,可以直接從html網頁中加載對應table表格中的數據,但是在使用read_html()之前,需要先安裝html5lib模塊和beautifulsoup4模塊

pd.read_html('網頁地址,可以是本地也可以是網頁上的')  # 可以過濾其他,直接提取網頁上的數據

導入文本數據

pd.read_table('文件路徑')

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章