兩行代碼爬取股票的全部信息

先看效果

下圖展示的是我用python爬取的英維克股票(編號是002837)的日k數據,是3年內的所有日k信息哦,而且最新的數據可以到最近一個交易日結束哦。

數據解釋:

date:日期
open:開盤價
high:最高價
close:收盤價
low:最低價
volume:成交量
price_change:價格變動
p_change:漲跌幅
ma5:5日均價
ma10:10日均價
ma20:20日均價
v_ma5:5日均量
v_ma10:10日均量
v_ma20:20日均量
turnover:換手率[注:指數無此項]

可能你會覺得,要實現這個,應該要很長的代碼來寫吧。其實不然,爬取這些信息,並且把信息整整齊齊地存到電腦裏,只需要兩行簡單的代碼就行了。你別不相信,用的就是下面兩行代碼。

dd=tushare.get_hist_data(‘002837’) #爬取股票近三年的全部日k信息
dd.to_excel('002837'+'.xlsx') #將信息導出到excel表格中

注意,在調用這兩行代碼時,要引入必要的包,如下。

import xlwt
import xlrd
import tushare

如果你的python還沒有安裝這些包,自己去百度一下怎麼用pip安裝這些包吧,很簡單很簡單的。

代碼講解

第一行代碼

dd=tushare.get_hist_data(‘002837’) #爬取股票近三年的全部日k信息

其實,這裏面起關鍵作用的是tushare包。Tushare是一個免費、開源的python財經數據接口包。主要實現對股票等金融數據從數據採集、清洗加工 到 數據存儲的過程,能夠爲金融分析人員提供快速、整潔、和多樣的便於分析的數據,爲他們在數據獲取方面極大地減輕工作量,使他們更加專注於策略和模型的研究與實現上。如果你想進一步瞭解,可以搜索下面網址。

http://tushare.org/index.html

這個網站會教你更多更方便的獲取股票數據和處理股票數據的方法。

第二行代碼

dd.to_excel(’002837'+'.xlsx') #將信息導出到excel表格中

這個代碼的目的,就是把爬取到的數據存入excel表格中,注意,爬取到的數據形式是dataframe,這個數據形式由列名(也就是第一行的表頭),索引(第一列的日期),數值(其他地方的數據)三部分組成的。這三部分不是在一起的,所以在導出到excel表格的時候,要想好導哪一部分,還是三部分一起導。這裏用的是默認選項,也就是三部分一起導。
to_excel的常用參數說明:

excel_writer: 文件路徑或者ExcelWriter對象
sheet_name:sheet名稱,默認爲Sheet1
sep : 文件內容分隔符,默認爲,逗號
na_rep: 在遇到NaN值時保存爲某字符,默認爲’‘空字符
float_format: float類型的格式
columns: 需要保存的列,默認爲None
header: 是否保存columns名,默認爲True
index: 是否保存index,默認爲True
encoding: 文件編碼格式
startrow: 在數據的頭部留出startrow行空行
startcol :在數據的左邊留出startcol列空列

最後,爲了感謝tushare,就爲它打一個廣告吧。
在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章