AI量化交易(二)——Tushare財經數據框架

AI量化交易(二)——Tushare財經數據框架

一、Tushare簡介

1、Tushare簡介

Tushare是一個免費、開源的python財經數據接口包,目前爲Tushare Pro版本,主要實現對股票等金融數據從數據採集、清洗加工到數據存儲的過程,能夠爲金融分析人員提供快速、整潔和多樣的便於分析的數據。Tushare返回的絕大部分的數據格式都是pandas DataFrame類型,非常便於用pandas、NumPy、Matplotlib進行數據分析和可視化。
AI量化交易(二)——Tushare財經數據框架

2、Tushare安裝

Github: https://github.com/waditu/Tushare

pip install tushare lxml
pip install beautifulsoup4

3、Token生成

Tushare使用需要註冊賬戶,並生成Token。
本人邀請註冊鏈接:https://tushare.pro/register?reg=306303
註冊成功,登錄Tushare,點擊個人信息設置:
AI量化交易(二)——Tushare財經數據框架
在接口Token頁找到個人的Token,Token是使用Tushare接口的惟一憑證,如果發現泄露,可以刷新生成新的Token。

import tushare as ts

if __name__ == '__main__':
    print(ts.__version__)
    # 設置Token
    ts.set_token('xxx0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()

# output:
# 1.2.45

4、Tushare API簡介

Tushare的數據接口分爲滬深股票、指數、基金、期貨、期權、債券、外匯、港股、行業經濟、宏觀經濟、特色大數據共計十一大類,滬深其中股票分爲基礎數據、行情數據、財務數據、市場參考數據四類接口。Tushare也提供了區塊鏈相關的基礎數據、行情數據、資訊公告三類接口,以及新浪財經、東方財富、同花順、雲財經、華爾街見聞等財經網站的宏觀經濟、外匯、A股、區塊鏈、美股、石油、黃金、黃金外匯、港股、商品、債券、公司、市場、焦點、央行等財經資訊類消息。
Tushare API接口需要根據註冊賬戶的積分數量獲取相應的訪問權限,積分等級不夠可能導致API接口無權限訪問,區塊鏈相關接口需要捐款獲取相應權限。
Tushare API接口使用參考:https://tushare.pro/document/2

二、Tushare股票數據接口

1、股票列表

import tushare as ts

if __name__ == '__main__':
    # 設置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.stock_basic(exchange='', list_status='L', fields='ts_code,symbol,name,area,industry,list_date')
    # data = ts_api.query('stock_basic', exchange='', list_status='L',
    #                     fields='ts_code,symbol,name,area,industry,list_date')
    print(data)

獲取股票基礎信息數據,包括股票代碼、名稱、上市日期,行業、概念等。

2、IPO新股上市

import tushare as ts

if __name__ == '__main__':
    # 設置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.new_share(start_date='20190101', end_date='20190901')
    print(data)

獲取新股上市列表數據

3、日線行情

import tushare as ts

if __name__ == '__main__':
    # 設置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.daily(ts_code='000001.SZ', start_date='20190101', end_date='20190901')
    print(data)

交易日每天15點~16點之間。本接口是未復權行情,停牌期間不提供數據。

4、周線行情

import tushare as ts

if __name__ == '__main__':
    # 設置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.weekly(ts_code='000001.SZ', start_date='20180101', end_date='20181101',
                         fields='ts_code,trade_date,open,high,low,close,vol,amount')
    print(data)

獲取A股周線行情

5、月線行情

import tushare as ts

if __name__ == '__main__':
    # 設置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.monthly(ts_code='000001.SZ', start_date='20180101', end_date='20181101',
                          fields='ts_code,trade_date,open,high,low,close,vol,amount')
    print(data)

獲取A股月線數據。

6、通用行情接口

pro_bar接口整合了股票(未復權、前復權、後復權)、指數、數字貨幣、ETF基金、期貨、期權的行情數據,未來會包括外匯在內的所有交易行情數據,同時提供分鐘數據。

import tushare as ts

if __name__ == '__main__':
    # 設置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts.pro_bar(api=ts_api, ts_code='000009.SZ', adj='qfq', start_date='20170101', end_date='20181011', ma=[5],
                      freq='D')
    print(data)

獲取A股的K線數據,帶有復權參數“adj”、均線參數“ma”、數據頻度參數“freq”。

7、獲取股票的全部數據

import tushare
import os
import datetime
import timedelta

def fetch_kline_data(code):
    filename = 'your path'
    if not os.path.exists(filename):
        end_date = datetime.strftime(datetime.now(), '%Y%m%d')#獲取當前時間
        outputflag = True
        api = tushare.pro_api()
        while outputflag:#循環判斷,直到返還的數據爲空
           data = tushare.pro_bar(pro_api=api,ts_code=code,
                                end_date=end_date,asset='E', adj=None, freq='D')
           if data.empty == True:
               outputflag = False
           else:
                #計算下次請求數據的截止日期
                next_end_date = datetime.strptime(data.iloc[-1]['trade_date'],
                                              '%Y%m%d') - timedelta(hours=24)
                end_date = datetime.strftime(next_end_date, '%Y%m%d')
                #寫csv文件
                if os.path.exists(filename):
                    data.to_csv(filename, header=None, mode='a')#追加寫入模式
                else:
                    data.to_csv(filename, header=None, mode='a')

三、Tushare上市公司財務數據接口

1、利潤表

import tushare as ts

if __name__ == '__main__':
    # 設置Token
    ts.set_token('xxxx0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.income(ts_code='600001.SH', start_date='20190101', end_date='20190901')
    print(data)

獲取上市公司財務利潤表數據

2、資產負債表

import tushare as ts

if __name__ == '__main__':
    # 設置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.balancesheet(ts_code='600000.SH', start_date='20190101', end_date='20190901',
                               fields='ts_code,ann_date,f_ann_date,end_date,report_type,comp_type,cap_rese')
    print(data)

獲取上市公司資產負債表。

3、現金流量表

import tushare as ts

if __name__ == '__main__':
    # 設置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.cashflow(ts_code='600000.SH', start_date='20190101', end_date='20190901')
    print(data)

獲取上市公司現金流量表。

4、業務預告

import tushare as ts

if __name__ == '__main__':
    # 設置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.forecast(ann_date='20190131',
                           fields='ts_code,ann_date,end_date,type,p_change_min,p_change_max,net_profit_min')
    print(data)

獲取業績預告數據。

5、分紅送股數據

import tushare as ts

if __name__ == '__main__':
    # 設置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.dividend(ts_code='600848.SH', fields='ts_code,div_proc,stk_div,record_date,ex_date')
    print(data)

分紅送股數據。

6、業績快報

import tushare as ts

if __name__ == '__main__':
    # 設置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.express(ts_code='600000.SH', start_date='20180101', end_date='20180701',
                          fields='ts_code,ann_date,end_date,revenue,operate_profit,total_profit,n_income,total_assets')
    print(data)

獲取上市公司業績快報。

7、財務指標數據

import tushare as ts

if __name__ == '__main__':
    # 設置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.fina_indicator(ts_code='600000.SH')

    print(data)

獲取上市公司財務指標數據,爲避免服務器壓力,現階段每次請求最多返回60條記錄,可通過設置日期多次請求獲取更多數據。

8、財務審計意見

import tushare as ts

if __name__ == '__main__':
    # 設置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.fina_audit(ts_code='600000.SH', start_date='20100101', end_date='20180808')
    print(data)

獲取上市公司定期財務審計意見數據

9、主營業務構成

import tushare as ts

if __name__ == '__main__':
    # 設置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.fina_mainbz(ts_code='000627.SZ', type='P')
    print(data)

獲取某隻股票的主營業務構成
df = ts_api.fina_mainbz_vip(period='20181231', type='P', fields='ts_code,end_date,bz_item,bz_sales')
獲取某一季度全部股票的主營業務構成

10、上市公司完整財務指標獲取

import tushare
import datetime
import os
import timedelta

def fetch_finance_indicator(code):
    filename = 'your path'
    if not os.path.exists(filename):
        end_date = datetime.strftime(datetime.now(), '%Y%m%d')
        outputflag = True
        api = tushare.pro_api()
        while outputflag:
            data = api.fina_indicator(ts_code=code, end_date=end_date)
            if data.empty == True:
                outputflag = False
            else:
                next_end_date = datetime.strptime(
                    data.iloc[-1]['end_date'], '%Y%m%d') - timedelta(hours=24)
                end_date = datetime.strftime(next_end_date, '%Y%m%d')
                if os.path.exists(filename):
                    data.to_csv(filename, header=None, mode='a')
                else:
                    data.to_csv(filename)

四、Tushare指數接口

1、指數基本信息

import tushare as ts

if __name__ == '__main__':
    # 設置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.index_basic(market='CSI')
    print(data)

獲取指數基礎信息。
MSCI:MSCI指數
CSI:中證指數
SSE:上交所指數
SZSE:深交所指數
CICC:中金所指數
SW:申萬指數

2、指數日線行情

import tushare as ts

if __name__ == '__main__':
    # 設置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.index_daily(ts_code='399300.SZ', start_date='20190101', end_date='20190910')
    print(data)

獲取指數每日行情,還可以通過bar接口獲取。由於服務器壓力,目前規則是單次調取最多取8000行記錄,可以設置start和end日期補全。指數行情也可以通過通用行情接口獲取數據。

3、指數週線行情

import tushare as ts

if __name__ == '__main__':
    # 設置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.index_weekly(ts_code='000001.SH', start_date='20180101', end_date='20190329',
                               fields='ts_code,trade_date,open,high,low,close,vol,amount')
    print(data)

獲取指數週線行情,單次最大1000行記錄,可分批獲取,總量不限制。

4、指數月線行情

import tushare as ts

if __name__ == '__main__':
    # 設置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.index_monthly(ts_code='000001.SH', start_date='20180101', end_date='20190930',
                                fields='ts_code,trade_date,open,high,low,close,vol,amount')
    print(data)

獲取指數月線行情,每月更新一次,單次最大1000行記錄,可多次獲取,總量不限制。用戶需要至少600積分纔可以調取,積分越多頻次越高。

5、指數成分和權重

import tushare as ts

if __name__ == '__main__':
    # 設置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.index_weight(index_code='399300.SZ', start_date='20180901', end_date='20190930')
    print(data)

獲取各類指數成分和權重,月度數據 ,如需日度指數成分和權重,用戶需要至少400積分纔可以調取。

五、Tushare市場參考數據接口

1、港股通10大成交股

import tushare as ts

if __name__ == '__main__':
    # 設置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.ggt_top10(trade_date='20190925')
    print(data)

獲取港股通每日成交數據,其中包括滬市、深市詳細數據。

2、融資融券交易彙總

import tushare as ts

if __name__ == '__main__':
    # 設置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.margin(trade_date='20190925')
    print(data)

獲取融資融券每日交易彙總數據。

3、融資融券交易明細

import tushare as ts

if __name__ == '__main__':
    # 設置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.margin_detail(trade_date='20190925')
    print(data)

獲取滬深兩市每日融資融券明細。

4、前十大股東

import tushare as ts

if __name__ == '__main__':
    # 設置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.top10_holders(ts_code='600000.SH', start_date='20190101', end_date='20191231')
    print(data)

獲取上市公司前十大股東數據,包括持有數量和比例等信息。

5、前十大流通股東

import tushare as ts

if __name__ == '__main__':
    # 設置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.top10_floatholders(ts_code='600000.SH', start_date='20190101', end_date='20191231')
    print(data)

獲取上市公司前十大流通股東數據。

6、龍虎榜每日明細

import tushare as ts

if __name__ == '__main__':
    # 設置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.top_list(trade_date='20190925')
    print(data)

龍虎榜每日交易明細,單次最大10000,用戶需要至少300積分纔可以調取。

7、龍虎榜機構交易明細

import tushare as ts

if __name__ == '__main__':
    # 設置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.top_inst(trade_date='20190925')
    print(data)

龍虎榜機構成交明細,單次最大10000,用戶需要至少300積分纔可以調取。

8、大宗交易

import tushare as ts

if __name__ == '__main__':
    # 設置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.block_trade(trade_date='20190925')
    print(data)

大宗交易,單次最大1000條,總量不限制,300積分可調取,每分鐘內限制次數,超過5000積分無限制。

9、股票開戶數據

import tushare as ts

if __name__ == '__main__':
    # 設置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.stk_account(start_date='20190101', end_date='20191231')
    print(data)

獲取股票賬戶開戶數據,統計週期爲一週,600積分可調取。

10、股東人數

import tushare as ts

if __name__ == '__main__':
    # 設置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.stk_holdernumber(ts_code='300209.SZ', start_date='20190101', end_date='20191231')
    print(data)

獲取上市公司股東戶數數據,數據不定期公佈。單次最大3000,總量不限制,600積分可調取,基礎積分每分鐘調取100次,5000積分以上無限制。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章