原创 第六章二叉樹和樹(樹)
6.1抽象數據類型 #抽象數據類型 ''' ADT Tree: #一個樹抽象數據類型 Tree(self,data,forest) #構造操作,基於樹根數據和一組子樹 is_
原创 原始因子數據分析與處理
1、原始因子數據 統計空值情況 def detecte_null_value(self,factor_data=None): ''' 統計空值情況 參數
原创 華泰單因子測試之估值類因子(因子數據獲取分析處理)
華泰單因子測試之估值類因子 pe(price-to-earning ratio) 市盈率,PE = 流通市值/最近4個季度的淨利潤;最近 4 個
原创 python輸入輸出(input_output)
輸出 python兩種輸出方式:表達式語句和print() 第三種方式就是使用文件對象的write() str.formot() 格式化輸出 repr() 輸出值轉成字符串
原创 原始因子處理之手寫標準化函數
一、標準化 代碼實現(z_score方法標準化) def standardlize(data, inf2nan=True, axis=1): ''' 參數 ----------- data: pd.Se
原创 因子數據處理前後比較
一、空值 1、 處理前。(存在空值) 2、處理後。(不存在空值) 二、因子值得整體特徵 1、處理前 2、處理後 三、因子值的分佈情況 1、處理前 2、處理後 3、概括 處理前後因子數值差別很大 四、散點圖 1、處理前
原创 中證300、500、800成分股調整時間
''' 函數get_rng(start_year=None,end_year=None)得到的是每次指數成分股改變時的開始日期 在函數get_interval(start_year,end_year)中得到一個完整的週期 ''
原创 申萬一級行業變化
1、比較 ''' 申萬指數在2014-02-21有一次大改,刪除了6個一級行業,並增加了11個一級行業。故: date < 2014-02-21 申萬一級行業有23個 date = 2014-02-21 申萬一級行業有34個
原创 華泰單因子測試之波動率類因子
一、因子選擇 ''' 中證500波動率類類因子std_1m 近1個月內日收益率序列的標準差 ''' 二、 因子收益 #繪製各分位數各週期的平均收益(收益數值不是重點,主要用於觀察是否具有單調性) wgt_return
原创 華泰單因子測試之成長類因子
一、因子選擇 二、因子收益 收益相關的同比增長率,我覺得這類因子的滯後期太長了,使用基本面因子做因子挖掘不太合適。但是,財報一發出來,做事件驅動我覺得這是可以的。還有就是使用基本面因子+政策面消息做行業輪動是可以的,再用量價類因
原创 華泰單因子之動量類因子
一、因子選擇 二、 因子收益 1)繪製各分位數各週期的平均收益(收益數值不是重點,主要用於觀察是否具有單調性) wgt_return_factor.plot_quantile_returns_bar(by_group=Fals
原创 華泰單因子測試之估值類因子(迴歸法)
IC值 1、計算每日因子IC值 ic_date = pe_factor.calc_factor_inform
原创 原始因子處理之手寫去極值函數
一、去極值 百分位去極值:直接以上下百分位爲邊界,將邊界外數據歸爲邊界上數據,目前行業內一般不使用。 標準化去極值:又稱爲標準差法。標準差本身可以體現因子的離散程度,是基於因子的平均值 Xmean而定的。在離羣值處理過程中,可通過用 Xm
原创 第七章圖(概念和實現)
7.1概念和實現 ''' 圖抽象數據類型 ''' ''' ADT Graph: #一個圖抽象數據類型 Graph(self) #圖構造操作,創建一個新圖 is_
原创 華泰單因子測試之估值類因子(分層回測)
分層回測 ''' class FactorAnalyzer(object): def __init_