原创 第六章二叉樹和樹(樹)

6.1抽象數據類型 #抽象數據類型 ''' ADT Tree: #一個樹抽象數據類型 Tree(self,data,forest) #構造操作,基於樹根數據和一組子樹 is_

原创 原始因子數據分析與處理

1、原始因子數據 統計空值情況 def detecte_null_value(self,factor_data=None): ''' 統計空值情況 參數

原创 華泰單因子測試之估值類因子(因子數據獲取分析處理)

                                               華泰單因子測試之估值類因子 pe(price-to-earning ratio) 市盈率,PE = 流通市值/最近4個季度的淨利潤;最近 4 個

原创 python輸入輸出(input_output)

輸出 python兩種輸出方式:表達式語句和print() 第三種方式就是使用文件對象的write() str.formot() 格式化輸出 repr() 輸出值轉成字符串

原创 原始因子處理之手寫標準化函數

一、標準化 代碼實現(z_score方法標準化) def standardlize(data, inf2nan=True, axis=1): ''' 參數 ----------- data: pd.Se

原创 因子數據處理前後比較

一、空值  1、 處理前。(存在空值)   2、處理後。(不存在空值)  二、因子值得整體特徵 1、處理前 2、處理後 三、因子值的分佈情況  1、處理前 2、處理後 3、概括  處理前後因子數值差別很大 四、散點圖 1、處理前

原创 中證300、500、800成分股調整時間

    ''' 函數get_rng(start_year=None,end_year=None)得到的是每次指數成分股改變時的開始日期 在函數get_interval(start_year,end_year)中得到一個完整的週期 ''

原创 申萬一級行業變化

 1、比較 ''' 申萬指數在2014-02-21有一次大改,刪除了6個一級行業,並增加了11個一級行業。故: date < 2014-02-21 申萬一級行業有23個 date = 2014-02-21 申萬一級行業有34個

原创 華泰單因子測試之波動率類因子

一、因子選擇 ''' 中證500波動率類類因子std_1m 近1個月內日收益率序列的標準差 '''        二、 因子收益 #繪製各分位數各週期的平均收益(收益數值不是重點,主要用於觀察是否具有單調性) wgt_return

原创 華泰單因子測試之成長類因子

一、因子選擇 二、因子收益 收益相關的同比增長率,我覺得這類因子的滯後期太長了,使用基本面因子做因子挖掘不太合適。但是,財報一發出來,做事件驅動我覺得這是可以的。還有就是使用基本面因子+政策面消息做行業輪動是可以的,再用量價類因

原创 華泰單因子之動量類因子

一、因子選擇     二、 因子收益 1)繪製各分位數各週期的平均收益(收益數值不是重點,主要用於觀察是否具有單調性) wgt_return_factor.plot_quantile_returns_bar(by_group=Fals

原创 華泰單因子測試之估值類因子(迴歸法)

                                                                IC值 1、計算每日因子IC值 ic_date = pe_factor.calc_factor_inform

原创 原始因子處理之手寫去極值函數

一、去極值 百分位去極值:直接以上下百分位爲邊界,將邊界外數據歸爲邊界上數據,目前行業內一般不使用。 標準化去極值:又稱爲標準差法。標準差本身可以體現因子的離散程度,是基於因子的平均值 Xmean而定的。在離羣值處理過程中,可通過用 Xm

原创 第七章圖(概念和實現)

7.1概念和實現 ''' 圖抽象數據類型 ''' ''' ADT Graph: #一個圖抽象數據類型 Graph(self) #圖構造操作,創建一個新圖 is_

原创 華泰單因子測試之估值類因子(分層回測)

                                                               分層回測 ''' class FactorAnalyzer(object): def __init_