再談量化交易

賺錢是我要讀博之前答應我男朋友的,之前雖然也做過一些量化交易的程序和研究,但是感覺實際上還是停留在demo階段,要賺錢談何容易.在這篇文章中再總結一下馬上要開展的量化交易的設想;

三年又三年,現在太晚嗎?

2016年我就在用python寫一些簡單的股票策略了,大概就是爬取一些新浪股指的數據,然後用一個線性判別模型擬合來預測走向,做短線交易.現在三年過去了,這期間作爲不大,是不是現在才搞會太晚了呢?

但是通過近期的觀察發現,國內這幾年量化交易還是處於被收割的起步階段,原因我等會兒會分析,雖然機器學習大火,但是擬合模型似乎對股票趨勢一直都處於"不來電"的狀態,而量化交易api的領軍者 VN.PY (這個大佬我2016年就開始關注了)似乎也沒能在市場上叱吒風雲,倒是在VN.PY的程序編寫和量化交易培訓/接口發放上搞得有聲有色.

綜上,量化交易這兩年質量真正有進步的不是各種程序策略,而是數據的易獲取程度,由於優質帶python/JAVA API的數據源越來越多,還有類似tushare這樣的開源項目,相比2016年,現在的量化交易員只需要花更小的成本即可獲取比當時優質得多的數據(有爬蟲基礎的程序員可以自己爬取,但是會有時間延遲…)

需要哪些才能上路?

要自己寫代碼,第一主要解決的問題是數據來源問題,行情數據要準確和完整.現在我個人感覺Tushare和VN.PY的數據覆蓋都相當不錯,散戶一個月也只需要2000-4000即可獲取到優質的數據(有的人可能會覺得還是不太能接受,實際上這個價格不止包含了數據服務,還有…).

還有就是報單,你有了數據,但是要和市場交互,你要買,你要拋,你需要報單,報晚了,機會就稍縱即逝,因此一個好的保單API就異常重要,有的人爲了有效保單一次性掛50-500個賬戶的多如牛毛…

最後就是策略了,這是核心和需要精心打磨的武器,好的策略不會有人無償分享給你,頂多會給你一些demo或者教學級別的策略.策略是蘊含了數學、金融、市場背景等各個要素的動態判別器.

爲什麼:統計機器學習不Work

統計機器學習連text2img和img2text這麼惱火的事都能幹,爲啥也是多維統計決策的量化交易場景裏,人工智能方法全都罷工?先來看看實例:

我去一家量化交易公司實習，一次meeting中，我和老總還有一個資深大佬談機器學習在股票和期貨裏面的應用。我：LSTM在時間序列上應用的效果比較好，我們可以嘗試把LSTM應用在股票預測上。此時，大佬在陰笑，老總默不作聲…我：你爲啥笑大佬: 不work啊！我：爲什麼不work？！這時老總也在旁邊強掩笑容,大佬終於忍不住說了，有兩個原因，第一個是你如何保證你的因子有效？老總就補充到：對啊，你的模型很可能garbage in garbage out. 我說：那你們提供因子來訓練模型啊大佬陰笑…然後大佬又繼續說：第二個就是，你非常可能過擬合！我說：那我們可以加regularization啊。接着他們倆忽略我的話了，老總接着說：其實我們是想要一個模型能根據每天的數據進行反饋，自動更新。我一想，這TM的不就是reinforcement learning嘛，我說：可以用reinforcement learning試試。大佬又開始笑了，我很納悶。大佬說：我就是知道他們有些人在用reinforcement learning，我才能賺錢！！！
最後實習結束之後，在大佬的帶領下，我才明白了交易的三重境界

歸納

演繹

博弈
所謂的深度學習不過是基於歷史數據進行擬合的歸納法罷了，如果把深度學習用來做股票預測，長期的是expected虧錢的，因爲市場在變，規律在變，歷史可能重演，但是又不盡相同。深度學習肯定是可以用在股票市場的，比如針對某隻股票的新聞情感分析等。但是不能用來預測市場走向！！！想在市場上賺錢，就得博弈，你得知道其他人在幹什麼，因爲市場是有所有的參與者共同決定的。

再明顯的例子:

某現貨交易員朋友以前還跟我說過幾個奇葩手段。比如通過和船長搞好關係，可以讓他在卸貨時把油輪的傾斜角度加大，可以導出更多的油。不同國家對於油品的要求不一樣，但原油的現貨價格是一樣的，他們會利用這一點把好壞油摻雜，在不同國家之間做套利。還有兩個關於電的奇葩策略：一個是在覈電站周圍佈置紅外監測設備，可以檢測發電情況，從而對電價進行調整。另一個是人們發現在足球比賽中場時英國電力網的電力需求會突然加大，因爲中場休息時英國人會集體燒水泡茶。。。

因此,交易制勝的關鍵要點是歸因推理,而不是統計迴歸擬合！！！

這就是根本原因,現在明白了這點,就需要在量化策略算法的歸因邏輯推理上下功夫,應該會很難!

再談量化交易