未來可以預測嗎?

重新回來,回到現在

剛剛登錄後,系統提示綁定手機號,欣然綁定。一切都是那麼穩定,註冊名,郵箱,手機號,翻看歷史記錄,感謝博客園!

回來看我的ID,也頗具禪意,子標題是“未來決定現在”,感覺好極了。

 

(其實寫這篇的想法,是我正在做的系統,主要是數據的預測,有一些想法,但是還很模糊,一定要找個地方說說,就翻到了這裏。加上上面的一些感慨,表明時間對了!)

 

預測未來也是人們常常提起的話題,包括影視劇文藝作品,以前還只有進入未來,如科幻。現在時間軸都已經佈滿了,比如穿越,是回到過去。不但時間,還有空間,時空穿越。

天氣預報也越來越準了,昨天的雨,雖然仍然有偏差,但是已經超出我的期望值,我也相信未來預測會更加準確。

 

複雜系統和簡單系統

跟人類社會以及相關係統相比,天氣系統是一個相對單一的系統,可以說如果把影響天氣的關鍵數據找到後,就可以準確預測天氣的下一個運行狀態。

當然,可能存在一種人工影響天氣的行爲,把本來正常的天氣系統,比如在某時間,某個地點進行人工干預,讓雨提前下來。

但是,在天氣系統中,這個干預是少數的,甚至說也是可以預測的。

 

預測的結果值是一個巨大的數據集

至於說是1小時預測,24小時預測,還是7天預測,不同的時延準確率不同。還有覆蓋空間的準確性,海淀是不是準確,昌平是不是準確,大興是不是準確,不同空間的準確率都可能不同。所以說,到最後發現預測的結果是是一個龐大的數據集,不同需求的用戶需要根據自己的期望來找到數據。

這就跟以往電臺中的天氣預報進步太多了。

以前天氣預報只是說明天北京有雨,我們根本不知道什麼時間有雨,我所處的區域是否會下雨,所以就會產生“天氣預報不準”這種結論

現在的技術手段,手機等智能終端的普及,數據提供商,app開發商的不斷創新,使手機app上就可以查到更多的預測數據,比如分區,分時的預報,不同區域的使用者針對自己的需求獲取預測數據,準確率提高了很多。

其實目前這種不準論也還存在,除了預測系統的原因,(我覺)用別人的預測數據驗證自己區域的情況。

 

預測和干預

假設預測數據非常準確,像天氣系統這種,人們只要做好防範工作,避免天氣原因帶來的災難就行。對於天氣,人類社會的行爲是一致的,利用天氣系統進行戰爭,犯罪的行爲是少數,利用天氣預報進行獲利雖然有,比如下雨天買傘?不去評說了

但是很多其他的數據預測就不一樣了,比如股市,如果預測某支股票要大漲,那麼股民爲了獲得後續上漲的收益,可能買入股票,同時,已經獲利者可以趁機賣出已有股票,如果賣出量更大,則可能導致股票反而下跌

由於股市是一個複雜的系統,所謂的複雜就是參與其中的交易者可以影響到數據的成交和走勢,這一點同天氣系統是完全不一樣的

還有同股市系統類似的交通系統,我們每天出門時看路況,地圖系統往往會預測一下到達我的目的地的路途是不是有擁堵,我們發現有時預測時不堵,但是實際行駛過程中就會變得擁堵。

交通系統也是一樣,預測不堵的信息被更多的參與者接收到後,都選擇了這條路,那這條路就擁堵了。

還有很多這樣的社會現象,也是一個複雜系統,比如農民種植農產品,工廠生產產品,都會有一定的預測(預測需求、產量、收益),但是實際結果是產品因過剩而導致收益下降。

這些已經接近博弈理論需要解決的問題了,我這裏就不展開了。

 

到底要不要預測

既然像股市系統、交通系統這種複雜系統干預問題,我們到底要不要預測,如何利用預測數據?

還有應對干預(博弈)的預測系統嗎?

答案當然是肯定的!

要預測,即使原始數據的獲取聚合和清理工作非常大,預測數據的準確度目前可能不是很高,對應目標的收益率也不高,但是仍然不能阻擋我們對預測未來的努力。

要論證這個主題其實可以寫一大堆。(可是我不寫了)

從圖像識別技術(圖像識別也是預測嗎?)的歷史我們就行,從最初的60~70%的正確率,到現在識別率接近完美,甚至帶上口罩都可以識別,人臉識別已經非常實用普及,收益已經顯現。

 

那如何預測呢?

地球人都可以猜到,當然是機器學習了,不能用之前的技術了。

之所以用了“機器學習”這個術語,而不是用人工智能AI,因爲AI範疇比較大了,不夠具體。我想說的只是一個技術,不是一個虛無的方案和誇誇其談。

其實在很多機器學習的課程中,都會有房價、股票預測和其他很多預測,但是我目前看到代碼和課程中的預測準確率不高(我知道它爲什麼不高,公開的課程不便把關鍵數據的方法拿出來)

在量化交易中,很多團隊也在使用機器學習構建投資策略,成績非常不錯。

 

具體如何做呢?

以股票數據預測爲例:

嘗試階段:

建立一套機器學習的開發環境(tensorflow,pythorch都可以,我選擇tensorflow 2.x)

獲取股票,建立訓練測試數據。基本的每日k線就行。我通過已有數據的訓練驗證可以達到100%準確率,這可以說明一些情況。

( 以往股票分析出的股票規律和各種模型、線是有道理的,但是仍然對突然的變化無法預測)

通過不同的模型,數據元素選擇,獲得不同的正確率,目前我的可以達到60~80%,至於爲何差距這麼大,這主要跟訓練數據集的選擇有關係。但是這至少有60%以上的勝率了(有點像賭徒?)

每天收盤數據獲得後預測第二天的預測數據,但是這時已經不能買賣,買不進來賣不出去。只是在第二天開盤到收盤判斷預測的準確性,慢慢建立信心。

問題:

如果預測不準說明什麼?

市場隨機遊走或博弈對抗

 

實操階段

在嘗試基礎上,增加預測數據的庫,並通過可視化方式進行展示分析。

通過預測第二天的關鍵數據,繼續預測第三天和以後的數據。

建立基於2天的預測數據建立策略模型,每一個策略模型對每一支股票建立成長收益數據,形成新的增強訓練

 

對於選股

由於初級階段沒有對大勢的把握,所以無法選股,只有在全量股票的策略訓練後,纔可能找到成長好的個股

在策略池和成長數據中找到目標股

 

後續的文章將慢慢建立對於數據預測的信心

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章