GAN能進行股票預測嗎?

機器學習是未能完全解決的一個領域是股票預測,因爲它可能是最有利可圖的研究領域之一所以在這方面的研究仍然在繼續。投資者希望能夠放心地把錢投在表現優異的公司,隨着投資的增加,公司的發展也將會突飛猛進,投資的收益也會增長。

在過去的研究中,出現了而很多的方式,但這些方式和方法並不是很成功,所以本文將這個領域的研究擴展到GANs。看看GANs這個領域是否能夠進行預測。

雖然kaggle中的預測JPX市場預測是一個非常好的數據集,但是他的數據集需要在kaggle上進行預測和提交,所以這裏使用使用他的子集並且指定針對於本文測試的指標進行測試,這樣可以顯示出我們這次研究的真正表現。

在真正開始之前首先將爲所有模型實現相同的預處理方法和評分指標。然後從一個預期性能較差的線性迴歸基線模型開始並將此作爲最小基線。然後嘗試着優化XGBoost模型和CAT boost模型,將這兩個模型疊加在一起(復現比賽中排名較高的模型),目標是實現比最佳模型更高的模型。在此之後,將探索GANs解決方案,看看GANs能達到什麼樣的結果。

數據集將被拆分爲過去的訓練數據和最近的測試數據。其中所有提取和工程特徵保持這個拆分,這將確保不會出現數據泄露的問題。我們將使用夏普比率(Sharpe Ratio),這幾乎是在人力資源管理和人力投資策略評分中普遍使用的評分指標。夏普比率是由諾貝爾獎得主威廉·f·夏普(William F. Sharpe)提出的,用於幫助投資者瞭解投資回報與風險的比例。該比率是每單位波動率或總風險的無風險率以外的平均收益。波動性是對資產或投資組合價格波動的衡量。夏普比率根據投資者承擔的超額風險,調整投資組合的過去表現或未來預期表現。與回報率較低的類似投資組合或基金相比,較高的夏普比率是好事。但是夏普比率有幾個弱點,包括投資回報是正態分佈的假設,這裏就不進行詳細解釋了。

數據預處理與特徵工程

在金融技術分析領域,技術指標是指基於歷史價格、交易量或證券或合同未平倉量的數學計算或模式信號,通過和諧指標可以預測金融市場方向。對於數據科學家來說這被稱爲特徵工程,本項目採用某領域專家提出的頂級技術指標作爲我們的特徵:7天和21天的移動平均線、指數移動平均線、對數動量、Bollinger bands 和MACD等等。傅里葉變換是一種時間序列數據的處理常用方法,它可以抑制數據中的統計異常,並已被證明允許gru(在我們的GANs模型中使用)學習更健壯的模式。

我們的目標預測是股票的收盤價,上面的圖中我們很難能夠理解過去的數據能夠很好的預測未來的數據,但當我們用自相關進行統計分析時(自相關是指同一變量在兩個連續時間間隔之間的相關程度。它衡量一個變量值的滯後版本與它在時間序列中的原始版本之間的關係),我們使用滯後參數100,得到以下強正相關,這意味着我們的預測模型有望取得良好的結果:

完整文章:

https://avoid.overfit.cn/post/d746ef7060ce41fb9a822f9768ea42a3

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章