現實世界中的數據科學:基於領域知識和監督學習模型的黃金價格理解與預測

本文將展示如何建立一個簡單但是強大的金價預測模型,主要包含以下內容:

  • 黃金的簡要歷史
  • 影響金價的若干因素
  • 建立用於預測金價的迴歸模型
  • 利用迴歸模型來輔助投資決策

人類爲何需要黃金?

大約公元前3600年,黃金首先在古埃及被採掘冶煉。經歷30個世紀之後,在土耳其西部的一個古王國鑄造出世界上第一枚金幣,此後黃金便作爲王國內的一種實物貨幣進行流通。

在現代,黃金已經從實物貨幣演變爲貨幣儲備。1819年,英國正式採用有史以來第一個金本位制,將其貨幣與黃金掛鉤。到1900年,除中國以外的大多數國家都採用了金本位制。然而,當第一次世界大戰開始時,由於許多國家需要印鈔來支付戰爭費用,金本位制最終被拋棄。

今天,黃金在我們的生活中被用於各種各樣的用途,如鑄幣、珠寶、電子產品和牙科治療等。而貨幣政策和金融需求會對黃金價格產生實質性的影響。

金價的主要影響因素

從理論上講,影響黃金價格的因素有很多,包括基本面因素、宏觀因素和情感因素。從基本面看,央行、珠寶買家和 ETFs 對實物黃金有需求,而從宏觀層面看,通脹、利率、貨幣供應和美元走強也會影響金價。此外,一些交易員跟蹤 ETFs 的淨頭寸數據,以衡量投機者的情緒,消費情緒和投資情緒也會影響金價。



各因素對金價的相關性

基本層面因素的影響最容易理解。政府和民衆購買的黃金越多,市場上的黃金就越少,價格應該會攀升。

在宏觀層面,通貨膨脹率(通貨緊縮率)是衡量一籃子商品和服務價格上漲(下降)的指標。如果通貨膨脹率上升,我們午餐和黃金的價格也會上升。相反,如果利率上升,黃金作爲一種投資工具相對於美國國債來說就變得沒有吸引力。

最重要的因素之一是貨幣供應量,它衡量一個經濟體中可用的貨幣總量。讓我們舉兩個例子來解釋爲什麼貨幣供應量的增加會提高黃金價格:

  1. 想象一下你和你的朋友之間的一個小經濟體,他們同意用你的貨幣資金買賣彼此的黃金。如果你開始在你的車庫裏製造貨幣資金,並開始從你的朋友那裏購買所有的黃金,那麼黃金相對於貨幣的價格將會上升。換言之,如果美聯儲開始印上數噸美元,黃金相對於美元的價格可能會攀升。

  2. 再想象一下你和你的朋友之間的小經濟體,他們用美元進行交易。如果你印鈔票,給每個人免費的錢,商品和服務的價格將增加,因爲免費的錢將用於購買額外的商品和服務。貨幣供應量的增加最終導致通貨膨脹率的上升,因此黃金價格可以上漲。

總之,美元的強勢會影響黃金和其他以美元計價的大宗商品的價格。如果美元變得疲軟,其他國家可以購買更多的美元,然後購買更多的黃金,從而推高黃金價格,以及其他以美元計價的商品。

如何建立預測金價的模型呢?

爲了對黃金價格進行建模預測,我們首先收集輸入數據並對其進行轉換等預處理。利用轉換後的數據,我們使用線性迴歸模型來解釋影響因素與金價之間的關係。爲了驗證模型,我們進行了樣本外的回溯測試,並計算了 R2R^2 值來衡量模型的性能。

數據收集

本文主要收集了 1981 年以來的以下數據:

  • XAUUSD:以美元計價的黃金現貨價格。
  • 美國CPI指數:該指數跟蹤城市消費者支付的商品和服務價格的變化(即通貨膨脹率)。
  • 美國M2指數:包括現金、支票存款和易於兌換的貨幣在內的貨幣供應量。
  • 美國GDP:該指標衡量美國經濟產出的規模。
  • 美元指數:美元相對於一籃子外幣的價值的指數。



輸入數據及其來源

數據處理&特徵工程

目標變量

該回歸模型的目標變量是經通貨膨脹調整後的黃金現貨價格。即經過 CPI 平滑處理後的黃金現貨價格時間序列(XAUUSD)。

預測因子

該回歸模型有兩個預測因子:貨幣供應量佔GDP的比率(M2/GDP)和美元指數(DXY)。貨幣供應量與GDP之比這一指標優於貨幣供應量,因爲它是衡量經濟中貨幣供應量過剩的指標。

對數變換

在上述兩個變換之後,我們對目標變量和預測因子應用對數變換。因爲所有的值都是正的並且顯示出很高的正偏度,對數變換有助於後面線性模型的應用。



目標變量和預測因子之間的相關性矩陣

利用轉換後的變量,我們繪製一個相關矩陣來了解黃金價格與預測值之間的線性關係。如圖所示,黃金現貨價格與貨幣供應量佔GDP的比例高度相關,與美元指數存在一定的負相關關係。



黃金價格 VS M2/GDP

更重要的是,這兩個預測因子幾乎不相關,兩者的相關度只有 -0.08。這表明,儘管美元指數的相關性小於貨幣供應量與GDP比率的相關性,但美元仍然是有用的,因爲它可能會添加不重疊的信息。



黃金價格 VS 美元指數

模型訓練&回溯測試性能

現在針對預測因子和目標變量,我們通過線性迴歸、嶺迴歸、套索迴歸、隨機森林、XGBoost等方法擬合黃金價格。
爲了對模型進行評價,採用100個季度的滑動窗口對模型進行反覆訓練,並預測下一季度的平均金價,進行了樣本外的回溯檢驗。最後,將預測值與實際值進行比較,計算出R2R^2



金價線性迴歸方程

各方法的結果如圖所示。



預測模型的性能

R 2是決定係數,表示模型可以解釋的總變化百分比。因此,這個簡單的線性迴歸模型可以解釋高達92%的黃金價格總變化。
對比其它方法可以看到,線性迴歸模型的性能優於其它更爲複雜的模型。

如何利用訓練好的預測模型?

利用該模型,我們可以分析貨幣供應量、GDP、美元指數等因素對黃金價格的影響,從而預測黃金價格。

由於各國政府未抵消全球封鎖的影響和信貸市場的擔憂情緒將持續印鈔,貨幣供應量與GDP的比率在短期和長期都將增加。
不過,美元指數可能會因避險需求而出現一定程度的走強。當市場出現拋售時,對美元等避險資產的需求增加,美元走強。

綜合這些因素,預計黃金價格在短期內將保持相當大的波動,因爲這兩個預測因素可以相互抵消。不過,從長期來看,相信期待已久的牛市行情將捲土重來。

作者:Alex Kim

https://github.com/ayh9kim/Commodity/blob/master/Gold/Gold%20Price%20Model%20-%20Version%201.0.ipynb

deephub翻譯組 oliver lee

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章