時間序列數據的特徵工程是一種技術,用於從時間序列數據中提取信息或構造特徵,這些特徵可用於提高機器學習模型的性能。以下是一些常見的時間序列特徵工程技術:
- 滾動統計量:計算時間窗口內的統計量,如平均值、中位數、標準偏差、最小值和最大值。這些統計量可以捕捉到時間序列在不同時間段的行爲變化。
- 滯後特徵:創建時間序列的過去值作爲新的特徵,以揭示序列的自相關性質。例如,可以使用前一天(滯後1)或前一週(滯後7)的數據作爲預測當前值的特徵。
- 差分和季節差分:計算時間序列的一階差分(即當前值與前一個值的差)或季節性差分(如當前值與前一年同一天的值的差)來幫助去除趨勢和季節性影響。
- 變換:應用變換如對數變換、平方根變換等,可以幫助穩定時間序列的方差,使其更適合某些統計模型。
- 時間戳信息:提取時間戳的特定部分,如小時、周天、月份等,用於捕捉週期性模式。
- 傅里葉變換:通過傅里葉變換將時間序列轉換爲頻域表示,提取週期性特徵。
- 波動性度量:對於金融時間序列,可以計算曆史波動性或返回序列的標準偏差等度量。
- 窗口函數:使用滑動窗口操作,如滑動平均或指數平滑,以平滑時間序列並減少噪聲。
本文將通過使用feature-engine來簡化這些特徵的提取,首先我們看看數據。
https://avoid.overfit.cn/post/db4091bc5c8d489aa6f4df807ff7894f