時間序列問題與自然語言處理的區別

原創

2020-05-24 15:50

在技術上，經常會把時間序列問題和自然語言處理問題類比，因爲兩者都是時序數據，所以兩類問題的模型經常相互借用。

但兩者還是有一定區別的，自然語言本質上還是符號序列，而通常考慮的時間序列問題是數值序列。

RNN 原本是用於時間序列建模，用其函數逼近的功能來仿真一個非線性動態系統，多用於工程控制領域。早期的自然語言處理是不用 RNN 的，而是建立詞空間的隨機過程模型，如隱馬爾科夫模型，認爲語句的形成是源於詞空間的離散元素之間依概率的遊走。

隨着神經網絡技術的發展，RNN 的訓練變得更容易，大家開始考慮用 RNN 來做處理自然語言了。但要把離散的單詞序列和動態系統聯繫起來，就要用到一個假設：語言可以用隱變量（語義）空間的動態系統來描述。表面上是一個個獨立的詞語拼成的句子，實際上在語義空間是一條連續的路徑，這也是 word2vec 學習詞表示的核心思想。

到了現在嘛，大家發現 RNN 處理自然語言還是不太給力，原因就是上面的假設有點牽強。Attention 機制的興起實際上就是爲了打破傳統 RNN 的嚴格的時序結構，說到底還是因爲自然語言是符號序列，並不具有數值序列中元素與前後鄰居之間的連續性。

現在時間序列預測也開始借鑑自然語言處理中的注意力機制來處理非季節性的序列。非季節性數值序列從另一個角度也可以看成是符號序列，把時間分段後每一段抽象成一個元素即可。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

時間序列之間的相關性檢測

爲了檢測時間序列的相關性，我們經常使用自相關，互相關或歸一化互相關。互相關（Cross-Correlation）互相關是兩個不同時間序列的比較，以檢測具有相同最大值和最小值的指標之間是否存在相關性。例如：“兩個音頻信號同相嗎？

2020-06-29 05:33:03

時間序列分類算法之LPS論文翻譯

本文主要翻譯LPS論文的主體部分，由於水平有限，可能翻譯的不夠準確。算法原文連接爲基於局部自動模式的時間序列表示與相似度摘要：隨着從醫學、金融、多媒體等不同領域的時間序列數據集的增加，時間序列數據挖掘受到更多人的關注。對於減少維數和產

2020-06-23 20:21:46

dataframe根據時間戳timestamp切分成多個dataframe

原始數據是 dataframe 的一列 “timestamp” 需要按照每5分鐘做一次切分，下面是切分的代碼： import pandas as pd def dataframe_strip(dataframe: pd.Data

2020-07-08 04:48:59

ARIMA--R實現

第一步.對原始數據進行分析一.ARIMA預測時間序列指數平滑法對於預測來說是非常有幫助的，而且它對時間序列上面連續的值之間相關性沒有要求。但是，如果你想使用指數平滑法計算出預測區間，那麼預測誤差必須是不相關的，而且必須是服從零均值、方

2020-07-06 10:36:28

求最大李雅普諾夫指數（Largest Lyapunov Exponents，LLE）的 Rosenstein 算法

文章目錄原始論文python 相關代碼混沌系統的常見指標最大李亞普諾夫指數的含義算法流程圖python 代碼模塊最近鄰maximum Lyapunov exponentRANSAC 擬合曲線例子：計算洛倫茲系統的最大李雅普諾夫指數

2020-07-05 17:46:29

python下安裝eemd

(1)以下是windows系統python下的安裝：基本是參考網站： http://juiceyang.com/2016/03/24/how-to-install-pyeemd-on-windows-in-3-steps/ （

2020-07-05 16:41:43

時間序列平穩性檢驗—R語言KPSS檢驗

1.R語言函數ur.kpss() 對於一個時間序列，例如用R自帶的google股價變化數據goog(可以通過導入fpp2包之後直接使用goog這個數組變量，這裏僅爲示例，代指要檢驗的時間序列或者數組)。 1.1 對goog進行KP

南瓜派三蔬

2020-07-03 14:29:04

時間序列相關學習筆記整理

pandas應用時間序列分析之_時間重採樣 python時間序列分析之_用pandas中的rolling函數計算時間窗口數據時間序列的平穩性及使用差分法處理非平穩時間序列 kaggle比賽： 1. 時間序列基礎建模方法 2. Corp

weixin_39848830

2020-06-30 17:28:32

混沌模型時間序列預測

一、混沌理論混沌現象是介於確定和隨機之間的一種不規則運動，是一種由確定的非線性動力學系統生成的複雜行爲，廣泛存在於自然系統和社會系統中。混沌是確定性系統中由於隨機性行爲而產生的一種外在的、複雜的、貌似無規則的運動。對於確定性的非線性系

满腹的小不甘

2020-06-28 16:15:44

R語言與數據分析：時間序列簡單介紹

1. https://blog.csdn.net/howardge/article/details/41979119 接下來我們來分解時間序列，時間序列分爲：非季節性數據和季節性數據一個非季節性時間序列：包含一個趨勢部分和一個不規則部

满腹的小不甘

2020-06-28 16:15:39

Python 數據分析三劍客之 Pandas（九）：時間序列

CSDN 課程推薦：《邁向數據科學家：帶你玩轉Python數據分析》，講師齊偉，蘇州研途教育科技有限公司CTO，蘇州大學應用統計專業碩士生指導委員會委員；已出版《跟老齊學Python：輕鬆入門》《跟老齊學Python：Djan

TRHX • 鲍勃

2020-06-27 03:11:07

《Detecting sequences of system states in temporal networks》

文章目錄論文地址bibtex代碼地址主要內容網絡的距離度量圖編輯距離DeltaConThe quantum spectral Jensen-Shannon divergence其餘四種頻域距離論文地址 https://www.n

2020-06-26 15:28:58

時間序列分類算法之時間序列森林（TSF）

算法介紹時間序列森林（Time Series Forest, TSF）模型將時間序列轉化爲子序列的均值、方差和斜率等統計特徵，並使用隨機森林進行分類。TSF通過使用隨機森林方法（以每個間隔的統計信息作爲特徵）來克服間隔特徵空

2020-06-23 20:21:50

時間序列分類算法之LPS（代碼分析）

public class LPS extends AbstractClassifierWithTrainingData 02: implements ParameterSplittable{ 03: RandomRe

2020-06-23 20:21:44

時間序列流程

一、變平穩 1.1 去趨勢差分、取對數 1.2去週期性濾波、差分 1.3變平穩的原因除了1.1、1.2之外還有穩定方差、使數據呈現正態分佈、使週期效應累加 ARIMA模型的示例代碼 from panda

上进的菜鸟

2020-06-23 20:09:29

24小時熱門文章

最新文章

最新評論文章