Attention Is All You Need論文詳解與理解

研究背景、動機

深度學習做NLP問題的方法,大多基本上是先將句子分詞,然後將每個詞轉化爲對應的詞向量序列,於是每個句子就都對應一個詞嵌入矩陣X=(x1,x2,...,xt)X=\left(x_1,x_2,{...,x}_t\right)X=

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章