文獻:Labutov I, Lipson H. Re-embedding words[C]//ACL (2). 2013: 489-493.
主要思想:
一方面,詞的嵌入表示形式與學習任務密切相關(dramatic (term X) and pleasant (term Y ) to correlate with a review of a good movie (task A),而在dating profile的場景中,則表現出相反的情感極性);另一方面,詞嵌入學習涉及海量數據,從而計算代價非常之高。再者,許多產生於海量數據的詞嵌入表示庫可以免費獲取。本文從詞嵌入知識庫的改造與嵌入着手展開研究。
問題形式化
給定源字典
方法描述
(1)建立有監督模型
文檔
p(s1,⋯,s|D||D;ΦT)=∏dj∈D∏wi∈djp(sj|ΦT(wi)) , 其中p(sj=1|ΦT(wi))=11+exp(−φ⋅ΦT(wi)) ,φ 是詞嵌入表示的權重向量。
(2)正則化有監督模型
爲了充分利用現有的詞嵌入知識庫,對上述目標函數做如下改造:
-
考慮到該目標函數在參數