word2vec模型中基於 Hierarchical Softmax 的CBOW和Skip-gram模型

word2vec 是 Google 於 2013 年開源推出的一個用於獲取 word vector 的工具包,它簡單、高效,因此引起了很多人的關注。由於 word2vec 的作者 Tomas Mikolov 在兩篇相關的論文 [3,4] 中並沒有談及太多算法細節,因而在一定程度上增加了這個工具包的神祕感。一些按捺不住的人於是選擇了通過解剖源代碼的方式來一窺究竟,出於好奇,我也成爲了他們中的一員。讀完代碼後,覺得收穫頗多,整理成文,給有需要的朋友參考。




相關鏈接


(一)目錄和前言

(二)預備知識

(三)背景知識

(四)基於 Hierarchical Softmax 的模型

(五)基於 Negative Sampling 的模型

(六)若干源碼細節







原文作者: peghoty 

原文出處: http://blog.csdn.net/itplus/article/details/37969979

歡迎轉載/分享, 但請務必聲明文章出處.

歡迎關注公衆號學習自然語言處理技術


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章