word2vec 是 Google 於 2013 年開源推出的一個用於獲取 word vector 的工具包,它簡單、高效,因此引起了很多人的關注。由於 word2vec 的作者 Tomas Mikolov 在兩篇相關的論文 [3,4] 中並沒有談及太多算法細節,因而在一定程度上增加了這個工具包的神祕感。一些按捺不住的人於是選擇了通過解剖源代碼的方式來一窺究竟,出於好奇,我也成爲了他們中的一員。讀完代碼後,覺得收穫頗多,整理成文,給有需要的朋友參考。
相關鏈接
(一)目錄和前言
(二)預備知識
(三)背景知識
(四)基於 Hierarchical Softmax 的模型
(六)若干源碼細節
原文作者: peghoty
原文出處: http://blog.csdn.net/itplus/article/details/37969979
歡迎轉載/分享, 但請務必聲明文章出處.
歡迎關注公衆號學習自然語言處理技術