小象學院自然語言處理第二期---筆記

參考鏈接:機器學習:完整機器學習項目流程,數據清洗

出錯:

chmod能改變權限,-R是目錄下所有文件,777就是高權限(讀、寫、執行)

chmod -R 777 * 意思就是將當前目錄下所有文件都給予777權限

這個在服務器裏不能隨便敲的,不能在根目錄下進行此命令,因爲有些進程是指定權限(如755、700...)才能運行的...,導致打不開linux系統,需重裝。
 

 

1.信息熵:

2.交叉熵:

3.KL-Divergence

鏈接:https://blog.csdn.net/sallyyoung_sh/article/details/54406615

參考鏈接:https://blog.csdn.net/scw1023/article/details/59109922

 

4.Bag of Words

5.Semantic Similarity

6.TF-IDF

 

7.word2vec

自己總結的文章:https://blog.csdn.net/lyf52010/article/details/84992490

 

8.伯努利分佈-->二項分佈

9.EM模型和混合模型  https://blog.csdn.net/lin_limin/article/details/81048411

HMM模型 CRF條件場 PLSA LDA 還比較欠缺,等後面再補

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章