原创 linux 下安裝 word2vec (python 版本)

1.安裝pip :  apt-get install python-pip 1.安裝 nose   :    pip install nose 3. 安裝  numpy:   apt-get install python-numpy 4.

原创 WordNet 簡介

Wordnet是一個詞典。每個詞語(word)可能有多個不同的語義,對應不同的sense。而每個不同的語義(sense)又可能對應多個詞,如topic和subject在某些情況下是同義的,  WordNet是由Princeton 大學的心

原创 中文分詞方法總結

中文分詞方法總結 1.  計算所開發的ICTCLAS 中文分詞系統,這個系統採用一些語義分析的方法以提高分詞的準確度。算法相對複雜,要維護詞表、維護詞的關係,對於如下句子:“請把手擡高一點兒”,比較互聯網上我所找到的幾個算法,只有ICT

原创 Cyc簡介

Cyc中的概念被稱爲“常量(constants)”。常量以"#$"開頭並區分大小寫。常量主要分爲以下幾類: 個體,即individuals:例如 #$BillClinton 又如 #$France。 集合

原创 Protege4.2使用說明

Protege4.2使用說明  安裝JDK1.6:下載資源進行安裝,環境變量配置:變量名Java_home,變量值G:\Study\JDK1.6 安裝protege_4.2_alpha:安裝時軟件會自動檢

原创 eclipse中導入jena

eclipse中導入jena: Step 1 create a Java project Eclipse organizes files into projects, so we need a project for this tuto

原创 Python 新手推薦書25本免費的Python電子書

 對於 Python 新手應該從哪本開始 25本免費的Python電子書 Think Stats Dive Into Python A Byte Of Python Think Complexity Dive Into Pyt

原创 遠程連接服務器For Windows 2003 & 2008

遠程連接服務器For Windows 2003 & 2008 雲服務器系統是windows系列的用戶,可以使用自己電腦windows系統自帶的“遠程桌面連接”功能遠程連接雲服務器。Windows2003/2008系統自帶正版激活,不收

原创 條件隨機場(CRF)

條件隨機場(CRF) CRF(Conditional Random Field) 條件隨機場是近幾年自然語言處理領域常用的算法之一,常用於句法分析、命名實體識別、詞性標註等。在我看來,CRF就像一個反向的隱馬爾可夫模型(HMM),兩者都是

原创 《Win7板凳哥升職記》 通過Win7命令提示符批量修改文件的後綴名

通過Win7命令提示符批量修改文件的後綴名 要批量修改文件後綴名,其實僅需藉助命令提示符的“ren”命令即可。簡單地講,使用“ren”這個命令,一下子就可以將N個文件的後綴名修改成你想要的。  第一步,將所有要修改後綴的文件集中到一個命名

原创 LDA

(一)LDA作用         傳統判斷兩個文檔相似性的方法是通過查看兩個文檔共同出現的單詞的多少,如TF-IDF等,這種方法沒有考慮到文字背後的語義關聯,可能在兩個文檔共同出現的單詞很少甚至沒有,但兩個文檔是相似的。