原创 機器翻譯需要的軟件 自然語言處理專業所涉及的軟件

、第一個開源的統計機器翻譯工具包——Egypt如前所述,Egypt是在1999年約翰霍普金斯大學統計機器翻譯夏季討論班上,由一些研究人員共同合作開發的統計機器翻譯工具包。它包括4個模塊:Whittle:語料庫預處理模塊;GIZA:用於從句

原创 統計機器翻譯中的幾篇經典文獻

統計機器翻譯中的幾篇經典文獻   MIT人工智能實驗室的《如何做研究》建議閱讀本領域中最本質的幾篇論文:“如果你對AI的某個子領域感興趣,向該領域的高年級研究生請教本領域最重要的十篇論文是什麼”。閱讀經典論文,對於瞭解感興趣的領域非常重

原创 如何給Ubuntu 安裝Vmware Tools

如何給Ubuntu 安裝Vmware Tools 1 在ubuntu左側找到  DVD  VMware Tools  單擊打開 2.找到VMwareTools .tar.gz文件  ,右擊  copy to  桌面 3.在 左側欄  點

原创 數據挖掘(Data Mining)

數據挖掘(Data Mining) 是有組織有目的地收集數據,通過分析數據使之成爲信息,從而從大量數據中尋找潛在規律以形成規則或知識的技術。 數據挖掘實際案例: 2.1.1 尿不溼和啤酒:超級商業零售連鎖巨無霸沃爾瑪公司(Wal Mart

原创 AdaBoost算法

AdaBoost Adaboost是一種迭代算法,其核心思想是針對同一個訓練集訓練不同的分類器(弱分類器),然後把這些弱分類器集合起來,構成一個更強的最終分類器 (強分類器)。其算法本身是通過改變數據分佈來實現的,它根據每次訓練集之中

原创 ID3算法 改進的C4.5算法 決策樹算法

ID3 是建立了概念學習系統(CLS)算法 決策樹是對數據進行分類,以此達到預測的目的。該決策樹方法先根據訓練集數據形成決策樹,如果該樹不能對所有對象給出正確的分類,那麼選擇一些例外加入到訓練集數據中,重複該過程一直到形成正確的決策集

原创 sublime Text2 2.0.2 build 2221 64位 破解(已測試)

sublime Text2 2.0.2 build 2221 64位 破解(已測試) 近終於找到  sublime Text2 升級到 2.0.2 build 2221 64位 的破破解  輸入註冊碼就成了  ----- BEGI

原创 WordNet--JWI( the MIT Java Wordnet Interface) 獲取信息

首先要從http://wordnet.princeton.edu/上下載WordNet,支持Windows系統的最新版本是WordNet2.1,是可執行文件,下載之後雙擊安裝就可以了,記住安裝目錄,以後會用到。我的安裝目錄是C:/Prog

原创 Linux下安裝mysql-5.6.4 的圖文教程

 <iframe id="BAIDU_DUP_fp_iframe" src="http://pos.baidu.com/wh/o.htm?ltr=http%3A%2F%2Fwww.baidu.com%2Flink%3Furl%3D1

原创 CRF++ 0.58 在Windows中 運行與安裝

CRF++ 0.58 在Windows中 運行與安裝 可以選擇example裏的某個例子做測試,比如選chunking。將crf_learn.exe;crf_test.exe;libcrfpp.dll三個文件複製到到,含有exec

原创 深入淺出微信公衆平臺實戰開發(一)

《深入淺出微信公衆平臺實戰開發(微網站、LBS雲、Api接口調用、服務號高級接口)》 課程講師:易偉 課程分類:PHP 適合人羣:初級 課時數量:16課時 用到技術:Api接口調用、lbs應用 涉及項目:微網站 本課程按知識點劃分,共10

原创 TortoiseSVN使用簡介

 安裝及下載client 端 下載Windows 端程序:http://tortoisesvn.net/downloads。一般而言,如果是32-bit的Windows XP 應該使用TortoiseSVN-1.4.x.xxxx-w

原创 國際語義評測SemEval

國際語義評測SemEval   Senseval是由ACL-SIGLEX組織的國際權威的詞義消歧評測,通過組織評測及相關活動驗證詞義消歧系統在不同的詞、語言及語言的不同側面上的優劣。它潛在的目標是增進人們對詞義與多義現象的理解。 1997

原创 GIZA++實現了IBM模型1~5 IBM Model 1詳解

IBM model是統計機器翻譯中的經典翻譯模型,也是基於詞的統計機器翻譯系統的基礎。IBM翻譯模型共有5個複雜度依次遞增的統計翻譯模型,IBM model1是其中最簡單的模型,也是其他模型進行計算的基礎。IBM模型1僅僅考慮詞對詞的

原创 python中處理WordNet

python中處理WordNet >>>from nltk.corpus import wordnet as wn >>> wn.synsets('motorcar') >>> wn.synset('car.n.01').lemm