原创 2012年03月26日

利用對數線性模型進行詞對齊訓練的整個過程: 1、語料預處理 用python解析xml,生成src, trg, ref, srcTest, trgTest 和 refTest。 注意:由於本人是在linux下進行的預處理,所以要先將

原创 關於混合高斯、EM和K-means

與k-means一樣,給定的訓練樣本是,我們將隱含類別標籤用表示。與k-means的硬指定不同,我們首先認爲是滿足一定的概率分佈的,這裏我們認爲滿足多項式分佈,,其中,有k個值{1,…,k}可以選取。而且我們認爲在給定後,滿足多值高斯分

原创 觀王垠有感

今天閒着無聊,偶然看見王垠的簡單介紹,懷着好奇心看了他的相關經歷,看完有不少觸動,再加上自己的最近對於未來也有很多想法,於是記下一筆。 王垠主要寫過幾篇文章,讓他出名的包括 《完全用linux工作》、《寫給支持和反對<完全用Linu

原创 北京戶口的知識

轉載自北郵論壇: 因 爲自己解決戶口的決心非常大,前段時間好好補習了下這方面的知識,也接觸了一些渠道,總算對戶口這茬有所瞭解,最近經常被人問到戶口的事情,發現有必要掃 下盲,現將我瞭解的信息整合彙總如下,除了引用一些比較好的文章(由於參

原创 Google搜索的用法

Google是我們這個時代最偉大的產品之一。有了Google,本質上誰都有能力做“research”(研究)——“research”在今天已經不再像許多年前那樣是少數“精英”的專利了。我常常告訴我的學生,“research”其實一點都不

原创 配置python命令tab鍵自動補全

1.edit and configure pythonstartup file # python startup fileimport sysimport readlineimport rlcompleterimport ate

原创 Natural Language Processing With Python (2)

Chapter 3: This chapter describes the skill to process raw text. Some important point: 1. Access text from web and

原创 Statistical Machine Translation Tutorial Reading

The following is a list of papers that I think are worth reading for our discussion of machine translation. I've tried

原创 2011年9大破產科技預言

導語:美國科技博客BusinessInsider今日發表文章,列出了在2011年破產的9大糟糕預言,如Flash將在移動設備上大行其道,惠普和PC業務說再見,谷歌缺席社交網絡,諾基亞智能手機戰略失誤等。 以下爲文章內容摘要: 在

原创 Natural Language Processing With Python (1)

Chapter 1: Easy, just using some API. Important API : FreqDist().  Some natural language understanding technologies

原创 Natural Language Processing With Python (3)

Chapter 4 something about python basic: (1)A list is typically a sequence of objects all having the same type, of ar

原创 各大知名企業的Research展示

大公司為了要拉開彼此的差距, 除了專注於目前的產品外, 都會為了未來做準備, 而這些研究通常都會做一個 Research 的專區來呈現成果, 如下述列表: Google Research Yahoo! Research The Fac

原创 C++著名程序庫(轉)

C++著名程序庫的比較和學習經驗(轉自校內,雖然不是搞C++的,但瞭解一些基礎的還是很有必要) 1、C++各大有名庫的介紹——C++標準庫  2、C++各大有名庫的介紹——準標準庫Boost  3、C++各大有名庫的介紹——GUI 

原创 2011年影響中國通信行業發展的十件大事

2011年,通信行業的大事不少,一些足以影響未來五年甚至十年的發展:     1、喬布斯拋下蘋果先登船而去,讓整個IT行業震撼,也讓蘋果的未來出現了太多的變數,甚至直接影響到了中國通信市場格局;     2、谷歌收購了摩托羅拉,軟硬結合

原创 Machine learning and Classifier from Wiki

Wiki真是一個好東西,什麼知識點都列得清清楚楚,簡直就是一本萬能的書。。。 Algorithm types Machine learning algorithms can be organized into a taxonom