統計機器翻譯中的幾篇經典文獻

統計機器翻譯中的幾篇經典文獻


  MIT人工智能實驗室的《如何做研究》建議閱讀本領域中最本質的幾篇論文:“如果你對AI的某個子領域感興趣,向該領域的高年級研究生請教本領域最重要的十篇論文是什麼”。閱讀經典論文,對於瞭解感興趣的領域非常重要。而關於統計機器翻譯,最經典的幾篇論文又是什麼呢?以下是我根據自己的經驗總結的幾篇經典論文,如有遺漏,歡迎補充。

1A Statistical Approach to Machine Translation
  簡稱Brown90,這是統計機器翻譯的奠基之作,是瞭解統計機器翻譯基本思想的必讀,文章中最主要的思想是把機器翻譯看成是一個信息傳輸的過程,用一種信源信道模型對機器翻譯進行解釋。另外文章主要是對統計機器翻譯三部分(翻譯模型、語言模型及解碼)的宏觀介紹,涉及的數學理論並沒有過多的詳細解釋,因此讀來比較輕鬆。

2. The Mathematics of Machine Translation: Parameter Estimation
  簡稱Brown93,主要針對Brown90中翻譯模型的參數估計進行了詳細的數學解釋,需要一定的數學基礎和耐心,不過Kevin Knight 99JHU(約翰霍普金斯大學)夏季機器翻譯研討班上的《A Statistical MT Tutorial Workbook》對Brown93用例子及通俗的方式進行了講解,讀來比較容易理解,值得對照閱讀。

3. Discriminative Training and Maximum Entropy Models for Statistical Machine Translation
  這是統計機器翻譯領域中傳奇人物Franz Josef Och 2002ACL會議上發表的論文,他提出了基於最大熵模型的統計機器翻譯方法,是對Brown信源信道模型的極大擴展,開闊了統計機器翻譯的視野,併爲研究者提供了一個融合其它知識到統計機器翻譯中的研究框架,這篇論文獲得了當年的ACL最佳論文獎。

4. Statistical Phrase-Based Translation
  這是統計機器翻譯領域另一個大牛Philipp Koehn 2003年與Och合著的文章,已涉及了具體的方法而不是理論框架:基於短語的統計機器翻譯。之所以選在這裏,與Koehn 2004年發佈的具有廣泛影響力的解碼器Pharaoh不無關係,Pharoah現在已被Koehn領導的另一個開源項目Moses所取代。

5. BLEU: A Method for Automatic Evaluation of Machine Translation
  這是目前用得最廣的機器翻譯自動評測方法BLEU的原始論文,之所以選在這裏,因爲評測方法的好壞對於機器翻譯的研究具有很大的影響,BLEU理應作爲評測方法的代表入選。

 

發佈了26 篇原創文章 · 獲贊 3 · 訪問量 5萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章