nlp-形式語言與自動機-ch10-統計機器翻譯

1、基於規則的轉換翻譯方法:

對源語言和目標語言都進行適當描述、把翻譯機制與語法分開、用規則描述語法的實現思想。

2、翻譯過程分爲三段:

1)對輸入文本進行分析,形成源語言抽象的內部表達;

2)將源語言內部表達轉換成抽象的目標語言內部表達;

3)根據目標語言內部表達生成目標語言文本。

3、優缺點:

優點:

可以較好地保持原文結構,產生的譯文結構和源文結構關係密切,尤其對於語言現象已知或句法結構規範的源語言句子具有較強的處理能力和較好地翻譯效果。

缺點:分析規則由人工編寫,工作量大,規則的主觀性強,規則的一致性難以保障,不利於系統擴充,尤其對非規範的語言現象缺乏相應的處理能力。

4、基於中間語言的翻譯方法:


5、基於噪聲信道模型的統計機器翻譯方法:

一個翻譯系統被看作是一個噪聲信道,對於一個觀察到的信道輸出字串(句子)S,尋找一個最大可能的信道輸入句子T,即求解T使概率P(T|S)最大,根據貝葉斯公式:


6、對齊使統計翻譯中的重要概念。

7、對位模型:


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章