[水]關於在線翻譯

緣起

      看英文論文的需要,尤其是看重要的論文,由於本人英語比較渣,加之天性愚鈍,覺得邊看邊翻可能是個不錯的方法。

正文

     在邊看邊翻的過程中,有時,會遇到很長的句子,雖然知道它說什麼,但是卻不知道如何用中文表述。此時就藉助在線翻譯軟件。常使用的在線翻譯:youdao翻譯,百度翻譯,google翻譯。綜合來看,在論文翻譯中,個人感覺 有道< 百度 < 谷歌。當然,考慮到有道有人工在線翻譯,而而後兩者都是機器翻譯,綜合來說,可能差不多。不過像我這樣的窮學生,自然不會去用人家付費的人工服務。不過,同樣是機器翻譯,爲什麼會出現這樣的差異? 作爲一個學習計算機的,我對此很好奇,是算法的差異還是其他因素。

     回想到自己曾掃過幾眼的《數學之美》和徹夜通讀的《世界因你而不同》,裏面提到了關於李開復的工作,就是關於語音識別方面的。記得,好像是李最初將統計學和語音識別結合在一起的,之前的方向都是使用各種各樣的人工智能算法。似乎結合大量的語料,並使用統計學方法,很多問題可以取得不錯的效果,比如自然語言處理之類的NP問題。像機器翻譯,在大量的數據或者語料的支持下,結合統計學方法,將可以將機器翻譯的程序訓練的越來越智能。這讓我想起最近很熱的數據挖掘和機器學習(可能人家一直很熱,只是我不知道而已),其實也是這個思路。

    從訓練的語料的大小角度來看,google> baidu >youdao,這也就形成了三者在機器翻譯的差距。當然,以上只是一家之言,偏見謬誤之處,全當聽個笑話。

PS: 在翻譯論文的時候,發現每次一段一段複製-粘貼-翻譯-再複製-粘貼-修改這樣的循環下來,大多數時間都浪費在複製粘貼上了,自然想到是否存在全文翻譯這樣的方便的工具,google了一下,發現google的翻譯提供全文翻譯這樣便捷的功能,如下圖中左下角的translate a document,選中後將要翻譯的文件上傳上去,然後點擊翻譯,等待結果出現,下面是一組圖示:


(注:初次進入的時候會出現左下角的文字鏈接)



仔細看了翻譯的結果後發現,由Tex編譯生成的pdf文件中,在全文翻譯中,圖片的處理非常的糟糕,這是因爲Tex中圖片是以代碼的形式存在的。既是這樣,也挺錯誤的,原本就沒指望機器翻譯能做到怎樣,這樣可以減少打字的次數。

結論

    寫了一些博客,這次就想水水,水水更健康。

發佈了66 篇原創文章 · 獲贊 18 · 訪問量 28萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章