關於構建文檔翻譯平臺的想法

 zz from: http://blog.daviesliu.net/2007/04/06/115711/

開源社區現在有大量非常有用的文檔,雖然對部分英語較好的人不存在閱讀障礙,也鼓勵大家儘量提高自身的英語能力,但是有一份翻譯得不錯的中文文檔,會更加有用,畢竟使用自己最熟悉的語言是最輕鬆的。同時也能造福廣大英語不好的人,即使翻譯文檔不能完全準確表達原文的意思,能讓人快速瞭解個大概也是非常非常有用的,通常費了很多時間閱讀英文資料後也只能留下一個大概的印象。總的來說,如果能夠有一個方便地支持協作翻譯的平臺,讓更多的人更容易地參與翻譯和改進,將是非常好的一件事。

現在有不少翻譯社區,比如譯言或者其它的一些翻譯型blog,他們適合翻譯一些簡短的新聞類文章,不便於多人共同維護一份技術文檔的翻譯。也有基於Wiki的協作翻譯形式,但是wiki的使用有一些門檻,在格式上也很難跟原文保持一致,針對原文檔的更新也不容易。基於已有的這些並不太理想的方案,針對技術文檔的特點,構建一個更適合文檔翻譯的平臺。

先來看看文檔翻譯的特點:

  1. 技術文檔相對新聞和blog來說,有效性時間相對要長,一篇翻譯得好的文檔可以讓很多人受益;
  2. 技術文檔是有版本概念的,會隨着軟件或者系統的更新而更新;
  3. 內容比較多,一個人單獨完成翻譯比較困難;
  4. 語句比較客觀、直白和嚴謹,容易得到一個大多數人都能接受的翻譯結果,多人協調翻頁導致;
  5. 有不少相對穩定的專業詞彙和概念;
  6. 文檔有一定的格式,通常爲HTML頁面,內部會嵌入代碼等。

根據這些特點,希望文檔翻譯平臺能達到下面這些目標:

  1. 個人的翻譯的過程是方便和快捷的,能夠中英文對照,批量替換等;
  2. 方便地進行多人協同翻譯,共同完成大量文檔的翻譯,個人即使只翻譯一句話或者一個段落也是可參與的;
  3. 方便地進行相互校對和修訂,提高翻譯質量;
  4. 保持跟原文檔一致的格式;
  5. 能夠自動跟蹤原文檔的更新,並自動合併;

擬採用的方案:

  1. 將文檔的翻譯細化到句子甚至短語的翻譯,建立文檔中句子甚至短語跟翻譯結果的一一對應關係,用它們替換原文檔得到翻譯後的文檔。這樣當原文更新後,翻譯文檔也會自動更新,新出現的語句會明顯地暴露出來,便於增量翻譯。同時可以保持與原文檔同樣的格式。
  2. 可選擇以機器翻譯作爲初始狀態進行改進,提高翻譯質量,同時改進後的翻譯作爲用來進行機器學習。對一批文檔採用項目的形式進行管理,同一個項目共享一個詞庫,用於進行批量替換或機器翻譯時的特化詞典。機器翻譯最大的問題在於對專業詞彙的翻譯,解決了這部分後通常能得到一個基本能看明白的文檔。
  3. 一個句子或者短語可以有多個翻譯結果,用戶可以選擇最合適的翻譯,投票決定最優翻譯,以提高翻譯質量。
  4. 交互界面上採用Google翻譯的效果,頁面中顯示翻譯後的結果,鼠標停留時可以看到原文,點擊後可以選擇其他翻譯或者採用原文或者提交新的翻譯。
  5. 可以做一個瀏覽器擴展或者插件,用戶可以根據網頁的URL,自動跳轉到該平臺下的相應翻譯頁面;

以上是我對協作進行文檔翻譯的一些想法,歡迎大家多提意見,最後能得到一個比較好的方案並付諸實施。

網友留言:

Re: 關於構建文檔翻譯平臺的想法1. zhoucheng 發表於 2007 年 04 月 6 日 6:25 p.m.

很看好作者的想法!

很多文檔非常具有翻譯價值,但國內現在還沒有文檔協作翻譯的平臺和社區. 如果能有一個這樣一個平臺, 大家可以推薦翻譯任務,選擇自己熟悉的內容進行翻譯(最好以段落爲單位), 系統自動檢查文檔的版本更新並對翻譯結果進行整理, 系統通過一定的方式對譯者進行激勵. 總之圍繞這個平臺建立一個翻譯社區,平臺的作用是使大家的協作更順暢.

Yeeyan已經有了基本的翻譯社區的特徵, 但因爲沒有文檔任務推薦的功能和文檔轉換的工具, 而且細分單位是文章,沒有wiki的功能, 所以暫時不適合文檔協作翻譯.

通過瀏覽器插件的方式比較有意思, 不光是譯者可以用插件區翻譯, 讀者也可以通過安裝插件, 在瀏覽某個英文文檔時, 插件識別是否有對應的中文文檔, 有則顯示中文文檔給讀者. 當然所有的中文文檔不一定集中管理,可以採用P2P的方式進行管理和訪問.

Re: 關於構建文檔翻譯平臺的想法2. davies 發表於 2007 年 04 月 6 日 8:08 p.m.

在Python.CN的郵件列表,有非常有意思的討論

<a href="http://groups.google.com/group/python-cn/browse_thread/thread/8b387e778ae2c375/7c399523b05e0c8b"> 關於構建翻譯平臺的想法</a>

Re: 關於構建文檔翻譯平臺的想法3. bianbian 發表於 2007 年 04 月 6 日 9:03 p.m.

我也有類似想法。苦於時間精力不夠。剛剛申請了域名 docwiki.cn 。正準備做這個。按這個需求來說,wiki無疑最合適。但是國內開發人員忙於生計,普遍懶得打字的現狀;加上少數搗亂分子的存在,還是有些難度。想法要在實踐中不斷完善,否則永遠是個想法。我過幾天等事情少下來,先做nginx的中文wiki。大家一起努力,爲國內IT業添磚加瓦。

Re: 關於構建文檔翻譯平臺的想法4. davies 發表於 2007 年 04 月 7 日 1:42 a.m.

恩,一起來動手做,衆人拾柴火焰高,儘量避免重複勞動。根據大家的討論和幾個人之前的時間,方案也越來越清晰了,可以考慮抽取文檔的文本內容生成po文件,基於SVN進行版本管理,再做一個好用的便於協同工作的web前端。

Re: 關於構建文檔翻譯平臺的想法5. hawk 發表於 2007 年 09 月 16 日 1:29 p.m.

好建議!雖然實力不高,但願意幫忙,有需要請聯繫[email protected]

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章