開源社區現在有大量非常有用的文檔,雖然對部分英語較好的人不存在閱讀障礙,也鼓勵大家儘量提高自身的英語能力,但是有一份翻譯得不錯的中文文檔,會更加有用,畢竟使用自己最熟悉的語言是最輕鬆的。同時也能造福廣大英語不好的人,即使翻譯文檔不能完全準確表達原文的意思,能讓人快速瞭解個大概也是非常非常有用的,通常費了很多時間閱讀英文資料後也只能留下一個大概的印象。總的來說,如果能夠有一個方便地支持協作翻譯的平臺,讓更多的人更容易地參與翻譯和改進,將是非常好的一件事。
現在有不少翻譯社區,比如譯言或者其它的一些翻譯型blog,他們適合翻譯一些簡短的新聞類文章,不便於多人共同維護一份技術文檔的翻譯。也有基於Wiki的協作翻譯形式,但是wiki的使用有一些門檻,在格式上也很難跟原文保持一致,針對原文檔的更新也不容易。基於已有的這些並不太理想的方案,針對技術文檔的特點,構建一個更適合文檔翻譯的平臺。
先來看看文檔翻譯的特點:
- 技術文檔相對新聞和blog來說,有效性時間相對要長,一篇翻譯得好的文檔可以讓很多人受益;
- 技術文檔是有版本概念的,會隨着軟件或者系統的更新而更新;
- 內容比較多,一個人單獨完成翻譯比較困難;
- 語句比較客觀、直白和嚴謹,容易得到一個大多數人都能接受的翻譯結果,多人協調翻頁導致;
- 有不少相對穩定的專業詞彙和概念;
- 文檔有一定的格式,通常爲HTML頁面,內部會嵌入代碼等。
根據這些特點,希望文檔翻譯平臺能達到下面這些目標:
- 個人的翻譯的過程是方便和快捷的,能夠中英文對照,批量替換等;
- 方便地進行多人協同翻譯,共同完成大量文檔的翻譯,個人即使只翻譯一句話或者一個段落也是可參與的;
- 方便地進行相互校對和修訂,提高翻譯質量;
- 保持跟原文檔一致的格式;
- 能夠自動跟蹤原文檔的更新,並自動合併;
擬採用的方案:
- 將文檔的翻譯細化到句子甚至短語的翻譯,建立文檔中句子甚至短語跟翻譯結果的一一對應關係,用它們替換原文檔得到翻譯後的文檔。這樣當原文更新後,翻譯文檔也會自動更新,新出現的語句會明顯地暴露出來,便於增量翻譯。同時可以保持與原文檔同樣的格式。
- 可選擇以機器翻譯作爲初始狀態進行改進,提高翻譯質量,同時改進後的翻譯作爲用來進行機器學習。對一批文檔採用項目的形式進行管理,同一個項目共享一個詞庫,用於進行批量替換或機器翻譯時的特化詞典。機器翻譯最大的問題在於對專業詞彙的翻譯,解決了這部分後通常能得到一個基本能看明白的文檔。
- 一個句子或者短語可以有多個翻譯結果,用戶可以選擇最合適的翻譯,投票決定最優翻譯,以提高翻譯質量。
- 交互界面上採用Google翻譯的效果,頁面中顯示翻譯後的結果,鼠標停留時可以看到原文,點擊後可以選擇其他翻譯或者採用原文或者提交新的翻譯。
- 可以做一個瀏覽器擴展或者插件,用戶可以根據網頁的URL,自動跳轉到該平臺下的相應翻譯頁面;
以上是我對協作進行文檔翻譯的一些想法,歡迎大家多提意見,最後能得到一個比較好的方案並付諸實施。
網友留言:
2. davies 發表於 2007 年 04 月 6 日 8:08 p.m.
在Python.CN的郵件列表,有非常有意思的討論
<a href="http://groups.google.com/group/python-cn/browse_thread/thread/8b387e778ae2c375/7c399523b05e0c8b"> 關於構建翻譯平臺的想法</a>
3. bianbian 發表於 2007 年 04 月 6 日 9:03 p.m.
我也有類似想法。苦於時間精力不夠。剛剛申請了域名 docwiki.cn 。正準備做這個。按這個需求來說,wiki無疑最合適。但是國內開發人員忙於生計,普遍懶得打字的現狀;加上少數搗亂分子的存在,還是有些難度。想法要在實踐中不斷完善,否則永遠是個想法。我過幾天等事情少下來,先做nginx的中文wiki。大家一起努力,爲國內IT業添磚加瓦。
4. davies 發表於 2007 年 04 月 7 日 1:42 a.m.
恩,一起來動手做,衆人拾柴火焰高,儘量避免重複勞動。根據大家的討論和幾個人之前的時間,方案也越來越清晰了,可以考慮抽取文檔的文本內容生成po文件,基於SVN進行版本管理,再做一個好用的便於協同工作的web前端。
1. zhoucheng 發表於 2007 年 04 月 6 日 6:25 p.m.
很看好作者的想法!
很多文檔非常具有翻譯價值,但國內現在還沒有文檔協作翻譯的平臺和社區. 如果能有一個這樣一個平臺, 大家可以推薦翻譯任務,選擇自己熟悉的內容進行翻譯(最好以段落爲單位), 系統自動檢查文檔的版本更新並對翻譯結果進行整理, 系統通過一定的方式對譯者進行激勵. 總之圍繞這個平臺建立一個翻譯社區,平臺的作用是使大家的協作更順暢.
Yeeyan已經有了基本的翻譯社區的特徵, 但因爲沒有文檔任務推薦的功能和文檔轉換的工具, 而且細分單位是文章,沒有wiki的功能, 所以暫時不適合文檔協作翻譯.
通過瀏覽器插件的方式比較有意思, 不光是譯者可以用插件區翻譯, 讀者也可以通過安裝插件, 在瀏覽某個英文文檔時, 插件識別是否有對應的中文文檔, 有則顯示中文文檔給讀者. 當然所有的中文文檔不一定集中管理,可以採用P2P的方式進行管理和訪問.