《命令行上的數據科學第二版》校對活動重新啓動 貢獻指南

倉庫:https://github.com/apachecn/ds-cmd-line-2e-zh

整體進度:https://github.com/apachecn/ds-cmd-line-2e-zh/issues/1

貢獻指南:https://github.com/apachecn/ds-cmd-line-2e-zh/blob/master/CONTRIBUTING.md

章節列表:


貢獻指南

請您勇敢地去翻譯和改進翻譯。雖然我們追求卓越,但我們並不要求您做到十全十美,因此請不要擔心因爲翻譯上犯錯——在大部分情況下,我們的服務器已經記錄所有的翻譯,因此您不必擔心會因爲您的失誤遭到無法挽回的破壞。(改編自維基百科)

負責人:

有用的鏈接

流程

一、認領

校對者需要熟練掌握 Markdown 和 Git,以及文檔的主題(編程,Web開發,大數據,AI,安全之一)。

首先查看整體進度,確認沒有人認領了你想認領的章節。

然後回覆 ISSUE,註明“章節 + QQ 號”,便於聯繫和跟蹤進度。

二、校對

需要校對【專業術語】和【格式】。

【語法】無需校對因爲已經校對完了,並且請最大程度保留原文的語言風格。

譯文在docs目錄下,原文請見每個文章開頭處的鏈接。

注意:不要修改譯文的文件名,因爲它們和章節對應!

確保譯文符合下方的【Markdown 排版要求】一節。

請參考下方的【有用的正則表達式】一節,以及【翻譯引擎易錯術語列表】來提高效率。

三、提交

  • fork Github 項目
  • docs文件夾下編輯譯文
  • addcommitpush
  • pull request

請見廖雪峯 Git 教程

Markdown 排版要求

  1. 代碼塊和圖片無需校對,並且不計入字數。
  2. 漢字和英文字母,漢字和數字之間空一格。但是中文標點和任何字符之間都不用空格。
  3. 粗體斜體和鏈接要求同上,中文和英文粗體,英文和中文粗體之間也需要空格。
  4. 任何編程語言中出現的東西,比如變量名,類名,函數名,包名,以及命令行中出現的東西,比如命令,文件名,路徑,擴展名,都需要包在內聯代碼中。內聯代碼與漢字/標點之間無需空格,但和英文字母或數字之間空一格。
  5. 表格的格式容易亂,保證它們顯示正常。
  6. 標題和較短的列表需要特別校對。
  7. 有少量未翻譯的段落,使用谷歌翻譯之後再校對。

有用的正則表達式

鏈接:

(?<!!)\[[^\]]*\]

表格:

^\|

中文間空格:

中文間空格一般是翻譯引擎出錯的地方。

[\u4e00-\u9fff]\s+[\u4e00-\u9fff]

未翻譯段落:

^[a-zA-Z0-9][^\u4e00-\u9fff]+$
^\s*([\+\-\*]\x20{3}|\d+\.\x20{2})[^\u4e00-\u9fff]+$

內聯代碼:

在 Markdown 中,內聯代碼需要用反引號括起來,但一些教程並沒有這樣做。於是,需要檢查中英文邊界,將沒有用反引號括起來的內聯代碼改掉。

[\u2018-\u201d\u3001-\u301c\u4e00-\u9fff\uff01-\uff65]\x20*[A-Za-z0-9]|[A-Za-z0-9]\x20*[\u2018-\u201d\u3001-\u301c\u4e00-\u9fff\uff01-\uff65]

粗體/斜體:

\*\*[^\*]+\*\*|(?<!\*)\*[^\*]+\*(?!\*)

標題:

^#+\x20

列表(二十字以內):

短的列表由於沒有上下文非常容易出錯。

^\s*([\+\-\*]\x20{3}|\d+\.\x20{2}).{1,20}$

獎勵

校對者在完工後可以領取千字2~4元的獎勵(視難度和工作量而定),請聯繫飛龍(Q562826179,V:wizardforcel)。

字數統計遵循 word 標準:每一個漢字和標點算一個字,一個連續的英文字母、數字和標點序列算一個字。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章