《數學之美》筆記

文字和語言VS數字和信息


信息的榮冗餘是信息安全的保障。

羅塞塔石碑上的內容是同一信息重複三遍(埃及象形文字、埃及的拼音文字和古希臘文),因此只要有一份內容完好保留下來,原有的信息就不會丟失。

語言的數據:語料。

語言的數據,我們稱之爲語料,尤其是雙語或者多語的對照語料對翻譯至關重要,它是我們從事機器翻譯研究的基礎。


瑪雅人的太陽紀

幾乎所有文明都是採用十進制,二瑪雅人採用的是20進制,因此瑪雅人一個世紀,他們稱作太陽紀,是400年,2012正好是這個太陽紀的最後一年,2013將是新的世紀的開始


阿拉伯數字是印度人發明的

古印度人發明了包括0在內的10個阿拉伯數字,他們由阿拉伯人傳到歐洲後,迅速得到普及。只是歐洲人不知道這個是印度人發明的,因此把功勞給了阿拉伯人。阿拉伯數字的革命性不僅在於它的簡潔有效,而是標誌着數字和文字的分離。


自然語言處理--從規則到統計

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章