文中涉及的很多知識都與數學有關,由於我數學水平有限,未能理解,因而在讀書筆記中未做摘錄。其中包括:
1.隱含馬爾可夫模型、
2.布爾代數
3.圖論
4.TF-IDF
5.有限狀態機和動態規劃
6.餘弦定理
7.非對稱加密算法
8.最大熵模型
9.布隆過濾器
10.馬爾可夫鏈
11.貝葉斯網絡
12.條件隨機場模型
13.維特比算法
14.期望最大化算法
15.邏輯迴歸模型
16.分治算法
1.成爲一個領域的大師有其偶然性,但更有其必然性。其必然性就是大師們的思維方法。
2.簡單性和模塊化是軟件工程的基石;分佈式和容錯性是互聯網的生命。
3.“有正確設計思想方法的技術”未必能夠成功,因爲還有其非技術性的因素,但“沒有正確設計思想方法的技術”一定失敗,無一例外。
4.任何事物的規律性是內存的,並不隨它的載體而改變。
5.數學的精妙之處就在於簡單的模型可以幹大事。
6.我們要搞清楚一件非常非常不確定的事,或是我們一無所知的事情,就需要了解大量的信息。相反,如果我們對某件事已經有了較多的瞭解,那麼不需要太多的信息就能把它搞清楚。所以,從這個角度來看,可以認爲,信息量就等於不確定性的多少。
7.信息的作用在於消除不確定性。
8.我一直認爲,一個人想要在自己的領域做到世界一流,他的周圍必須有非常多的一流人物。
9.大多數時候,很多的歷史偶然性背後有着它必然的原因。
10.技術分爲術和道兩種,具體的做事方法是術,做事的原理和原則是道。
11.在工程上簡單實用的方法最好。
12.先幫助用戶解決80﹪的問題,再慢慢解決剩下的20﹪問題。
13.許多失敗並不是因爲人不優秀,而是做事情的方法不對,一開始追求大而全的解決方案,之後長時間不能完成,最好不了了之。
14.計算機不必學習人的做法,就如同飛機不必像鳥一樣飛行。
15.一個正確的模型一開始可能還不如一個精雕細琢過的錯誤模型來的準確,但是,如果我們認定大方向是對的,就應該堅持下去。
16.要保留全部的不確定性,將風險降到最小。
17.最大熵原理指出,需要對一個隨機事件的概率分佈進行預測時,我們的預測應當滿足全部已知的條件,而對未知的情況不要做任何主觀假設。
18.語言和文字作爲通信的編碼手段,一個重要目的是幫助思維和記憶。
19.錯誤的模型終究是遠離真理的,其負面影響會漸漸表現出來。其結果不僅僅在於遠離了正確的結果,而且常常把原本簡單的事情弄得很複雜,以至於最終要崩潰。
20.正確的理論和方法有一個被認識的過程。任何事物都有它的發展規律,而這些規律都是可以認識的。