《女士品茶》讀書筆記

書的名字來源於統計學史上著名事件,也就是假設檢驗的原型:費希爾對一位聲稱自己能夠分清午茶是先加奶還是先加茶。

書的主要內容不是統計學的各種公式,而是各種公式、定理的來由,以及其發現者的故事。

簡單地,做一下今天所看內容的筆記:

卡爾·皮爾遜,19世紀90年代,英國皇家統計協會的成員,在當時的統計學界很有威望,出身居然不是理學,而是政治學 。讀完碩士之後,迷上馬克思,而他後來差不多是傾向共產主義,著作有《科學的語法》(應該是本很有意思的書,拉進書單地幹活)。

而相比較之下,費希爾,出現的比較晚,起碼晚於皮爾遜,這導致了他在當時的一些權威統計學期刊上不得志(也就是不能登自己的文章)。皮爾遜的“專業”、“權威”地位只是一方面原因,我覺得,更多地是,表達能力的問題。費希爾是個超高度近視眼,這使得他少年時期不得深夜讀書,於是數學老師基本只能把數學書唱給他聽。。而這恰恰培養了他的邏輯、幾何抽象能力,之後費希爾在幾何方面牛刀小試,而後做數學研究,可謂是高產。不過,可悲地是,無人欣賞--因爲看不懂,這還真是腦子太先進的弊端:配不上週圍豬一樣的隊友。他的思考能力強 表達能力弱 不僅體現在這些高深的科研之上,還有他後來的教學生涯:他常常會被學生不明白一些很簡單的 他自己說的 ,應該沒別的人這麼想  東西而氣得不輕……(估計,做他的學生也是件苦力活。。)再說,費希爾的其他方面,學霸級的人物,劍橋高材生,與之相連的,還有法西斯主義,也許有點妄言,但起碼有類似的傾向:參與優生學(大概就是資助窮人的話,會助力他們繁衍後代和中產階級的後代爭奪資源,這樣代復一代之後,“壞基因”越來越多,而“好基因”漸漸消亡)……這麼聰明的腦子,怎麼就這麼想不開呢。。寫點統計學相關的東西吧,給大牛皮爾遜,皮爾遜看不懂,轉身給了大牛戈塞特,戈塞特也看不懂,於是只能投稿在一些不怎麼出名的農學、生物學雜誌上,有些居然還是費希爾本人自掏腰包才肯刊登,簡直暴殄天物。後來,一位瑞典數學家 克拉默 發現了費希爾的研究作品(主要是二戰期間,國國(除了瑞典吧)都忙着打仗,這位瑞典人與國際科學界失聯 沒人玩了),開始研究費希爾研究的東西,發現有些正是當時科研人所作的。所謂,寫《紅樓夢》是一個工程,寫完之後讀《紅樓夢》又是另外一個工程。沒得辦法,誰讓克拉默不早點遇見費希爾,這樣就可以像霍金那樣 活着的時候就能做科學界的巨人…

卡爾·皮爾遜和費希爾二位大牛老是鬧不和,不過,科研人怎麼能夠張口就罵人呢?於是二人一致採取在自己的刊登文章中指出對方的錯誤的手段,宣泄不滿  共話統計學的發展 。這麼下去,倒也不會引發戰爭,但是,矛盾還是需要調解員的,這個調解員就是大牛戈塞特。

在吉尼斯釀酒公司工作時,戈塞特思考如何優化釀酒所需的酵母菌數量,發現了酵母菌的繁殖符合泊松分佈。值得注意的是,泊松分佈並不是第一次出現在人們面前,只是大家不太能找到什麼事件是符合泊松分佈的。不過,這家公司禁止員工發表論文,擔心會泄露公司的經營祕密。於是,戈塞特只好給自己取個筆名“學生”,發表在《生物統計》上。

《生物統計》是高爾頓、皮爾遜、韋爾登三人創辦的一個期刊,令我驚訝的是,統計之初不是爲商業,而是爲生物。高爾頓原本計劃研究人類智力的發展,奈何沒有評價智力的指標,就把目標轉向了人類身高上,也就是著名的父子身高的平均迴歸。皮爾遜他們創建該期刊,是爲了給同胞達爾文的進化學說提供理論支持。後來,高爾頓和韋爾登接連辭世,《生物統計》自然就是皮爾遜的囊中之物了。

戈塞特的t檢驗,明顯特徵是小樣本。塞戈特經常自己動手計算統計量,不覺地想到我考統計課程的時候,拿着計算器,算幾遍都算不對的囧  つ﹏⊂ ,深諳這當中的不容易啊,雖然是小樣本(粗略說,大概是30個樣本觀測值以下)。

皮爾遜提出偏斜分佈的概念,偏斜分佈由四個數值確定,分別是均值(觀測值分佈的中間值)、標準差(大多數觀測值相對於均值的分散程度)、對稱度(觀測值偏向均值一邊的程度,我覺得,大概就是教材上的偏度吧)、峯度(罕見觀測值相對均值的分散程度)。這一思想的提出,將過去科學以確切的實物爲研究對象,轉變成描述觀測的事物隨機性的數學函數。果然,就像馬爺爺說的那樣,人類對事物本質的認識是呈螺旋式上升的。

南丁格爾,一位女統計學工作者(這是在這本書中不多出現的),稱自己是小人物,對着皮爾遜、費希爾、戈塞特等等這些大牛,稱自己是小人物或許也是一件很驕傲的事吧🤔🤔

內曼,年少時深深崇拜着勒貝格(就是發明勒貝格積分的那位),有朝一日終於遇見了勒貝格,卻被其冷冷對待甚至可以說是無禮,於是之後內曼先生的教人寫書活動中處處充滿着友好、和藹的意味,這麼想勒貝格也是教會了內曼點什麼……只是方式不太恰當。

柯爾莫哥洛夫,聽名字這麼長就知道是位俄國數學家,再看結尾是-夫-就知道是位男數學家。在印象中,他大概是這本書裏出現的繼費希爾之後的第二位數學天才。其貢獻在於奠定了概率論的理論基礎,並給出合理的解釋,這麼說似乎是很籠統……反正是個很偉大的人。

列昂惕夫提出投入-產出模型,將矩陣引入實際問題的解決中,奈何矩陣逆的計算是項“錘鍊靈魂的儀式”(書裏的原話),好在和佛的計算機出現了,不過,那羣會計謹遵上級指示,不肯給服務型消費報賬(比如花錢讓哈佛的計算機給矩陣求逆這種服務是不能報賬的),再三協商之下,開出一張“像哈佛購買一個逆矩陣”的單子才得以完成報賬。(這裏也有個名人似乎是漢森,就是抽樣調查 書裏的那位)

圖基,這位美國大佬,似乎距離現在並不很遠,但是他的發明卻出現在各個行業、領域,比如******記不清了***後面再補

 


施蒂格勒誤稱定律:大概意思是一般地,一個定律如果選一個科學家的名字命名,那麼這個定律很有可能並不是這個科學家所發現的。比如,高斯分佈、泊松分佈,洛必達法則貌似也是

未完待續……

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章