《深入淺出數據分析》讀後感

好久沒有更新讀書系列的文章了,今天推薦的這本《深入淺出數據分析》是一本非常適合數據分析行業入門的讀物,以章回小說的方式由淺入深地講述數據分析從業人員要用到的方法,從實際案例出發,告別晦澀難懂的概念。文章末尾有關於這本書的知識圖譜總結。

深入淺出系列,同系列的還有《深入淺出統計學》、《深入淺出Python》、《深入淺出SQL》等,當然這本書讀完以後強烈建議接着讀《深入淺出統計學》,加深對數據分析和統計學的理解和鞏固。

作者:[美] Michael Milton
豆瓣評分:7.5
出版日期:2012年
推薦指數:5顆星

 

數據分析的流程

第一章講述了數據分析的流程,從提出問題到做出決策,中間的過程具體到每一步,和我們現在一直在強調的流程其實大差不差,數據是無處不在的,如何將原始數據轉變成推進工作的妙策,這是數據分析師們努力的目標。

實驗:檢驗你的理論

這一章以一個咖啡店銷量下降爲引子,找出原因並給出提高銷量的方法。這裏用到了統計與分析最基本的比較法和觀察法,分析出引起銷量下降的原因,同時對各種策略進行實驗,找出最有效的策略。

最優化:尋找最大值

很多時候我們想要最大限度地達到目標,就需要最優化的思路,這一章通篇都在講述如何實現最優化問題,通過構建目標函數,並繪製圖形,得到可行區域,其實就是高中數學的知識點,只不過這本書裏將它講的更加細化,它是假設讀者幾乎沒有什麼數學基礎來寫的這本書,所以在讀的過程中,你會發現其實一個很明瞭的數學公式他都要講半天,這樣的好處是,當初可能我只是死記硬背了公式,但現在我可以看到它背後的原理。

 

假設檢驗、貝葉斯統計、主觀概率

當我們需要用複雜多變的數據來預測未來時,不能只着眼於眼前表面的數據,而要通過仔細推理,評估大量備選答案,假設檢驗最核心的還是證僞法,通過數據分析的整理,評估備選答案,整合信息。這本書裏關於假設檢驗的講解比較淺白了,目的是讓大家理解假設檢驗在實際案例中的應用,如果想要更深入地理解,還是要閱讀《深入淺出統計學》這本書。

貝葉斯規則是利用基礎概率和波動數據解決直接概率問題的方法,這裏也引申出了一個強相關的知識點:條件概率,概率的問題從我們上學起就一直在學,但它真的運用到實際生活中到底是怎樣的呢?這本書裏舉的人們患某種流感的陰性、陽性、假陰性、假陽性的概率的例子就很通俗易懂,也很符合當下實際。

 


下一章主觀概率(信念數字化),看標題也很好理解了,主觀概率就是將嚴謹融入直覺的簡便方法,其實這一章主要講的是如何利用標準偏差評估數據分佈,以及如何修正主觀概率。

 

直方圖、迴歸、誤差、關係型數據庫

後面幾章開始講解直方圖的製作、通過迴歸分析法預測某些結果值、指出預測的誤差範圍以及關係型數據庫的基本概念。其中一個預測加薪幅度的例子簡明扼要地講解了相關性、散點圖、迴歸線、外插法、殘差、迴歸線的均方根誤差等概念,最後做出了一個比較完美的加薪模型。

 


這本書很厚,有48萬字,但可讀性很強,因爲都是以實際案例開頭,講述一個概念,個人覺得挺適合想要轉行的文科生閱讀的,我也做了一個本書知識點的總結,如下圖所示:

 

圖片可能被壓縮,如需高清大圖可加我微信:data_cola

圖片可能被壓縮,如需高清大圖可加我微信:data_cola


系列文章:
爲什麼要學統計學:赤裸裸的統計學

高手都是怎樣用圖表的:《用圖表說話》

一圖看懂《對比Excel,輕鬆學習Python數據分析》

猜你喜歡:
數據分析實戰:母嬰商品分析

《吊打分析師》實戰—我要租個好房

簡單的Excel數據分析案例

爲什麼要學統計學:赤裸裸的統計學

成爲數據分析師的第三年,我寫了10W字

@ 作者:可樂
@ 公衆號/知乎專欄/頭條/簡書:可樂的數據分析之路
@ 個人微信:data_cola

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章