↑↑↑點擊上方藍字,回覆資料,10個G的驚喜
前篇:
大家好,我是老胡
週末趁看奧運會的功夫翻了一遍《數據科學工程實踐——用戶行爲分析與建模、A/B實驗、SQLFlow》這本書,測評如下:
1、這是一本數據分析方面的書,主要介紹初學者不太重視的內容——以商業場景爲導向的量化方法論。說起數據分析,很多同學的入門首選是《用Python進行數據分析》,它專注於Python編程、類庫、工具的使用,十分經典。但是商業理解和方法論方面涉及很多經驗性的東西,不如數據技術那麼通用,相關的書都很難寫。這本書最大亮點是提供了實戰場景和整套的分析思路,案例不像其他書那麼空洞。我個人重點看了第二部分關於實驗設計和分析技術的內容,重溫了很多知識。
2、這本書作者居然有十幾個,都是來自騰訊、滴滴、快手等一線互聯網企業的數據科學家、數據分析師和算法工程師。作者人數比章節數還多,很好奇他們是怎麼配合的,反正感覺章節之間特獨立,有點跳躍。
3、第三部分(10-12章)主要介紹了SQLFlow和機器學習方面的內容,沒有仔細看。
“SQLFlow是由滴滴數據科學團隊和螞蟻金服合作開源的一款鏈接數據和機器學習能力的分析工具, 旨在能夠抽象出從數據到模型的研發過程, 同時配合底層的引擎適配及自動優化技術, 使得具備基礎SQL知識的技術人員也可以完成大部分的機器學習模型訓練,預測及應用任務。
”
SQLFlow在“AI平民化”理念之上的探索性實踐,感覺不太完善(就是用SQL跑機器學習模型),遠沒有達到他們的願景。SQLFlow肯定是有應用場景的,只是我沒用過,也沒仔細研究。單從學習角度,沒發現降低了學習門檻,大家瞭解一下就行了,沒必要放太多精力。copy了一段代碼和其工作原理,大家感受一下。
SELECT * FROM iris.train
TO TRAIN DNNClassifer
WITH hidden_units = [10, 10], n_classes = 3, EPOCHS = 10
COLUMN sepal_length, sepal_width, petal_length, petal_width
LABEL class
INTO sqlflow_models.my_dnn_model;
總結:數據分析入門和從業者,值得一讀。
推薦閱讀
(點擊標題可跳轉閱讀)
老鐵,三連支持一下,好嗎?↓↓↓
本文分享自微信公衆號 - 機器學習算法與Python實戰(tjxj666)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。