《數據科學家訪談錄》總結·2


01 - 05:DJ Patil, Hillary Mason, Pete Skomoroch, Mike Dewar, Riley Newman 06 - 10:Clare Corthell, Drew Conway, Kevin Novak, Chris Moody, Erich Owen 11 - 15:Eithon Cadag, George Roumeliotis, Diane Wu, Jace Kohlmeier, Joe Blitzstein


  1. Clare Corthell “開源數據科學高手”課程創建者 教育經歷:斯坦福大學·學士 職業經歷:Mattermark數據主管
  • 與衆不同之處

在斯坦福的專業是科學技術與社會學,完全是靠自學掌握了數據科學。是一個主動學習能力非常強,很有恆心的人。

  • “開源數據科學高手”地址(注:好資料!)

http://datasciencemasters.org/ https://github.com/datasciencemasters

  • 推薦《集體智慧編程》一書

“每一次我打開它的時候,總有一些新的知識會跳出來,並且我也越來越理解有關整合用戶想法的東西。那本書成了我的基石,我用它來衡量我取得的進步。它絕對是數據科學家的“聖經”。”

  1. Drew Conway 《Machine Learning for Hackers》共同作者 數據科學韋恩圖創建者 教育經歷:計算機科學與政治科學雙學位,紐約大學政治學博士 職業經歷:IA Ventures,Project Florida數據主管
  • 數據科學韋恩圖
  • 爲什麼要讀博士?

遇到了職業天花板。在紐約讀博期間創建了data kind,並與Mike Dewar和Hilary Mason結識。

  • 講故事的能力

“其實大部分數據科學家所做工作中的一大部分都不是數據整理或者建模或者編程,而是一旦你做出了一個結果,你必須要想辦法將結果解讀給那些完全不具備看懂這個圖所必需的技能的人聽,例如那些做商業決定或者工程決策的重要人物。”

  • 比較紐約和硅谷

紐約資源配置更加集中。

  • 選擇Python還是R?

“他們想要學習Python或者R但是不確定哪一個更好,我告訴他們不要猶豫,直接選一個深深地紮下去就行。”(注:我覺得還是Python生態好)

  1. Kevin Novak 教育經歷:密歇根州立大學核物理博士,研究方向迴旋加速器,主要工作是用統計方法去對核交互作用中的理論模型建模,然後用加速器裏跑出來的數據來驗證模型是否正確。 職業經歷:Uber數據科學主管
  • Uber數據團隊構成

Uber數據團隊中的每個人幾乎都是來自非傳統的行業背景的。他們過往差不多都在做各自不同的東西。

  • 數據科學包括什麼?

其中一個概念就是“大數據”,海量的數據經過處理分析被提取出數學化的結論。另一個概念就是高度專業化的預測建模。

  • 數據科學必備技能

數學、統計學、計算機科學。

  • 數據科學的前景

傳統的數據領頭羊公司專注還是社交數據,Uber用於解決物流問題的方法也可以推廣到一切統籌問題。其它的還包括,分析基因組、健康領域。

  1. Chris Moody 教育背景:加州理工學士,本科物理學;加州大學聖克魯斯分校博士,研究方向計算天文學(注:Chris從本科開始就與天文學打交道)。 職業經歷:Square,Stitch Fix。
  • 自學

“我的一大部分軟件工程技術,甚至於整個計算機科學知識,都是完全自學的。我沒有上過任何那個領域的正式課程。”

  • 數據科學意味着什麼?

“總體上來說,它意味着你對數據進行計算的方式,能夠有能力對數據進行解讀,對數據進行建模,並且最重要的就是,有能力用數據的內在意義去與別人溝通交流。”

數據科學大概可以分爲兩個板塊:描述分析和預測分析。預測分析型數據科學家需要一些有關於機器學習的知識,而描述型的數據科學家應該需要一些統計學知識。

  • 相比於優秀的數據科學家,卓越的數據科學傢俱有怎樣的素養?

“我覺得可能是溝通交流方面的技巧。你必須要有能力去將你做的東西講出來給別人聽。”

“編程能力不會是最重要的能力。”

  1. Erich Owen 教育經歷:Albion文科學校學士·數學物理(注:原書這裏翻譯成立自由藝術學校,囧),布朗大學碩士·應用數學 職業經歷:Quid、Newsle、Facebook
  • 大學時代最應該做的事

去做實實在在的東西,建立網站或者完成一些項目,寫更多的程序。

  • 在Facebook的工作

主要工作是搭建全棧系統,也做機器學習。

  • 相較於一般的數據科學家,是什麼品質讓那些卓越的數據科學家得以脫穎而出?

紮實的編程基本功和系統的思維能力是最爲重要的。

  • 數學的作用

舉例,低通路的過濾器去過濾這一批數據,“數模轉換”概念對於研究社交數據的作用;奇異值分解;隨機映射。

  • 關於學習

“我覺得根據我多年的本科和研究生經歷,我做的最爲有用的事情就是我一直在不斷地在學習,並且我是爲了求知而學習,因爲我真的對於學習很有興趣。”

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章