大數據系列之數據科學家

   雷布斯名言“站在風口上,豬也會飛起來”。近10年有個“數據”相關工種就是這個風口的“豬”,從崗位名稱的演變就可以看出來,數據倉庫工程師/爬蟲工程師=》大數據工程師;統計專員=》數據分析師; 算法工程師=》AI(人工智能)工程師,現在最牛逼的應該是“數據科學家”了,其實以上職位變更的不僅僅是名稱,背後的要求確實也在大幅提高的。
   今天要分析的就是最NB的崗位是“數據科學家”(估計很多人小時候的夢想都是長大之後當個科學家,原來科學家是這麼近的)。距離上篇系列文章已經過了1年多的時間了,今天也是因爲一個帖子觸發臨時寫的。
   數據科學家到底是幹啥的?想要成爲科學家,有什麼要求?待遇如何?那我們就來看看互聯網大廠他們招聘的數據科學家吧。

快手-數據科學家 25-50K·16薪

工作職責:
1、分析和挖掘海量數據,發現用戶行爲模式與規律;
2、優化用戶體驗,提升社區粘性;
3、通過數據分析和經濟運籌模型優化,爲公司不同的運營團隊制定目標和策略,關注落地結果。
任職要求:
1、熟練使用SQL,Python或R中進行數據分析、可視化呈現等;
2、具有統計學和概率論基礎,擅長數據分析。瞭解常見規統計機器學習模型及使用;
3、本科及以上學歷,理科,工科或者經濟學,有良好的邏輯思維能力;
4、目標導向,影響力驅動。對短視頻產品及相關業務場景有濃厚興趣;
【加分項】
1、有新用戶體驗用戶畫像、搜索等相關產品或研發經驗者優先;
2、對於計量經濟學在業界的應用有經驗者優先;
3、在機器學習、數據挖掘、經濟學或者運籌學的會議、期刊發表過文章有加分。

作者依據10+年數據工作經驗 崗位分析:

從工作內容來看快手的數據科學家側重於數據/業務分析角色,提出運營策略和建議
從工作要求來看也更側重於數據/業務分析,以及數據可視化(這也是大數據的一個細分崗位,前端開發的同學可以關注一下),只是該數據分析師在工具上要求更高Python或R,這也是目前數據分析師發展的一個趨勢,從excel=》數據庫sql=》Python或R,代碼能力要求越來越高,處理的數據量也越來越大。

華爲-數據科學家 30-60K·15薪

職位描述
1、對海量業務數據進行處理和分析,發現和跟蹤其中的問題。能夠從業務和產品的角度出發,利用數據發現產品、系統或是業務的瓶頸,並提出優化的方案;
2、跟蹤、監控模型及策略表現,建立模型策略評估體系和機制;
3、利用爬蟲技術,數據挖掘,機器學習等技術解決實際問題,比如實現模塊或流程自動化,業務報表系統的建設,離線數據流程的建設,數據可視化等;
4、建立各種業務邏輯模型和數學模型,幫助公司改善運營管理,節省成本。
任職要求
1、計算機、數學、統計相關專業優先,本科及以上學歷;
2、至少3年互聯網公司數據分析經驗;
3、熟練掌握Mysql、Hdfs、Hive數據庫使用,較強的數據庫及SQL能力,數據倉庫的ETL開發;
4、具備數據敏感性和探知慾、分析、解決問題的能力,能夠承受工作中的壓力,專注數據的價值發現和變現轉化;
5、工作認真、負責、仔細,有良好的團隊合作精神,良好的分析問題能力、溝通技巧及數據呈現能力。

作者依據10+年數據工作經驗 崗位分析:

從工作內容來看華爲的數據科學家包括數據分析、數據倉庫、數據挖掘、數據爬蟲等四方面的角色,要求還是非常高的,這樣的人業內非常少。
從工作要求來看,相對比較簡單,偏重於數據倉庫和業務瞭解。

滴滴-數據科學家 30-50K·15薪

職位描述
1、負責搭建業務策略的實驗分析評估體系。 範圍包括但不限於實驗監控日報、看板設計,以及實驗前,實驗中,實驗後的分析評估模板設計和優化迭代等; 實驗前協助業務方設計實驗標準及落地複雜科學的統計實驗, 實驗後幫助定價補貼和預算組驗證並量化評估策略迭代優化效果;
2、與定價補貼業務方合作, 綜合運用商業分析、統計分析以及機器學習等算法,從大數據中挖掘潛在價值空間,爲業務方制定實驗策略迭代作決策依據。
3、與業務方合作,構建業務監控的指標體系自動化系統,實現產品化;
4、幫助業務方解答重要的業務疑問,識別並量化業務問題的根源;
5、輔導和培養初級分析師。
任職要求:
1、專業要求,數學/統計/計量/機器學習或相關專業;
2、研究生及研究生以上學歷;
3、具有嚴密的邏輯思維能力,以及快速適應業務發展和變化能力;
4、具有互聯網行業數據分析、數據挖掘/建模5年以上工作經驗,BAT或海外背景優先考慮 ;
5、熟悉常用辦公工具word,excel,ppt等, 熟練掌握SQL語句,熟悉常用的統計分析方法,數據挖掘工具語言和算法,R,python,spss,sas,excel,VBA等, 包括邏輯迴歸,決策樹,GBDT,K-means聚類,神經網絡等;
5、具有較好的業務協調能力,能夠很快融入團隊;

崗位分析:

從工作內容來看滴滴的數據科學家側重於數據/商業分析角色,有一定的算法在裏面
從工作要求來看數據/商業分析、算法同等重要,但是這類人也比較少,因爲算法的基礎更加側重於數學理論,要求還蠻高的,對於業務的瞭解也是某個點比較深入,但是數據分析對於業務瞭解的廣度比較高,敏感度比較高。所以同時在廣度和深度都能做的比較好的人,其實還是很少的。

騰訊-數據科學家 30-45K

崗位職責:
1.您需要擅長以下的兩到三項: 主導數據產品的開發,包含數倉的建立、數據的挖掘、清洗以及建立智能決策引擎;
2.研究、建立業務指標體系,做數據分析來產生洞察從而支持人爲決策制定,最大化騰訊視頻的增長;
3.共建實驗平臺,提升實驗平臺的準確性和可用性;
4.建立機器學習模型來分析運營活動、廣告活動、return on content (ROC)、用戶獲取、激活、存留、 利用對業務、視頻、內容領域的理解,通過數劇挖掘、特徵工程建設、研究採用不同的算法來提升騰訊視頻各端推薦系統架構建設;
5.參與平臺數據科學功能建設,包含算法平臺中心構建算法模型標準化和不同場景接口標準化來給搜索、推薦、增長、數據挖掘等賦能。
崗位要求:
1、擁有統計學、數學、運籌學、經濟學、計算機科學等學科的本科或以上學歷;
2、2年以上數據、數據分析、數據工程、實驗和商業智能方面的應用經驗;
3、有挖掘數據、產生數據驅動的洞察,並通過洞察影響業務決策的經驗;
4、有使用SQL、R,Python,C/C++,Java等分析大型數據和建模的經驗。

崗位分析:

從崗位職責來看騰訊的數據科學家要求可能相對來說更含糊(科學)一些,作爲一個科學家必須要擅長數據產品、數據倉庫、數據清洗(爬蟲)、算法、數據分析裏面的2項。
從要求上來看也是跟職責匹配的。

京東-數據科學家 25-50K

職位描述
1、參與構建以客戶服務爲核心的人貨場基礎標籤體系,與業務部門密切合作,參與建設細分業務的算法解決方案。
2、負責基於海量數據上的數據挖掘和特徵工程,實現構建人貨場標籤的基礎算法開發和落地。
3、負責具體應用需求的數據建模部分,包括全流程的數據處理、數據分析、特徵工程、算法模型設計和效果評估。
4、負責針對當前業務問題場景,提供核心算法解決方案,對業務改進提出合理的調整或改進。
職位要求:
1、機器學習、數據挖掘等計算機或應用統計類碩士及以上學歷
2、具備數學、統計學、概率統計知識,熟悉常見的機器學習算法(貝葉斯,聚類,邏輯迴歸,SVM,GBDT,RF等)
3、具備優秀的架構設計能力,具備紮實的Python/R編程功底,優秀的開發、調試能力和數據建模基礎。
4、熟悉hadoop/hive/hbase、stom/spark等基礎平臺使用,熟悉主流機器學習框架如sktlearn/theano/tensorflow。
5、對數據敏感,具備獨立分析能力,有良好的邏輯思維和定義以及解決問題的能力
6、優秀的溝通協調能力和團隊精神,較強的學習研究能力、抗壓能力
7、有用戶畫像搭建的項目經驗者,或者參與過客服業務的數據挖掘項目的實施經驗者優先。

崗位分析:

從崗位職責來看京東的數據科學家更側重於算法工程師,很明確。
從崗位要求上來看也確實是算法工程師的要求。

綜合分析:

   通過分析上面5家大廠的數據分析職位來看,數據科學家職位基本上數據分析、數據倉庫、數據爬蟲清洗、算法/數據挖掘、數據產品等5個領域中的一個或者多個專家。這樣來說的話,我可以自封爲數據科學家了(O(∩_∩)O哈哈~)。其實從上面京東和快手的崗位來看,爲什麼是25k起步,因爲他只是一個領域的專家。
   個人觀點數據科學家至少是以上5個領域中的1個領域的大神,另外還要是2個領域方面的專家,而且+並且對業務有獨到的見解+趨勢判斷,這樣才能對得起小時候理解的“科學家”這三個字。
   數據分析、數據倉庫、數據爬蟲清洗、算法/數據挖掘、數據產品這幾個又是什麼鬼,可以參考以下系列文章。

系列文章

大數據崗位要求之數據測試
大數據崗位要求之數據挖掘
大數據崗位要求之大數據開發工程師
大數據崗位要求之數據產品經理
大數據崗位要求之數據分析師

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章