什麼是數據科學家,數據工程師與數據分析師

與其他一些相關工程職位一樣,數據科學家的影響力與互聯網同進同退。數據工程師和數據分析師與數據科學家攜手共同完成這幅“大數據時代”鉅作。他們共同努力擬定數據平臺要求,基礎和高級算法,提供數據分析和展示所需的可視化工具,並將價值創造以易於理解,富於見解的方式反饋給其他部門。

數據科學家是什麼樣一個存在呢?

通常情況下,數據科學家有數學或物理方面的高等學位。有博士學位的情況並不少見,碩士學位僅是一個前提條件。數據科學家精通統計建模以及如何構建與定製高級數學算法。這既在他們專業範圍內,也是他們所擅長的地方。我聽到過有人這樣形容一個數據科學家“軟件工程技能牛過多數人的酷炫統計學家”。但是,當你問這些數據科學家怎麼會從事這個職業時,途徑是多種多樣的。這是一個相對較新的職位,因而我們也無法根據時間歷史來追蹤一個數據科學家專業技能是如何進步的。數據科學家和數據工程師的定義有點相互重疊。

除了研究先進算法,數據科學家對AB測試親力親爲並且擁有博學的多變量測試和實驗設計知識。一個專業能力非常強的數據科學家能在模型建成後對其進行改進和改制,而能力鶴立雞羣的數據科學家則能根據你的商業問題定製合適模型。

數據工程師如何定義呢?

數據工程師一般被定義成“深刻理解統計學科的明星軟件工程師”。如果你正爲一個商業問題煩惱,那麼你需要一個數據工程師。這些夥計就是那些能提供可建模數據所需平臺的人。他們的核心價值在於他們藉由清晰數據創建數據管道的能力。充分了解文件系統,分佈式計算與數據庫是成爲一位優秀數據工程師的必要技能。

數據工程師對演算法有相當好的理解。因此,數據工程師理應能運行基本數據模型。商業需求的高端化催生了演算高度複雜化的需求。很多時候,這些需求超過了數據工程師掌握知識範圍,這個時候你就需要打電話尋求數據科學家的幫助。

數據分析師如何理解呢?

數據分析師能洞悉一個方程式的商業意義。他們知道如何提出正確的問題,非常善於數據分析,數據可視化和數據呈現。不管是給另一個數據分析師還是C級執行做演講,數據分析師都是數據提取,模式識別以及從大量數據中洞察問題方面的能手。

如果你或者你的公司正考慮順應這股大數據浪潮的發展,你應該從明確你想利用大數據解決所面臨的商業問題處下手。接着找出你真正的需求:是數據採集,檢索,倉儲還是數據分析?然後編寫相應的職位描述並做好準備,爲了在這場大數據遊戲中脫穎而出,你可能需要僱傭不止一個人。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章