大數據崗位要求之數據挖掘

    繼續介紹大數據系列崗位的要求,今天是“最熱門”崗位數據挖掘,數據挖掘崗位的真正興起是隨着互聯網的發展起來的,主要是因爲互聯網行業數據包含的價值較大、數據類型較多(包括結構化數據、文本數據、語音、圖片等)、價值密度低等特點造就的。還是先從幾個大廠的崗位要求說起。

浙江執御

1、本科或碩士以上學歷,具備紮實的數學和計算機科學功底,以及堅實的數據挖掘和機器學習理論基礎;
2、2年以上用戶行爲分析及挖掘相關實戰經驗,熟悉但不限於分類/聚類,個性化標籤,屬性挖掘等領域;
3、熟悉Linux開發環境,具有良好的編程基礎,掌握C/C++/Java/Python等至少一門高級編程語言,會用SPSS、R等數據挖掘工具;
5、良好的溝通能力、邏輯思維能力以及學習能力;

螞蟻金服

1、計算機、數學、統計或相關專業本科及以上學歷,三年以上工作經驗,具備良好的溝通能力;
2、熟悉數據分析、數據挖掘算法模型,並有獨立完整的建模實踐經驗,較強的編碼/調試診斷能力,紮實的數據結構和算法功底;
3、熟悉實時和離線大數據處理經驗,有hadoop MR開發經驗,熟悉Hive,Spark,Storm,Kafka等大數據處理框架是加分項;

華爲

1、 數學、統計學、計算機以及運籌學等相關專業本科或以上學歷,5年以上工作經歷;
2、 熟練使用數據庫查詢語言如SQL、MySQL等;
3、 熟悉R、SAS、SPSS等至少一種相關分析軟件;
4、 掌握Python、Java等一種或以上編程語言;
5、 掌握數理統計和數據分析,掌握迴歸分析、分類、聚類、關聯規則等常用數據統計模型和挖掘技術,並有獨立完整的建模實踐經驗;
6、 邏輯思維嚴密,有很好的分析能力和報告展示能力,具備業務抽象、分解和標準化的能力;
7、 良好的語言溝通和表達能力,較強的自我驅動能力。

網易

  1. 重點學校碩士及以上學歷畢業,3年以上工作經驗,有大型互聯網公司從業經驗優先;
  2. 具備良好的編程能力和代碼風格,熟練掌握Java、Python、Scala等一門強類型語言,並至少掌握一門腳本語言;
  3. 熟悉機器學習常用算法,有文本挖掘、自然語言處理方面經驗者優先;
  4. 具有良好的分析問題和解決問題的能力,對解決具有挑戰性問題充滿激情,有較強的學習能力,並且能夠快速實現數學模型;
  5. 熟悉Hadoop/Spark分佈式大數據處理系統者優先

小影

  1. 計算機相關專業本科以上學歷,兩年以上數據開發挖掘經驗
  2. 對數據挖掘整個流程有所瞭解,對常用算法原理有深入理解,並且有實際使用經驗
  3. 有實際的數據挖掘項目經驗,包括但不限於:文本挖掘/個性化推薦/用戶畫像/廣告/圖像/語音等
  4. 熟悉Java/python開發語言,掌握hadoop/hive/odps/spark等大數據開發技術
  5. 有相關數據挖掘競賽完整的參賽經驗優先考慮,獲獎更佳!

能力三核模型分析

綜合結果如下

知識

1、本科及以上學歷(5)
2、數學、計算機、統計學等相關專業(4)
3、熟悉hadoop/spark/hive等大數據技術(3)
4、堅實的數據挖掘和機器學習理論基礎(2)

硬技能

1、2年及以上工作經驗(3)
2、掌握分類、聚類、迴歸分析、機器學習等常規算法,並有建模經驗(5)
3、掌握數據分析(2)
4、掌握java、python、scala等一種開發語言(4)
5、熟悉實時和離線大數據處理(1)

才幹or軟技能

1、較好的溝通表達能力(2)
2、較強的學習能力(2)
3、較強的邏輯思維能力(2)
4、較強的自我驅動力(1)

個人經驗

    數據挖掘工程師另外一個叫法是算法工程師,一般大家區分的不是很嚴格,其實算法工程師是大數據崗位中系分最多的,比如機器學習、自然語言處理、視覺算法、推薦算法、語音算法等,特別是近2年AI大火,也促使了這些細分領域的快速發展,所以算法工程師一夜之間都變成了AI工程師,人才需求量和待遇也是直線上升。
    但是一般中小公司都沒有這麼多財力與物力(數據)做這麼多細分領域的投入與研發,更多的是基於自己業務在某一領域的發展。而算法同學更多的是直接使用現有的算法包,通過不停的嘗試特徵變量或者嘗試不同的算法包來提升效果並達到業務目標,這點本身並沒什麼不妥,只是大部分算法的同學將這2點看做是提升業務目標的核心手段,而忽視了本身對業務現狀與問題點的分析,因此事倍功半。

系列文章

大數據崗位要求之數據倉庫
大數據崗位要求之數據產品經理
大數據崗位要求之數據分析師
大數據崗位介紹-引子(能力三核模型)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章