數據分析進階之路

      博者本人一路從統計走來,從最初的年幼無知到現在無比的後悔,多多少少也是有點心路旅程的人,再此記錄下,並且推薦一些乾貨,以供學弟學妹們參考。

     首先,說說統計學的就業趨勢,筆者親身體驗,近年來難度以指數形勢增加,因爲隨着機器學習以及人工智能的告訴發展,涌現一大批算法工程師跟我們搶飯碗,計算機學院的,算法搞不過,程序搞不過,唯一的突破口在於分析能力,這樓主也是親身體驗的,前任天池隊友兩個都是計算機的,對於特徵構建只會怒懟,當然不排除還有很多那種分析能力也很強的算法大佬,哎~滿滿都是淚。

數據分析師

一般任職要求如下:(圖片來源於實習森招聘)





  這些都是比較基礎的數據分析工作,只要求你掌握excel,sql就OK,小點的公司sql甚至都沒有要求,大點的話可能還對R或python有些要求,其實這類工作基本就是畫畫圖,統計一下,寫篇報告,適合不想太累,想偏運營方向的求職者,也不要求你是統計出身,畢竟excel大家都會,SPSS也特別簡單。

  但如果你有不甘於做這麼簡單的活的覺悟的話!,數據挖掘歡迎你,這比數據分析又進階了一下,看看數據挖掘崗位的要求:

數據挖掘




  咦~~,這個時候你會發現要求技能變多了,hadoop,spark出現了,linux也來了,機器學習方法也會出現一下,當然這只是博主隨便找的兩家,不能概全,但是也可以說明那麼一丟丟問題,當你工資變高的時候,職位變厲害的時候,對你自身技能要求也會變高,通常會在面試時考察你更多更廣的知識,這時候你就需要看更多的書,做更多的項目讓面試官對你滿意,否則,請返回上面職位。數據挖掘技能掌握之後呢,想要更高的工資,追求更遠大的理想怎麼辦,答案是去搶別人飯碗~~

算法工程師(機器學習算法工程師,nlp算法工程師,圖像處理算法工程師)

  聽上去牛逼哄哄的有木有,這個職位缺失很牛逼,而且這一般是計算機專業的工作,但是工作不分專業,誰優秀誰來幹,這個職位工作比較辛苦,近年來也是越來越火,要求是越來越高,通常拿些好學歷+好技術能進去,但你沒有好學歷有好技術也ok,畢竟咱不以學歷論英雄,但你要是沒有學歷又沒有技術,你就只能等着哭哭了。




 這時你可能發現了要的可能是計算機專業的學生,不怕,照懟,技術在手,天下我有,不過你要學的就更多了,機器學習,深度學習,自然語言處理,推薦系統,c語言,hive等等,對編程要求也會高很多,筆試一般都有很多在線編程題,限制時間、空間複雜度,算法題那可不是一般腦子能輕易做的,leetcode,劍指offer瞭解下,要知道基本方法,方能遊刃有餘。

     其實,在技術方面的工作相對哪些金融業沒有那麼注重學歷,只要你有技術,BAT照收啊,前提是你要有技術,哪些技術呢,太多啦,首先編程語言:R,python,你不精通一門敢說自己是搞數據分析的,SQL你不精通你敢說你會讀數據,這些都是最最基本的啦,對了,還有excel,spss,SAS那種最簡單的所謂的“數據分析”崗位也有再招,這種的話估計就是統計一下報表,謝謝報告,畫畫圖之類的,如果你有更長遠的目光,那麼hadoop,spark之類的你要了解,mapreduce框架,scala語言你都要知道,推薦系統只是你要知道,數據結構你要懂,最好能會點c語言,hive你也要懂,機器學習方法(svm,xgboost)啊,hin重要啊,有萌友們可能覺得好像跑偏到計算機那邊去了,有這種感覺就對了,機器學習方法他們也很喜歡用,但實際上是我們統計人創始的,當然,誰能用的更好誰就贏咯,在此說明一下機器學習方法,調包大家都會!!!,所以你不止要會調包,你要懂原理啊,你要懂得應用場景啊,這纔是王道,不要問我怎麼知道的~實習面試瞭解下! 還有深度學習啊,hin重要啊,各種各樣的神經網絡,會推啊!,各種框架,tensorflow哇,kereas啦要知道哇,然後nlp方向啊,hin重要啊,wordvec2,LDA啊也要知道啊,總知,雖然筆者也不太瞭解,但也是盡力在逼自己瞭解啊,不學的話,失業瞭解下~

      其次,你有技術了,你知道方法了,你懂得推導了,你要學會應用,那麼就開始實戰吧,各大平臺的一些比賽

     (1)首推,kaggle,谷歌收購了,許多職業大佬,會有很多開源供學習

     (2)國內的話,比較大型的是天池大數據競賽,阿里的,一年一度的IJCAI非常有含金量啊,獲得好的名字,阿里直通哦,還有KDD這種偏推薦的,也很有名氣,平時也有很多新人練習賽,比如說o2o預測大賽可以參加,另外騰訊也會有廣告算法大賽(這年頭,廣告推薦只會越來越火),京東也會有,獎金非常豐富,而且還有誘人的實習機會,

     好,推薦書環節

      機器學習相關:《機器學習》周志華,《統計學習方法》李航,《機器學習實戰》

      python相關:《利用python進行數據分析》

      推薦系統:《推薦系統實踐》,《計算廣告》

      數據結構:《大話數據結構》

      深度學習:《深度學習》

      C++:《C++ Primer Plus 》

      hadoop,spark:《大數據Spark企業級實戰 》,《hadoop實戰》

      linux:《鳥哥的Linux私房菜 基礎學習篇(第三版)》

      面試:《劍指offer_名企面試官精講典型編程題》

哈哈,百度雲鏈接附上,喜歡紙質的某寶買:

鏈接:https://pan.baidu.com/s/15NYrYgskR5j5kTaSgr8Z9A 密碼:sa16


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章