数据分析进阶之路

      博者本人一路从统计走来,从最初的年幼无知到现在无比的后悔,多多少少也是有点心路旅程的人,再此记录下,并且推荐一些干货,以供学弟学妹们参考。

     首先,说说统计学的就业趋势,笔者亲身体验,近年来难度以指数形势增加,因为随着机器学习以及人工智能的告诉发展,涌现一大批算法工程师跟我们抢饭碗,计算机学院的,算法搞不过,程序搞不过,唯一的突破口在于分析能力,这楼主也是亲身体验的,前任天池队友两个都是计算机的,对于特征构建只会怒怼,当然不排除还有很多那种分析能力也很强的算法大佬,哎~满满都是泪。

数据分析师

一般任职要求如下:(图片来源于实习森招聘)





  这些都是比较基础的数据分析工作,只要求你掌握excel,sql就OK,小点的公司sql甚至都没有要求,大点的话可能还对R或python有些要求,其实这类工作基本就是画画图,统计一下,写篇报告,适合不想太累,想偏运营方向的求职者,也不要求你是统计出身,毕竟excel大家都会,SPSS也特别简单。

  但如果你有不甘于做这么简单的活的觉悟的话!,数据挖掘欢迎你,这比数据分析又进阶了一下,看看数据挖掘岗位的要求:

数据挖掘




  咦~~,这个时候你会发现要求技能变多了,hadoop,spark出现了,linux也来了,机器学习方法也会出现一下,当然这只是博主随便找的两家,不能概全,但是也可以说明那么一丢丢问题,当你工资变高的时候,职位变厉害的时候,对你自身技能要求也会变高,通常会在面试时考察你更多更广的知识,这时候你就需要看更多的书,做更多的项目让面试官对你满意,否则,请返回上面职位。数据挖掘技能掌握之后呢,想要更高的工资,追求更远大的理想怎么办,答案是去抢别人饭碗~~

算法工程师(机器学习算法工程师,nlp算法工程师,图像处理算法工程师)

  听上去牛逼哄哄的有木有,这个职位缺失很牛逼,而且这一般是计算机专业的工作,但是工作不分专业,谁优秀谁来干,这个职位工作比较辛苦,近年来也是越来越火,要求是越来越高,通常拿些好学历+好技术能进去,但你没有好学历有好技术也ok,毕竟咱不以学历论英雄,但你要是没有学历又没有技术,你就只能等着哭哭了。




 这时你可能发现了要的可能是计算机专业的学生,不怕,照怼,技术在手,天下我有,不过你要学的就更多了,机器学习,深度学习,自然语言处理,推荐系统,c语言,hive等等,对编程要求也会高很多,笔试一般都有很多在线编程题,限制时间、空间复杂度,算法题那可不是一般脑子能轻易做的,leetcode,剑指offer了解下,要知道基本方法,方能游刃有余。

     其实,在技术方面的工作相对哪些金融业没有那么注重学历,只要你有技术,BAT照收啊,前提是你要有技术,哪些技术呢,太多啦,首先编程语言:R,python,你不精通一门敢说自己是搞数据分析的,SQL你不精通你敢说你会读数据,这些都是最最基本的啦,对了,还有excel,spss,SAS那种最简单的所谓的“数据分析”岗位也有再招,这种的话估计就是统计一下报表,谢谢报告,画画图之类的,如果你有更长远的目光,那么hadoop,spark之类的你要了解,mapreduce框架,scala语言你都要知道,推荐系统只是你要知道,数据结构你要懂,最好能会点c语言,hive你也要懂,机器学习方法(svm,xgboost)啊,hin重要啊,有萌友们可能觉得好像跑偏到计算机那边去了,有这种感觉就对了,机器学习方法他们也很喜欢用,但实际上是我们统计人创始的,当然,谁能用的更好谁就赢咯,在此说明一下机器学习方法,调包大家都会!!!,所以你不止要会调包,你要懂原理啊,你要懂得应用场景啊,这才是王道,不要问我怎么知道的~实习面试了解下! 还有深度学习啊,hin重要啊,各种各样的神经网络,会推啊!,各种框架,tensorflow哇,kereas啦要知道哇,然后nlp方向啊,hin重要啊,wordvec2,LDA啊也要知道啊,总知,虽然笔者也不太了解,但也是尽力在逼自己了解啊,不学的话,失业了解下~

      其次,你有技术了,你知道方法了,你懂得推导了,你要学会应用,那么就开始实战吧,各大平台的一些比赛

     (1)首推,kaggle,谷歌收购了,许多职业大佬,会有很多开源供学习

     (2)国内的话,比较大型的是天池大数据竞赛,阿里的,一年一度的IJCAI非常有含金量啊,获得好的名字,阿里直通哦,还有KDD这种偏推荐的,也很有名气,平时也有很多新人练习赛,比如说o2o预测大赛可以参加,另外腾讯也会有广告算法大赛(这年头,广告推荐只会越来越火),京东也会有,奖金非常丰富,而且还有诱人的实习机会,

     好,推荐书环节

      机器学习相关:《机器学习》周志华,《统计学习方法》李航,《机器学习实战》

      python相关:《利用python进行数据分析》

      推荐系统:《推荐系统实践》,《计算广告》

      数据结构:《大话数据结构》

      深度学习:《深度学习》

      C++:《C++ Primer Plus 》

      hadoop,spark:《大数据Spark企业级实战 》,《hadoop实战》

      linux:《鸟哥的Linux私房菜 基础学习篇(第三版)》

      面试:《剑指offer_名企面试官精讲典型编程题》

哈哈,百度云链接附上,喜欢纸质的某宝买:

链接:https://pan.baidu.com/s/15NYrYgskR5j5kTaSgr8Z9A 密码:sa16


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章