如何成为数据分析师?这些技能需要必备!

什么是数据分析师?大乐透加码号码查询
数据分析师指的是不同行业中,专门从事行业资料搜集、整理、分析,并依据资料做出行业研究、评估和预测的专业人员。
他们知道如何提出正确的问题,善于资料分析,利用资料视觉化工具和资料呈现;辅助公司商业决策,帮助降低成本,提高收益,改进产品,留住客户,发现新的商业机会等。总的来说,根据资料分析师的级别,他们主要的工作内容可能包括以下:

与IT部门,管理部门,资料科学家(Data Scientist)合作,整合资料,决定整个公司的团队目标
从primary research和secondary research中收集提取资料
清理和选取资料,去除无关资讯
熟悉使用报表软体和其他技术分析和解读资料
总结资料里的趋势或相关性
为过程改进发现潜在机会并提出可行建议
提供准确的资料分析和视觉化报告
建立并管理维持资料库
修改程式码相关的问题
数据分析师的前景如何?
随著科技的发展,人类社会产生的资料规模呈指数级增长。每时每刻都有大量资料被产生储存下来,尤其在电子商务、网路游戏、社交网站、旅游、线上教育等领域。现在,全世界每天产生的新资料超过400万TB。资料分析师则成为当前炙手可热的职业之一。

必备技能TOP5,你不可以不了解!
要成为一名成功的数据分析师,需要的技能主要分为俩个版块:硬技能(包括掌握一些资料分析软体等)和软技能(良好的沟通能力和PPT能力)。

知识体系
这里面包括对统计学的基本了解和machine learning的认识,大部分对消费者的分析都离不开描述统计方法,如平均数、中位数、显著等。统计学是资料分析中至关重要的课程,不管是在业务方面发展还是在技术方面发展都需要重视资料分析工作,大家在学习统计方面知识的时候一定要学会里面的资料分析思维框架,这样才能够对日后的资料分析工作有很好的帮助。

计算机软体
对于数据分析师来说,可能每个项目的70%到80%的时间都是在收集和处理资料,他们需要首先想好需要什么样的资料,比如timeframe是一年还是十年。选定好需要的资料后要进入一个或多个数据库去收集资料,最后需要对资料进行一些处理,看看是不是有missing value或者outliers等等。

这个过程之后得到了可靠的资料,然后便进入到核心的资料分析。为了能更好的从资料里提取到需要的资讯,以下这些软体就是数据分析师们常用的。Querying language和statistical language主要是用来做一些初步的数据分析,例如可以出一些图表,看一下资料的分布,从而对资料有个了解。而scripting language则可以用于建模或者测试一下hypothesis。因此总的来说,这些软体对于数据分析师来说就像厨师的刀,是必不可少的工具。

查询语言(Querying Language)

如SQL、Hive和Pig,

指令码程式语言(Scripting Language)

如Python和Matlab,如果想更偏向于General purpose programming,最好还要学Python或者近年来发展迅猛的F#Dataquest 这个网站上提供了一系列和资料分析相关的python教程:

从python基本语法到data analysis的基本函数,
PANDAS包的使用方法,
machine learning里常用的Python指令,
甚至还有手把手教你玩Kaggle。
当然这个只是入门级教程,高阶技巧需要在实战项目里积累。

统计语言(Statistical Language)

如R和SPSS,就社群规模和质量与学习成本与前景,最好学R。

夯实基础程式设计语句。这一部分主要是R的最基础部分的学习,包括资料管理(向量、矩阵、资料框、字元串等的操作等)、数学计算与常见函数、阵列与矩阵操作的常用函数、逻辑运算、流程控制语句(if, else, while, for 等)

掌握基础统计模型与分析方法
学会运用视觉化工具,主要是学习ggplot2包
高阶R进阶:掌握一些厉害的package
资料图表(Spreadsheet)

如Excel和FineReport,对于刚刚入门的新手还是比较推荐从Excel入手,打好做报表的基础。Excel的功能很强大,但对于资料处理量并不是很给力,我是比较FineReport这样的报表工具去学习和实践的!理由很简单,以我自身的例子来看,很明显VBA只能解决少量的个体需求。而开发一款基于资料库的应用软体系统,需要写大量jsp/asp/php程式码,基于资料库的展示,查询和录入的网页。不仅开发效率不高,专案交付的维护工作量大,而且成本很高。

客观来讲,FineReport是操作简单却功能极其强大的工具。入门容易,升级难。在FineReport的知识层次中,每一个层次有很多级别。

操作:FineReport的使用技巧,按照大功能可分为资料表、图表、参数查询、资料填报、行动端、平台搭建、定时排程、部署整合。
扩充套件:FineReport外围但非常相关,主要是底层的资料处理,需要掌握的有资料库知识SQL语言、ETL等,前端的一些实现开发,需要掌握的是JS
开发:FineReport支援各类外挂,不满足的功能可以自己开发定制,需要掌握java

明确问题(Defining the Problem)
将分析范围缩小是很重要的技能。如何将复杂的问题去掉细枝末节,抓住重点需要良好的沟通能力和对商业需求的充分理解能力。注意:避免向客户递交太多对解决核心问题无用的资讯。另外,对公司和行业的了解也会使得这个过程更加得心应手。

了解听众(Knowing the Audience)
通常来说一个数据分析师需要面对PM和CEO。因此,在准备presentation时,要注意回答这两方关心的不同的问题。对于PM来说,需要的是简单无修饰,多干货介绍在各种情况下如何进行协作互动。而面对CEO,需要展示的是稍加修饰的PPT和最重要提供具体的建议。

另外很需要注意的一点是communication。很有可能资料分析师们面对的听众并不是有technical的背景,如何将很专业的术语转化为商业语言是十分重要的。而掌握一定的data visualization的技能便会在此时让展示更为有效。

强调结果(Delivery)
一定要有研究成果的展示,如果只是分析内容的步骤,而缺乏最后对成果的总结,将很有可能延滞项目的推进。对于公司或项目的管理者来说,分析的过程并不是他们最看重的,而分析的结果和针对这个结果有什么合理的建议或解决方法才是最让他们关注的,因此为了更为有效地推进项目,重点强调结果是十分必要的。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章