数据分析服务体系的分享

随着大数据领域的发展逐步进入应用阶段,数据价值的实践也在各行各业中不断深入,认知和经验也在持续积累。数据分析也渐渐地从原来业务人员的附属技能逐步演化成了一个独立的职业。但这一切都没有改变数据分析的实质,从散乱的数据中获取有效的信息,在实际业务中将信息转化为价值。现在,我们从数据中获取有效信息的能力随着大数据领域的发展有了质的提升,能够面对的运营决策问题也更加深入,数据分析过程也越加错综复杂,因此,与软件服务类似,数据分析也在演化为专项服务,逐步形成属于它的服务体系。立足近年来的数据分析实践,围绕命题、业务和数据三者之间的关联和矛盾,以数据分析的过程环节为主线,跟大家分享一下初步构建的数据分析服务体系。

数据分析服务体系是由数据分析产品和数据分析服务两部分组成。其中,产品是服务的支撑,服务是产品的源头,两者相辅相成,要在服务中充分发挥产品价值,在产品中有效积累服务成果,形成一个系统的完整体系。它致力于四个方面,一是明确数据分析服务的过程,解决数据分析工作该怎么干的问题;二是规范数据分析服务输出物,解决数据分析工作干成什么样的问题;三是提高数据分析成果的质量,解决数据分析项目如何干的更好的问题;四是降低数据分析服务的成本,解决曾经的“坑”依然在“坑”的问题。

数据分析产品就是数据分析服务体系的“仓库”,按照数据分析的特点划分了6个“仓位”,包括知识库、软件库、工具库、经验库、资产库和案例库。其中,知识库主要存放数据分析相关的由权威机构发布的理论知识,例如经典数据、官方文档等等;软件库主要是在实践中检验出的第三方开发的优秀软件或中间件,例如Tableau、SPSS等;工具库主要是针对具体问题的自主开发的工具或脚本,特点是拿来即用,例如数据拆解工具等;经验库主要是积累分析过程中的最佳实践,例如模板、规范和解决方案等;资产库存放的是数据分析资产,而分析过程中可视为资产的只有原始数据和模型;案例库中存放数据分析项目的完整过程资料,以辅助数据分析过程的持续优化。不积跬步,无以至千里;不积小流,无以成江海。数据分析服务体系以数据分析产品为载体,不断地熔炼每次数据分析服务中的各种精华,加以消化和吸收,实现自我的完善和成长,进而提升数据分析服务的品质。

数据分析服务是一个以“数据”主体、以“业务”为核心、以“探索、分析”为主要工作内容的“增量迭代”过程。该过程以命题、业务和数据为基础,有分析负责人、业务负责人和数据负责人三个责任主体。按照责任主体的变化,分析过程可分为需求分析、数据采集、数据分析和报告核对4个阶段,共12个主要任务项。

第一,需求分析阶段的责任主体是分析负责人,核心目标是明确客户需求、数据需求以及数据获取途径。一般包含3项工作,包括整理分析方案、组织现场调研和梳理数据需求;5个核心输出物,包括《数据分析方案》、《需求调研记录表》、《数据需求表》、《数据分析项目通讯录》和《数据跟踪表》。

 第二,数据采集阶段的责任主体是数据负责人,核心目标是根据《数据需求表》和《项目通讯录》协调相关干系人,获取并验证数据的可用性,探查数据特征,优化并确认《数据分析方案》。过程中,根据实际情况调整《数据跟踪表》和《项目通讯录》,做好过程(问题)记录;主要的输出是获取的原始数据、数据库模型、验证脚本及结果、沟通记录及《问题跟踪表》,同时,会完善《数据跟踪表》、《项目通讯录》和《数据分析方案》。该阶段的沟通协调工作比较繁杂,而这个阶段需要“解释” 清楚为什么“用户期望是那样”而“我们最终做成了这样”演化过程?

第三,数据分析阶段的责任主体是业务负责人,目标是按照“客观”、“可追溯”的原则,建立分析数据到分析结论的通路,并进行数据可视化,最终形成数据分析报告。核心工作包括数据处理、数据可视化和报告编写三部分;输出物包括数据处理脚本、数据可视化模型、数据分析过程结果、数据分析报告以及反馈给业务用户的分析数据。数据分析报告要交代清楚分析的背景、分析使用的数据、数据处理的过程以及数据分析的结论。所有数据分析的结论都是有前提条件的,脱离了具体环境的数据分析结论是没有意义的。

第四,报告研讨阶段是分析、数据和业务多方融合的阶段,目标是讨论确定报告终稿和收集报告反馈并答疑。业务专家的深度参与是报告成功与否的关键因素,而报告反馈及答疑过程会让我们的分析报告与实际业务有效地融合,发挥实际作用。分析报告中分析负责人决策分析点、数据负责人提供原始数据、业务负责人负责业务规则,而最终的数据分析结论是数据推导出来的。讨论过程中可以重选分析点、更换数据、调整规则,但不能直接调整分析结论。而报告讨论阶段可能会出现更换原始数据重新分析的风险。

综合数据分析服务过程,我们认真研究学习专业领域业务,但不取代业务客户做业务决策;深入探索验证数据获取逻辑,但不取代系统厂商做数据决策;全面分析发掘数据特征规律,但不取代分析客户做分析决策。我们只是数据内容的搬运工和数据客观规律的发现者,在这里我们能创新的只有工具、方法,我们没有权利修改数据和创造规律,时时刻刻保持对数据和客观规律的敬畏是我们可以用数据立身的底限!

数据分析服务成果除了直接生成案例库之外,还会沉淀资产库,扩展工具库和经验库、优化软件库和知识库。把个人的优秀变成团队的优秀,让工作的基础从个人的能力变成组织的积累。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章