资料运算阶段分作初阶与进阶,初阶的运算有很多软体
都可以协助处理,像是EXCEL的枢纽分析,可以快速的
帮忙整理大量的资料,算出平均数与标准差等数值,资
料输出后也可以进行排序,非常方便。或者像资料库--
MSSQL之类的软体,可以利用写程式的方式来「捞」资料
,再依据各种需求来做资料整理、排序、转置及合并等
等。资料库软体对操作上百万笔的资料时特别有效率,
但使用门槛较高,不如Excel那么人性化。539走势图
初阶的功能加以组合模组化,就可形成进阶的套装软体
,譬如在EXCEL中有许多的「方程式」(function)可用来
进行资料处理,但是这些「方程式」是零散的、独立的
(初阶),如何整并成可套用于一种(或多种)常见状
况的组合型「方程式」呢?只要巧妙的组合10种左右常
用的EXCEL「方程式」威力就相当惊人,再配上巨集以及
一点Visual Basic语法的魔咒,「一键式」的资料处理
功能呼之欲出。但是这个阶段要模组化真正的关键在于
:要对资料型态有正确观念,有好的分类才能做出最有
效益的模组,一般软体工程师脑中数值型态与学过统计
的人数值四大分类不太一样,integer与float的分类跟
Nominal与Interval的分类毕竟是不一样的。也难怪微软
每天忙著更新版本,但都没有更新加强这么重要的统计
模组,也许…是他们忙著与「水果」搏斗,没时时间想
那么多吧。
阶段三:资料统计分析
基础的资料运算完成后距离资料统计分析还差一大步,
把资料整理好但是如何顺利的让电脑做统计分析呢?电
脑是笨的但服从性高(指令让它做甚么,它从不漏做),
人是聪明的但服从性低(常因为思想出小差而犯人为性
错误),那如何让两者结合之后产出正确而有效率的结
果呢?答案非常抽象,但是也非常明确,那就是「问出
一系列的好问题」,让聪明的人回答,让服从性高的电
脑根据回答结果来执行分析。
「不懂统计的人就无法享受统计分析美好的结果」,这
就是统计艺术停滞的根本原因(反观不懂电脑与网路的
人却每天在上网用电脑喔,让我们在心理默默的感谢微
软),但是不懂统计的人却是可以在短时间内被教育而
了解自己需要(或想要)什么样的结果(统计结果)。
这个阶段的设计有点像是迷宫游戏,先教育使用者了解
迷宫的出发点与终点,然后用一系列的好问题引导他从
起点走到终点,这就是资料统计分析模组化的唯一方法
,巧妙的点在于:问出最精确的问题,走最快的道路,
得到最正确的结果。
阶段四:结果呈现
在结果呈现有两个重点,第一个重点是自动汇整出「要的
」结果,第二个重点是让阅读者轻易了解或是让报告者更
轻松的说明统计结果。所谓「要的」结果一定是预设的,
所以如何决断哪些是要的结果肯定是经验的产物,好消息
是这些原则并不会短时间内大幅度改变。像是以前我们有
为国内某个大车厂做过产品调查的季报,他们会希望每次
结果呈现都把分数最高的前三名列出来,列在每张表或是
图的前面,这就是一种需求与一种原则,只要有原则让电
脑自动筛选整理出结果是绝对没问题的。至于第二个重点
就更是艺术了,我举Xcelsius软体来说明会更好体会,这
个软体能协助我们制作出动态的统计图表。如下图所示,
当我们的滑鼠移动到上方圆饼图的不同区块时,下方的长
条图也会随之改变,这样一来我们可以很清楚且轻松的表
达不同区块内发生的变化与差异。当然这只是「让阅读者
轻易了解」其中的一个环节,总体而言,图表化、摘要式
、口语化、编排流畅性…还有很多地方可以下手来强化,
需要各种的人才一起来参与。