(七) 假设检验
一个问题
一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重8.5kg以上。为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如下表:
在 的显著性水平下,调查结果是否支持该俱乐部的声称?
我们怎么来回答这个问题呢?
考虑一下上面的表格,换一种表现形式如下(样本差值计算表):
下面计算差值均值和差值标准差:
由此我们得到了结论:有证据表明该俱乐部的宣称是可信的。
看了半天天书,这是什么?这就需要从假设检验的基本思想开始了。
统计学语言用一个等式或不等式表示问题的原假设。
在这个问题中用表示原假设,就是:: ;那么用 表示备择假设。即如果原假设不成立,就要拒绝原假设,而需要在另一个假设中作出选择,这个假设称为备择假设。在这个例子中表示为::。
原假设与备择假设互斥,肯定原假设,意味着放弃备择假设;否定原假设,意味着接受备择假设。
是我们要检验的参数。
是显著性检验水平,在这个问题中:
两类错误 (错误和错误)
对于原假设提出的命题可以用原假设成立或者原假设不成立来表述。当然,我们是根据样本提供的信息进行判断的,也就是由部门来推断总体。因而判断有可能正确,也有可能不正确,也就是说,我们面临着犯错误的可能。所犯的错误有两种类型:
第一种错误类型:原假设为真,却被我们拒绝了,犯这种错误的概率用 表示,所以也称为 错误或者叫做弃真错误。
第二种错误类型:原假设为假,却没有被我们拒绝,犯这种错误的概率用 表示,所以也称为 错误或者叫做取伪错误。
当原假设为真,我们却将其拒绝,犯这种错误的概率用 表示,那么,当 为真,我们却没有拒绝 ,则表明作出了正确的决策,其概率自然为 ;当原假设为伪,我们却没有拒绝,犯这种错误的概率用表示,那么,当为伪,我们拒绝,这也是正确的决策,其概率为 。总结如下:
项目 | 没有拒绝 | 拒绝 |
为真 | (正确决策) | (弃真错误) |
为伪 | (取伪错误) | (正确决策) |
在假设检验中,大家都在执行这样一个原则,即首先控制犯 错误原则。
假设检验中犯两类错误的图示。
假设检验的步骤:
- 提出假设
- 确定适当的检验统计量
- 规定显著性水平
- 计算检验统计量的值
- 作出统计决策
作出统计决策:
- 计算检验的统计量
- 根据给定的显著性水平,查表得出相应的临界值或, 或
- 将检验统计量的值与 水平的临界值进行比较
- 得出接受或拒绝原假设的结论
左单侧检验和右单侧检验
左单侧检验(下限检验)
右单侧检验(上限检验)
双侧检验
假设检验
假设检验(Hypothesis Testing),又称统计假设检验,是用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。显著性检验是假设检验中最常用的一种方法,也是一种最基本的统计推断形式,其基本原理是先对总体的特征做出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受做出推断。
假设检验的基本思想是“小概率事件”原理,其统计推断方法是带有某种概率性质的反证法。小概率思想是指小概率事件在一次试验中基本上不会发生。反证法思想是先提出检验假设,再用适当的统计方法,利用小概率原理,确定假设是否成立。即为了检验一个假设是否正确,首先假定该假设正确,然后根据样本对假设做出接受或拒绝的决策。如果样本观察值导致了“小概率事件”发生,就应拒绝假设,否则应接受假设 。
假设检验中所谓“小概率事件”,并非逻辑中的绝对矛盾,而是基于人们在实践中广泛采用的原则,即小概率事件在一次试验中是几乎不发生的,但概率小到什么程度才能算作“小概率事件”,显然,“小概率事件”的概率越小,否定原假设就越有说服力,常记这个概率值为α(0<α<1),称为检验的显著性水平。对于不同的问题,检验的显著性水平α不一定相同,一般认为,事件发生的概率小于0.1、0.05或0.01等,即“小概率事件” 。
常用的假设检验方法有Z检验、t检验、卡方检验、F检验等。
假设检验的基本原理
用t分布、区间估计中区间事件的余集是小概率事件和小概率原理,得出了检验统计量t的数值及拒绝域,在样本有代表性时,用统计量t和拒绝域可得出检验的更好决策。该方法称为t检验使产品质量检验由大样本被小样本替代。
基本步骤
1、提出检验假设又称无效假设,符号是;备择假设的符号是。
:样本与总体或样本与样本间的差异是由抽样误差引起的;
:样本与总体或样本与样本间存在本质差异;
预先设定的检验水准为0.05;当检验假设为真,但被错误地拒绝的概率,记作α,通常取α=0.05或α=0.01。
2、选定统计方法,由样本观察值按相应的公式计算出统计量的大小,如X2值、t值等。根据资料的类型和特点,可分别选用Z检验,T检验,秩和检验和卡方检验等。
3、根据统计量的大小及其分布确定检验假设成立的可能性P的大小并判断结果。若P>α,结论为按α所取水准不显著,不拒绝,即认为差别很可能是由于抽样误差造成的,在统计上不成立;
如果P≤α,结论为按所取α水准显著,拒绝,接受,则认为此差别不大可能仅由抽样误差所致,很可能是实验因素不同造成的,故在统计上成立。P值的大小一般可通过查阅相应的界值表得到。
需要注意的问题:
- 作假设检验之前,应注意资料本身是否有可比性。
- 当差别有统计学意义时应注意这样的差别在实际应用中有无意义。
- 根据资料类型和特点选用正确的假设检验方法。
- 根据专业及经验确定是选用单侧检验还是双侧检验。
- 判断结论时不能绝对化,应注意无论接受或拒绝检验假设,都有判断错误的可能性。
更多的 参数估计和假设检验的计算题,请点击我的另外一篇博文:https://blog.csdn.net/seagal890/article/details/105757800