五、假设检验详解
假设检验是一种统计推断方法,它允许研究者对总体的某些参数或总体分布形式做出预先假设,然后利用从总体中抽取的样本信息来验证这个假设是否合理。这个过程本质上是在探究总体的真实情况与预先设定的假设之间是否存在显著的系统性差异。
一、提出假设
在进行假设检验时,首先需要提出原假设和备择假设。原假设通常设定总体参数等于某值或服从某种分布函数,而备择假设则是与原假设相互排斥的假设,二者不可能同时成立。
二、构造检验统计量与计算样本观测值
检验统计量是根据所抽取的样本计算出来的随机变量,用于检验原假设是否成立。一个有效的检验统计量应包含所要检验的总体参数以及在原假设成立的前提下已知的分布。
(1)当总体为正态分布且总体方差已知时:
检验统计量的构造基于正态分布的再生定理。只要总体变量服从正态分布,无论样本量n的大小,样本平均数都服从正态分布。经过标准化处理,可以得到相应的检验统计量。
(2)对于总体分布未知但总体方差已知且为大样本的情况:
此时可以利用中心极限定理。无论总体服从何种分布,只要其平均数和标准差客观存在,通过增大样本容量n,可以保证样本平均数近似的服从正态分布。样本容量越大,越接近正态分布。经过样本平均数的标准化处理,同样可以得到检验统计量。
(3)当总体分布和总体方差均未知但样本为大样本时:
在这种情况下,同样可以构造出相应的检验统计量。
(4)对于总体为正态分布但总体方差未知的情况(使用样本标准差S代替s):
当自由度t(n-1)大于30时,t统计量近似的服从标准正态分布。
三、确定显著性水平与拒绝域临界值
显著性水平是指小概率的标准,即“小概率事件在单独一次的实验中基本上不会发生”。在假设检验中,如果原假设正确的前提下,检验统计量的样本观测值属于小概率事件,则认为原假设不可信,从而否定它,转而接受备择假设。确定显著性水平和拒绝域临界值是进行假设检验的重要步骤,通常通过设定的临界值规则(如ta/2(n-1)或Za/2)来完成。
四、总体比率的假设检验
当样本容量达到一定程度时,样本比率P近似服从正态分布。此时可以进行总体比率的假设检验,包括确定原假设与备择假设、计算P值、构造检验统计量并得出观测值、确定临界值和拒绝域以及得出结论等步骤。
五、注意两类错误
在进行假设检验时,需要留意两类错误:弃真错误和取伪错误。弃真错误是指原假设事实上正确,但由于检验统计量的观测值落入拒绝域而否定了本应正确的假设。取伪错误则是与弃真错误相关的一种情况,涉及到对错误判断的另一种情况描述。在进行分析时需谨慎对待这两种可能的错误。