正态分布的特性和表达由其两个关键参数μ和σ²所决定。对于任何遵循N(μ,σ²)分布的随机变量X,通过特定的式1变换(即随机变量的标准化),都可以将其转换为μ值为0,σ值为1的标准正态分布形式。
公式1
当μ和σ的具体值未知时,我们可以利用样本的均值x-和标准差s对数据进行标准化处理,即按照式2进行转换。
公式2
在实际应用中,z变换的运用能够将问题从求解任意正态分布曲线下面积的问题,转化为求解标准正态分布曲线下相应面积的问题。附表提供了标准正态分布曲线下z值左侧尾部的面积。通过此表和标准正态分布,我们可以推算出原始变量X在任意区间内的概率值。
由于标准正态分布曲线以0为中心,左右两侧呈现出完美的对称性,因此表中仅列出了z值的负数部分。当z值大于0时,其概率值可通过Φ(z)=1-Φ(-z)进行计算。
若要计算z值位于(z1, z2)区间的概率,可利用公式P(z1<z<z2)=Φ(z2)-Φ(z1)进行求解。
关于标准正态分布曲线下面积的示意图,它为我们提供了直观的视觉参考,帮助我们更好地理解正态分布的特性。
若X遵循N(μ,σ²)分布,我们可以计算X值落在区间μ±1.96σ范围内的概率。首先进行标准化处理,得到X对应的z值,然后通过公式1进行计算。
查阅附表1可知,X的取值在区间μ±1.96σ上的概率确实为95%。
附表1中记录了相关信息。
考虑一个实例,某地共有140名正常成年男子的红细胞计数数据,这些数据近似服从正态分布。已知其均值Xˉ为4.78×10¹²/L,标准差S为0.38×10¹²/L。我们试图估算:
(1)该地正常成年男子中,红细胞计数低于4.0×10¹²/L的个体占当地正常成年男子总数的百分比。
(2)红细胞计数处于4.0×10¹²/L至5.5×10¹²/L之间的个体占当地正常成年男子总数的百分比。
为了估算在特定区间内的人数占比,我们可以将其转化为求解相应正态分布曲线下面积的问题。
(1)将X=4.0代入公式2后,我们可以将问题转化为求标准正态分布中z值小于-2.05的概率。查阅附表1得知Ф(-2.05) = 0.0202,这意味着该地成年男子中红细胞计数低于4×10¹²/L的个体约占2.02%。
(2)分别计算X1=4.0和X2=5.5所对应的z值后,我们可以得知红细胞计数在4.0×10¹²/L至5.5×10¹²/L之间的个体约占该地正常成年男子的95.04%。