分位数图——即分位数-分位数图(Quantile-Quantile Plot),常被简称为Q-Q图。它是一种重要的数据分析工具,用于确定两组数据是否来自共同分布的总体。
本文将详细介绍Q-Q图的构成及其应用,让我们一起开始这段探索之旅。
01 分位数的概念与计算
分位数,即将概率分布的范围划分为概率相等的连续区间,或以相同方式划分样本中的观测点的值。这是数据分析的基础,尤其对于四分位、十分位和百分位的了解尤为重要。
四分位的计算方法:假设有9个数据,需先进行升序排列。例如,1.1、3.2、4.1等数据排好后,可求得其四分位数。
其中,第一四分位数的求法:共有9个数据,第一四分位的秩为(9+1)/4=2.25,说明第一四分位数位于第2个和第3个数据之间。而具体的数值,可通过特定方法求得。
类似地,可以推导出第二四分位数(即中位数)及其他四分位数的计算方法。
02 Q-Q图的绘制与解读
Q-Q图由横轴(X轴)和纵轴(Y轴)组成,分别代表两组样本的数据。图中的点不表示实际分位数,而是以各组数据单位来绘制的。判断两组样本数据是否来自相同总体的依据是:若Q-Q图中的所有点落在一条直线上或非常靠近,那么可以认为两组数据具有相同的分布。
为了更具体地说明,我们可以举三个示例来说明不同情况下的Q-Q图:两个标准正态分布的Q-Q图、标准正态分布与正态分布的Q-Q图,以及正态分布与指数分布的Q-Q图。通过这些实例,我们可以更直观地理解Q-Q图的运用。
03 正态概率图及其参考线
正态概率图是Q-Q图的一种特殊形式,主要用于判断某组数据是否服从正态分布。
正态概率图的纵坐标不再是样本数据的单位,而是样本中数据占整个样本的百分比,即累计概率。其特点是刻度不是等分的,在百分比为50%的刻度处密集,越远离则刻度越稀疏。
为了更准确地判断,我们可以利用Minitab或Excel等工具来计算累计概率和理论Z值,并据此绘制红色参考线。
04 识别数据的偏态性
通过正态概率图,我们还可以识别数据的偏态性。如果数据呈现右偏形状,那么其在Minitab中绘制的概率图会显示向右弯曲;反之,左偏数据则会显示向左弯曲。
这一特性对于理解数据分布、进行数据分析及做出决策都至关重要。
本文详细介绍了Q-Q图、正态概率图及其应用,希望能够帮助大家更好地理解和运用这些工具。也推荐大家加入小林的知识星球「卓越质量笔记」,获取更多质量管理相关的知识和经验。