从商务数据的角度,因子分析犹如一把深挖洞悉的钥匙,以降维之理念,将复杂多元的关系抽丝剥茧,转化为几个综合因子。这种统计方法在多个领域如生物学、心理学、医学、气象、地质和经济学等中,随着计算机技术的进步,正被广泛运用。
学习这一内容,您将明了因子分析的基石及路径,领悟其步骤和过程;在SPSS Statistics 24.0软件的辅助下,掌握其实操方法;并结合实例解析,对因子分析有更深的理解和把握。
一、因子分析之总述
1. 因子分析的概念与原理
因子分析由Thurstone于1931年首次提出,其思想源自于Karl Pearson和Charles Spearman等人的智力测试统计分析。这种方法正是借助降维的思想,对众多变量间的内在联系进行研究,探寻观测数据的基本结构,并用少量抽象的变量来揭示数据的核心结构。
简而言之,因子分析是一种以显性变量为媒介来度量抽象因子的统计分析方法。
其核心价值在于用较少的相互独立的因子反映出原有变量的绝大部分信息。
式(1)是因子分析的数学表达,也可用矩阵形式来呈现。
这里所提及的因子是数学模型的关键部分,因它们贯穿于每个原有变量的线中,因此被称作公共因子。
这些因子可被理解为高维空间中相互垂直的坐标轴。
通过因子分析的数学模型,我们可以引入几个相关概念,它们对于我们理解因子与原有变量间的关系、确定因子的重要性以及评估因子分析的效果有着重要意义。
(1) 因子载荷:
在因子模型中,因子载荷的大小直接反映了变量与因子之间的紧密程度。
(2) 变量共同度:
若因子载荷矩阵已知,那么每一行元素的平方和就代表变量共同度。如果大部分原有变量的共同度较高(如超过0.7),则说明所提取的因子能反映原有变量的大部分信息(如70%以上),这表明因子分析的效果良好。
变量共同度是评价因子分析效果的关键指标。
(3) 因子的方差贡献:
因子的方差贡献表示该因子在解释总方差时的重要性。值越高,相应因子的重要性越大。
参考文献:
樊重俊等所著的《基于SPSS的商务数据分析方法》以及何晓群的《多元统计分析》均是该领域的经典之作,值得深入研究与参考。