让我们来深入探讨一下中介和调节的概念。
调节变量对XY关系的影响力
调节是指一种统计过程,其中第三个变量(Z)会影响到X与Y之间的关系。这也就是说,X对Y的影响不是直接固定的,而是依赖于第三个变量Z的存在和变化。
具体来说,X与Y的关系会因Z的不同水平而有所不同。
中介变量的作用
相对而言,中介则是指一个变量(M)在X与Y之间起到了桥梁或解释的作用。换句话说,X的影响通过M传递到Y,M解释了X和Y之间关系的一部分或全部。
常见的一个中介模型是X影响M,M再影响Y。
有调节的中介模型
更进一步,有调节的中介模型则在中介关系中引入了第四个变量(例如Z),这个变量能够调节整个中介作用。这意味着中介因子的作用被Z所影响,而且这种调节可以发生在中介路径的任意一条上(如a路径、b路径或c'路径)。
这种模型更加复杂,但能够帮助我们更深入地理解变量之间的关系。
今天的主题就是利用R语言来构建并分析一个有调节的中介模型。
实例说明
以研究生学习为例,我们假设学习时间(X)与毕业offer的数量(Y)之间存在关系,而这个关系被发表的文章数量(M)所中介。
那么问题来了,这个中介关系会不会受到学习效率(Z)的调节呢?这就是我们今天要解决的核心问题。
按照以下规定来设定变量:
- X为自变量,代表学习时间
- Y为因变量,代表offer的数量
- M为中介变量,代表文章的数量
- Z为调节变量,代表学习效率
在进行数据分析前,因为学习时间和学习效率之间存在交互项,所以这两个变量需要中心化以避免多重共线性。
数据分析步骤
准备好数据后,我们开始使用mediation包进行分析。基本流程是跑两个回归,类似于四步回归法。首先观察总效应,然后看自变量对中介变量的效应,再控制中介变量看自变量的直接效应。但因为是有调节的中介模型,所以在做回归时需要加入调节作用。
结果解读
通过分析两个模型的输出结果,我们可以判断中介效应是否存在。进一步地,为了了解调节变量是如何调节中介路径的,我们需要在不同水平上分析中介关系的变化。
例如,我们可以以一个标准差的距离为界,划分调节变量的不同水平,然后分析在这些不同水平上中介作用的差异。
低水平和高水平的中介作用
在调节变量低水平时,我们可以看到中介作用的直接效应和间接效应都有显著意义。而在高水平时,同样可以看到这两种效应的显著性。
值得注意的是,通过对比不同水平的图示,我们可以观察到间接效应在不同水平上可能存在差异,这可能意味着调节变量确实调节了某些路径。
进一步检验
为了验证这种差异,我们需要对不同水平下模型的中介间接效应和直接效应进行检验。如果发现间接效应在不同水平上有显著性差异,而直接效应没有差异,那么就可以说在高效率的学生中,学习时间通过影响文章发表数量对offer数量的影响更大。
结语