本文以SPSS软件为工具,运用多因素Logistic回归模型,对disease的潜在独立危险因素进行筛选分析。disease作为因变量,其状态以1代表患病,0代表健康;而自变量则包含六个变量,其中age、bmi、testa和testb为数值型变量,均被设置为Scale;为二分类变量,work为多分类变量,分别被设置为Nominal。
经过单因素Logistic回归的初步筛选,若age、bmi、testa、testb、及work均表现出统计学意义(p值小于0.10),则将这些变量纳入多因素Logistic回归分析中。
操作流程如下:
- 将数据从Excel中导入SPSS,并设定好数据类型。
- 在SPSS界面中,点击Analyze,选择Regression分析,再选择Binary Logistic回归模型。
- 在Logistic回归对话框中,将disease选入Dependent变量框,其余变量选入Covariates框。
- 鉴于work为多分类变量,需设为哑变量,并以work=1作为参照类别。
- 通过Categorical按钮进入设置,在Logistic回归:Define Categorical Variables对话框内,将work选入Categorical Covariates框。在右下方,将Reference Category更改为first,并点击Change按钮确认。成功后,Categorical Covariates框内会显示work(indicator(first))。
- 进入Options设置,勾选CI for exp(B)后点击Continue。
多因素Logistic回归的主要结果包括比值比(OR值)、95%的可信区间以及P值。尤其要注意Sig.列出的p值、Exp(B)所代表的OR值以及95% C.I. for EXP(B)所表示的OR值的95%可信区间。
本文分析结果显示,testa和testb的p值均极低(小于0.001),对应的OR值分别为1.126和15.133,这提示我们testa和testb可能是disease的独立危险因素。
深入探讨:
当将单因素Logistic回归中具有统计学意义的变量纳入多因素分析时,需警惕变量间可能存在的共线性问题,因为这可能导致结果出现异常。那么,我们应如何检测和处理多重共线性问题呢?欢迎在评论区留下您的见解和答案。
火热报名中!
14天小白变统计高手训练营(升级版)现正接受报名:
- 每期课程于月初开班,中途加入者将跟随课程进度学习,未学内容可于下期补上。
- 即使一期未能学完,也可参加下期课程继续学习,直至完全掌握为止。
- 训练营学员在课程结束后将加入专属的小白训练营统计群,共同构建一个高质量的统计与科研学习交流平台。
课程内容概览:
本课程涵盖变量编码、缺失值处理、异常值检测、正态性检验、多种假设检验方法(如t检验、方差分析)、非参数检验、卡方检验、精确概率法、相关性检验等统计方法的学习。我们将以每天一课的形式,轻松掌握一个统计方法。
想要了解更多课程内容及详情,请在公众号后台回复“小白训练营”。