2. 详述统计学指标的表达方式:
在研究结果中,对于描述性统计数据,我们需要明确其表示方法。对于计量资料,若呈正态分布,我们采用均值、标准差和标准误来表述;而对于非正态分布的数据,中位数和四分位数间距则是其合适的表达方式。计数资料和等级资料常以构成比(如4/15)和百分率(如63%)的形式出现,一般用n(%)来表示。
对于效应量指标,我们主要使用比值比(odds ratio,OR)及相对危险度(Risk Ratio,RR),并给出95%置信区间(confidence interval,CI)。例如,OR(95%CI)的数值范围为2.6(1.3-5.2)。
3. 统计学的分析方法:
3.1 计量资料的比较:
对于正态分布的计量资料比较,我们采用t检验。当数据满足正态性和方差齐性的条件时,我们可以进行两样本t检验(包括独立样本t检验和成组t检验)或配对样本t检验。后者适用于同一研究对象的前后比较,或两个配对的受试对象接受不同处理的比较。
对于非正态分布的计量资料,我们则采用非参数检验的方法,如Mann-Whitney U检验用于两组数据差异比较,而Kruskal-Wallis H法则适用于多组数据差异比较。
3.2 计数资料的比较:
对于计数资料的比较,我们主要采用χ2检验。根据样本大小和理论数的多少,我们会选择不同的χ2检验方法,如Pearsonχ2检验、校正Pearsonχ2检验、Fisher概率法等。
在等级资料的比较中,我们采用非参数检验法。如成组设计资料可使用Wilcoxon两样本比较法,而配对设计资料则采用符号秩和检验法进行比较。
3.3 相关与回归分析:
在进行相关分析时,首先绘制散点图,确定存在线性趋势后再进行相关性分析。正态分布的数据使用Pearson相关性分析,非正态分布或等级资料则采用Spearman相关性分析。
对于回归分析,我们包括线性回归和Logistics回归、Cox回归等。其中,线性回归适用于因变量和自变量均为连续且符合正态分布的情况。Logistics回归则用于因变量为分类变量的情况,包括二元Logistic回归和多元Logistic回归。Cox回归多用于生存分析,涉及风险函数比的计算。
在纳入回归模型的变量选择上,单因素分析后,应考虑将那些数据差异显著且与因变量关系密切的自变量纳入多因素回归模型进行分析。
4. 具体统计学方法应用举例:
在具体的研究中,我们可以这样描述数据。例如,采用SPSS 22.0软件进行统计分析。首先描述各研究中心的完成例数和病例脱落情况。然后,对入选患者的人口统计学特征和基线特征进行分析,比较试验组和对照组之间的可比性。计量资料采用均数、标准差、中位数、最小值和最大值以及上下四分位数进行统计描述。而对于计数资料,则以例数和百分比的形式进行统计描述。在具体的统计分析过程中,根据数据的特点选择合适的t检验、χ2检验或非参数检验等方法。相关性分析和回归分析时,根据数据的正态性选择Pearson相关分析或Spearman相关分析,并根据因变量的类型选择适当的回归分析方法。检验水准双侧α设为0.05。