值R2是用于量化模型拟合优度的一个指标。
它是一个介于0.0和1.0之间的分数,无单位。分数越高,表示模型对数据的拟合程度越好。
当R2值为0.0时,意味着最佳拟合曲线对数据的拟合程度并不比基于所有Y值的平均水平线更好。这种情况下,X对Y的预测几乎没有帮助。
而当R2值达到1.0时,所有的数据点都完美地落在曲线上,没有任何散布。如果知道X的值,就能准确地计算出Y的值。
R2可以理解为模型(方程)解释的Y总方差的分数。通过使用实验数据(和适当的模型),你将总是得到一个0.0到1.0之间的结果。
至于R2值的高低评判,实际上并没有通用的经验法则。多次重复实验后,你会对预期的R2值有所了解,并能在R2远低于或高于预期值时进行进一步的研究。
传统上,统计学家使用大写字母R2来表示非线性和多元回归的结果,而使用小写r2来表示线性回归的结果。这两者在意义上并没有实质性的区别。
在非线性回归中,使用R2并不是标准做法。在线性回归中,R2是比较最佳拟合回归线与水平线(强制斜率为0.0)的拟合程度。由于水平线是回归线的最简单情况,因此这样比较是合理的。但对于非线性回归中使用的多数模型,水平线并不构成简单情况。将所选模型的拟合度与水平线的拟合度进行比较意义不大。这也是为什么在线性回归分析时,Minitab不报告R2值,而SAS标记值为“Pseudo R2”。
尽管R2值可能很高,但如果所有参数的置信区间都非常宽,那么这种拟合实际上并没有多大用处。
值得注意的是,非线性回归中R2值有可能是负数。
当数据点的权重不相计算R2会变得复杂,且似乎没有统一的标准方法。Prism 6采用了与之前版本不同的(更优的)方法来处理这一问题。
R2(甚至修正后的R2)不应被用于比较不同替代模型的拟合度。通过AICc评估的非常不同的模型,其R2值可能仅在小数点后第三到第五位数字上有细微差别。
Minitab的开发者认为R2不是一个特别有用的值,因此在非线性回归的结果中不报告它。
GraphPad Prism确实报告了R2(和修正R2,如果选中了Diagnostics选项卡中的相关选项)。在我看来,R2的价值主要在于作为评估重复实验的现实检查手段。假设你多次重复同一实验,你将会期待看到一定范围内的变化。如果某个实验给出的R2值始终在0.6到0.8之间,而某次实验得到的R2值却异常低(如0.2),那么你应该保持警惕并仔细检查该次实验中采用的方法或试剂是否有问题。
一篇文章提到:Spiess, A.-N.与Neumeyer, N在BMC Pharmacol期刊上发表了一篇关于R2在理和生化研究中非线性模型评价的文章。