SAS软件系统以其强大的统计功能而著称,其图形输出功能与统计本身一样全面且细致。我们可以轻松地利用原始数据绘制出所需的图形,SAS/base有效地整合了这些功能,使得使用者能够如丝般顺滑地体验软件,而不会感受到不同模块间的差异。
SAS软件在每一个统计过程中都配备了ODS输出系统,这极大地简化了统计结果的可视化输出过程。只需设置plots=all,即可看到所有可能的输出图形。
对于常见的统计输出图形,它们总体上帮助用户更好地理解统计模型。下面将详细介绍一些不常见的图形,并略过其他图形的详细描述。
首先看到第一行第一个的线图,它是聚类分析的输出之一。在cluster聚类分析中,该线图为判断最佳聚类数提供了依据,通过CCC、伪F和伪t三个指标来进行判断。CCC和伪F值越大越好,而伪t的读取虽有一定特殊性,但同样是在寻找一个拐点。该图还提供了异常信息,与CCC指标密切相关。
第一行最后一个的cook距离值图,常见于reg的ODS输出系统中。虽然这个指标不作为最终判断异常信息的唯一依据,但它可以与其他指标(如学生化残差、杠杆值等)结合使用,以更全面地判断异常信息。
第一行第二个图是检验图,它在glm过程中可见。尽管该图表面上看似复杂,但实际上非常直观。横纵坐标均表示离散变量的均值,不同离散变量的取值在图中均有标识,通过这些信息可以轻松找到不同取值间的交叉点,并以红蓝两色表示其显著性。
第二行第三个图是交互效应图,同样在glm过程中可见。该图直观地展示了两个离散变量间的交互状况。若为连续变量,通常需先对其进行离散化处理后再进行绘图,以更清晰地显示交互关系。
第一行第一个图展示的是偏好图,可在prinqual中实现。该图用于表示哪些消费者对哪些产品有更强的偏好。其读法与主成分图、对应分析图及典型相关图相似,均属于多变量过程中的图形。SAS还提供了如变量转换的一系列方法,包括对数转换、box-cox转换等,其中最优尺度的变换方法还可延伸至分类主成分分析。
第一行第一个ROC图可在logistic过程中完成。此图用于比较不同变量间的面积,并可输出单个及组合图形的结果,从而在logistic过程中提供便利的比较方式。
第一行第二个的残差-残差图需要用户自行绘制,比较两组残差的散点图。当需要比较不同模型对同一组数据的拟合程度时,此图可提供线及局部非线性两个视角下的有用信息。
最后提及的贝叶斯图形在SAS的许多过程中均有提供,并可使用MCMC过程进行专门分析。这些图形在贝叶斯分析中起着至关重要的作用。