1
您现在的位置:
首页
/
/
/
干货丨PROC GLM和PROC MIXED,究竟谁更适合处理重复测量数据?

干货丨PROC GLM和PROC MIXED,究竟谁更适合处理重复测量数据?

  • 分类:学术干货
  • 作者:
  • 来源:
  • 发布时间:2021-10-17
  • 访问量:0

干货丨PROC GLM和PROC MIXED,究竟谁更适合处理重复测量数据?

【概要描述】

  • 分类:学术干货
  • 作者:
  • 来源:
  • 发布时间:2021-10-17
  • 访问量:0
详情

1. 何为重复测量方差分析?

重复测量方差分析(Repeated measures ANOVA),是对于有重复测量的数据进行方差分析。而重复测量,指的是对同一试验单位在同一指标但不同时间点(或不同的条件下)进行多次测量(Salkind,2019)。例如,为了检验某个体能训练对于人体血压的影响,我们需要对同一采集3个时间点的血压数据,那么我们可以将这3个时间点当成自变量并称其为等级(levels):

一般的,若有N个观测个体,分为t个处理组,X为观测指标,p为重复次数,那么重复测量数据的基本格式如下:

表1 重复测量数据的基本格式

对比一般的单变量方差分析,我们可以发现他们最为显著的不同:单变量方差分析是对某一变量的方差进行分解,而重复测量数据存在多个时间点的测量结果,并不仅有1个变量,而有多个变量,从而形成多个变量的方差-协方差矩阵,然后再对其进行分解。因此,在进行相应的分析时,需要选择最佳的方差-协方差矩阵进行数据的拟合,以确保有着最佳的拟合程度。关于方差-协方差矩阵的选择,在后续的文章会有更加详细的探讨。

 

2. 什么条件下可以使用重复测量方差分析?

由于是从方差分析衍生出来的,在满足正态性(总体服从于正态分布)和方差齐性(不同处理水平下的总体方差是奇性)条件下,还需要额外满足协方差阵的球形假设检验。

这里简要解释一下球形假设检验。球形假设是重复测量方差分析里最重要的假设。它是假设对所有可能的被试验内的条件对(pairs of with-subject conditions)之间差异的方差相等。如果不满足条件,则会导致F统计量膨胀(Hinton,2004)。一般是在重复测量水平有三个及以上时候进行评估球形假设。当不满足球形假设时,需要决定采取单变量分析方法还是多变量分析方法。如果选择单变量,则需要根据违反球形假设的程度调整方差分析最后结果的自由度;如果选择多变量,则可以忽略违背的情况(Field,2005)。具体使用见后文的应用部分。

 

3. 重复测量方差分析的用途

从实际应用来看,重复测量方差分析主要应用在比较组间在横向数据(Longitudinal Data)或者时间点上有无差异,即两条随在不同的观测点的变化趋势有无差异。

 

4. 怎么使用重复测量方差分析?

实例及相关统计分析均基于SAS 9.4生成,α=0.05。

在SAS中,进行重复测量的过程步有两种,PROC GLM和PROC MIXED,两者基本语法如下:

 

通过语法可以得知,两种方法的用法大同小异,最主要的区别在于数据格式上。PROC MIXED要求的重复测量的值仅有一列,并用新的一列声明重复测量的不同点(表2);而PROC GLM会要求根据重复测量的点的个数产生相应个数的变量列(表3)。

表2 PROC MIXED数据格式

表3 PROC GLM数据格式

为了研究两种方法对于实际数据应用上的不同,我们创建一个重复测量4次的数据集(表4,数据来源于SAS Usage Note 37107):

表4 模拟重复测量数据

这种数据形式是综合了两种PROC步的特点编写的,并根据语法编写相对应的SAS代码,如下:

接下来我们开始解读对应的两种方法的重复测量方差分析的SAS结果。

 

4.1 PROC GLM

首先,我们需要查看的是球形检验的结果。这一部分我们通常使用Mauchly方法检验协方差矩阵,若P值大于0.05,我们可认为当前数据满足重复测量方差分析的球形检验的假设。由表5可知,我们的数据不满足球形检验,因此在后续的结果解读中,我们需要调整自由度。SAS输出了校正后的Greenhouse-Geisser Epsilon (G-G) and the Huynh-Feldt Epsilon (H-F)的结果,具体输出位置请查看后续结果。

表5 球形检验

接下来,我们来分别查看不同时间点(测量点下)组内效应是否具有统计学意义。

在PROC GLM中,SAS会先输出在不同时间点(或测量点)下的方差分析和组间比较结果。表6和表7展示了对HR1时间点下的结果,此外还会输出HR2、HR3和HR4的结果。

表6 HR1 方差分析结果

表7 HR1 组间比较结果

此外,SAS还会通过多变量方差分析检验组内不同的效应。

效应1:时间效应

这里我们假设了4个时间点对同一个体进行重复测量,因此我们首先检验了时间效应是否具有统计学意义。注意,由于我们数据不满足球形假设,我们不能选择Wilk’s Lambda的结果,而是应该校正自由度后的结果,这里我们选择Hotelling-Lawley Trace的结果,见表8。由于P值小于0.05(P<0.0001),我们有理由拒绝原假设,随着时间的变化,不同时间的测量值存在着统计学差异。

表8时间效应检验结果(多变量方差分析)

效应2:时间与处理的交互效应

同样的,类似于时间效应的检验,需要选择自由度校正后的结果。由于P值小于0.05(P<0.0001),我们有理由拒绝原假设,时间与处理组的交互作用对测量值带来的差异存在统计学意义。

我们再来分别查看组间效应是否具有统计学意义,见表9。由于P值小于0.05(P<0.0001),提示处理组间的差异无统计学意义。

表9重复测量方差分析(一)

最后我们来看时间和时间与处理组交互作用的多变量方差分析结果。在前文中我们提到了SAS输出了校正后的假设检验结果,一般情况下我们会选择表中的调整后的G-G值来作为最终结果,见表10。可以看到HR(时间)的P值小于0.05(P<0.0001),提示不同的时间点的测量值平均值不同;HR*DRUG(交互作用)的P值小于0.05(P<0.0001),提示不同处理组在不同的时间点的测量值平均值不同。

表10重复测量方差分析(二)

4.2 PROC MIXED

相较于PROC GLM的结果,PROC MIXED的结果会少了很多。它没有检验重复测量方差分析的前提假设,因此结果会与PROC GLM存在着差异。

由于PROC MIXED是基于混合线性模型的基础进行重复测量相应的估计,因此首先我们要查看固定效应的解的表格,见表11。可以看到,SAS输出了组间比较的结果,并以CLASS变量中最后一个变量为参照组(相应的参数估计均为0),可以直观地发现组间是否存在着差异。

表11 固定效应的解

其次,SAS输出了基于F统计量的固定效应的检验结果,检验组间是否存在着差异。这里的结论与PROC GLM中一致。

表12 固定效应的III型检验

5. 总结

可以看到,PROC MIXED和PROC GLM均可以对重复测量数据进行相应的分析,并都可以输出不同时间点最小二乘均值(LSMEANS)的比较。但PROC GLM有着完善的检验方法,比如会检验数据是否符合球型假设,并输出不同方法的校正后的结果。因此,更为推荐使用PROC GLM进行重复测量数据的拟合。此外,SAS官方也给出了更为详细的理论以及程序对比,感兴趣的读者可以进一步阅读,具体链接见参考文献。

 

参考文献

SAS/STAT User’s Guide, Version 6, Fourth Edition, Volume1 and Volume 2, Cary NC: SAS Institute Inc., 1989.

DiIorio, Frank C., SAS Applications and Programming: A Gentle Introduction, Belmont CA, Duxbury Press, 1991.

Stevens, James P., Applied Multivariate Statistics for the Social Sciences, Third Edition, Mahway NJ, Lawrence Erlbaum Associates, Inc., 1996.

SAS LIBRARY REPEATED MEASURES ANOVA USING SAS PROC GLM. 

From https://stats.idre.ucla.edu/sas/library/sas-libraryrepeated-measures-anova-using-sas-proc-glm/ (accessed June 17, 2021).

Hinton, P. R., Brownlow, C., & McMurray, I. (2004). SPSS Explained. Routledge.

Field, A. P. (2005). Discovering Statistics Using SPSS. Sage Publications.

Salkind, Neil J. "Repeated Measures Design". SAGE Research Methods. SAGE. Retrieved 8 January 2019.

SAS Usage Note 37107:Comparing covariance structures in PROC MIXED  From

https://support.sas.com/kb/37/107.html(accessed July 9, 2021).

Comparing the SAS GLM and MIXED Procedures for Repeated Measures  From

https://support.sas.com/rnd/app/stat/papers/mixedglm.pdf(accessed July 9, 2021).

 

扫二维码用手机看

这是描述信息

联系我们

地址:长沙市高新区麓天路28号五矿麓谷科技产业园A4栋13楼
电话:
0731-89908360   /   13466774898
E-mail:bd@phamark.com

这是描述信息
搜索
搜索

版权所有    长沙砝码柯数据科技有限责任公司
湘ICP备18023436号-1
技术支持:中企动力   长沙

版权所有    长沙砝码柯数据科技有限责任公司
湘ICP备18023436号-1
技术支持:中企动力   长沙