这期厉害了,统计学方法的灵魂,大家一起来听刘岭教授说一说方差分析。
第2讲讲到统计学扫盲基础段位的t检验,t检验方法适用于两个样本均数的比较。但实际工作中,我们常常会遇到多个样本均数进行比较的情况。注意,t检验方法并不适用,因为它犯Ⅰ类错误的可能性会增加(图1)。
图1 多组均数比较采用t检验会导致Ⅰ类错误概率增加
方差分析的基本思想可以归纳为根据研究设计的类型,将全部测量值总的离均差平方和及其自由度分解为两个或多个部分,每个部分的变异都由某个因素的作用(或某几个因素的交互作用)引起。通过比较不同变异来源的均方,借助F分布做出统计推断,从而推论各种处理因素对研究结果有无影响(很深奥哈,此为理论,实在不懂可放过)。
对样本均数进行比较的方差分析方法与研究设计类型有关。方差分析中分析的数据是按照特定研究设计进行试验所得的数据,不同的研究设计其总变异的分解有所不同。因此在应用方差分析时,要结合具体的研究设计方法来选择相应的方差分析方法。常用的设计有:随机单位组设计/拉丁方设计/交叉设计/析因设计/正交设计/嵌套设计/裂区设计/重复测量数据/协方差分析等
进行方差分析时同样要求资料满足正态分布且方差相等两个基本假设(与独立样本t检验的条件一样一样滴)。即:
1. 各样本组内观察值相互独立,且服从正态分布;
2. 各样本组内观察值总体方差相等,即方差齐性 (homogeneity of variance)。
本节只涉及最基本的一种设计形式—完全随机设计。
完全随机设计(Completely Random Design)是指将受试单位随机地分配到各处理组中进行实验研究,或分别从互相独立的不同总体里随机抽取样本进行比较的一种设计方法。
例:某高原研究组将籍贯相同、年龄相同、身高体重接近的30名新战士随机分为3组,对照组按常规训练;锻炼组每天除常规训练外,还接受中速长跑与健身操锻炼;药物组除常规训练外,服用抗疲劳药物,1个月后测量第1秒用力肺活量(L),结果见表1所示。试比较3组第1秒用力肺活量有无差别。
案例分析思考:
1.研究目的:分析中速长跑与健身操锻炼/药物对肺活量是否会产生影响;
2.研究设计类型:完全随机设计分为三组:一对照组(常规训练),二锻炼组(除常规训练外,还接受中速长跑与健身操锻炼),三药物组(除常规训练外,服用抗疲劳药物);
3.反应变量:肺活量属于计量资料;
4.单因素方差分析的应用条件:独立/正态/方差齐性。
设计形式是完全随机设计,故满足独立性;其次对数据进行正态/方差齐性检验。(正态性检验参照上一节内容进行,一般要求不是太严格,差不多就行了)
具体操作:
1. 数据格式本例30行2列(反应变量:肺活量;分组:1=对照组,2=锻炼组,3=药物组)(图2)
图2 单因素方差分析数据输入格式
2. 操作步骤
分析(A)→比较平均值(M)→单因素ANOVA检验
弹出“单因素ANOVA检验”主对话框(图3)。
►因变量列表(E):选入反应变量,本例为“肺活量”。
►因子(F):选入分组变量,本例为“分组”。
图3 单因素ANOVA检验主对话框
◇事后比较(H):各组均数的多重比较。
点击“事后比较(H)”按钮,选择组间多重比较方法,弹出“单因素ANOVA检验:事后多重比较”对话框(图4)。
图4 单因素ANOVA检验:事后多重比较对话框
★假定等方差:方差齐同假设成立时的可选方法。
þ LSD:最小显著差法,假阳性较高,适于比较的次数较少时选用。本例选择此项。
þ S-N-K:假阳性中等。本例选此项。
¨ 邦弗伦尼(B):P值Bonferroni校正法,控制假阳性较严格。
¨ 邓尼特(E):Dunnett法,适用于多个处理组与同一个对照组的比较。
★不假定等方差:方差齐同假设不成立时的可选方法。
点击“继续(C)”回到主对话框。
在主对话框中点击“选项(O)”按钮,弹出“单因素ANOVA检验:选项”对话框(图5)。
图5 单因素ANOVA检验:选项对话框
★统计:统计量。
þ 描述(D):统计描述。本例选此项。
þ 方差齐性检验(H):方差齐性检验。本例选此项。
点击“继续(C)”回到主对话框,点击“确定”。
3. 主要输出结果及分析
(1)上例的描述统计量表(表2)
表2给出上例基本统计描述指标的统计量:药物组样本量为10,样本的均数为3.4220、标准差为0.14436、标准误为0.04565等。
(2)上例的方差齐性检验表(表3)
表3给出了上例的方差齐性检验结果。本例F=0.109,P=0.897,可以认为方差齐同。
(3)上例的方差分析表(表4)(此表非常重要)
表4给出了上例的方差分析结果。本例F=3.729,P=0.037,即服用抗疲劳药物后,3组第1秒用力肺活量间差别有统计学意义,随后作均数间两两比较。注意:若此P>0.05,则无须再做两两比较了。
(4)上例的均数多重比较(表5、表6)
表5给出了上例的LSD法的组间两两比较结果。结论:即对照组与锻炼组均值间差异显著(P=0.013),服用抗疲劳药物1个月后,锻炼组第1秒用力肺活量均值(3.554)高于对照组均值(3.366)。
表6给出了上例的S-N-K法进行组间两两比较的结果。S-N-K检验结果为无差别方式,即把差异没有显著性意义的比较组列在同一亚集里。除去没有显著意义的比较组外正态性检验怎么看结果,其余各比较组间差异均有统计学意义(显著性水准=0.05)。本例第1亚集表示对照组与药物组间差异无统计学意义;第2亚集表示锻炼组与药物组间差异无统计学意义;而对照组与锻炼组间差异有统计学意义。
报告中单因素方差分析的表述形式:
对照组、锻炼组和药物组的肺活量(3.3660.162、3.5540.167和3.4220.144)三组比较,采用单因素方差分析,差异有统计学意义(F=3.729, P=0.037),进一步两两比较可以得到:锻炼组的肺活量高于对照组(P=0.013),而药物组与锻炼组和对照组比较差异无统计学意义(P=0.073,P=0.435)。
技术总结如下:
1. t检验不能用于均数的多重比较,否则会加大I型错误的概率。t检验只能用于两个均数的比较;
2. 多均数的比较必须用方差分析,两组均数比较也可采用方差分析,检验结果与t检验等价(P值相等,F=t2);
3. F值是方差的比值,所以F值不可能为负数。F值越大,P值越小,反之亦然;
4. 方差分析根据不同的设计形式会有不同的方差分析(常用的设计有:随机单位组设计/拉丁方设计/交叉设计/析因设计/正交设计/嵌套设计/裂区设计/重复测量数据/协方差分析等),可以根据不同的设计形式采用相应的统计学方法;
5. 方差分析适用的资料类型为计量资料,满足的条件:独立/正态/方差齐性。如果不满足正态/方差齐性条件,可采用非参数检验;
6. 多个样本均数经方差分析后,若有统计学意义,需要对多个均数进行多重比较,否则就不是完整的统计分析,常采用LSD或SNK法(具体哪种方法更合适,可以参阅相关专业书籍)。若经方差分析后正态性检验怎么看结果,若无统计学意义,则就此打住,无须再做多重比较了。
END
撰稿:刘岭
限 时 特 惠: 本站每日持续更新海量各大内部创业教程,一年会员只需98元,全站资源免费下载 点击查看详情
站 长 微 信: muyang-0410