四、多重比较
F值显著或极显著,否定了无效假设HO,表明试验的总变异主要来源于处理间的变异,试验中各处理平均数间存在显著或极显著差异,但并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。
因而,有必要进行两两处理平均数间的比较,以具体判断两两处理平均数间的差异显著性。
统计上把多个平均数两两间的相互比较称为多重比较(multiple comparisons)。
多重比较的方法甚多,常用的有最小显著差数法(LSD法)和最小显著极差法(LSR法),现分别介绍如下。
(一)最小显著差数法 (LSD法,least significant difference) 此法的基本作法是:在F检验显著的前提下,先计算出显著水平为α的最小显著差数,然后将任意两个处理平均数的差数的绝对值与其比较。若>LSDa时,则与在α水平上差异显著;反之,则在α水平上差异不显著。最小显著差数由(6-17)式计算。
(6-17)
式中:为在F检验中误差自由度下,显著水平为α的临界t值,为均数差异标准误,由(6-18)式算得。
(6-18)其中为F检验中的误差均方,n为各处理的重复数。
当显著水平α=0.05和0.01时,从t值表中查出和,代入(6-17)式得:
(6-19)
利用LSD法进行多重比较时,可按如下步骤进行:
(1)列出平均数的多重比较表,比较表中各处理按其平均数从大到小自上而下排列;
(2)计算最小显著差数和;
(3)将平均数多重比较表中两两平均数的差数与、比较,作出统计推断。
对于【例6.1】,各处理的多重比较如表6-4所示。
表6-4 四种饲料平均增重的多重比较表(LSD法)
处理 | 平均数 | -24.74 | -26.28 | -27.96 |
A1 | 31.18 | 6.44** | 4.90** | 3.22* |
A4 | 27.96 | 3.22* | 1.68 ns | |
A2 | 26.28 | 1.54ns | ||
A3 | 24.74 | |||
注:表中A4与 A3的差数3.22用q检验法与新复极差法时,在α=0.05的水平上不显著。
因为,;查t值表得:t0.05(dfe) =t0.05(16) =2.120,
t0.01(dfe)=t0.01(16)=2.921
所以,显著水平为0.05与0.01的最小显著差数为
将表6-4中的6个差数与,比较:小于者不显著,在差数的右上方标记“ns”,或不标记符号;介于与之间者显著,在差数的右上方标记“*”;大于者极显著,在差数的右上方标记“**”。检验结果除差数1.68、1.54不显著、3.22显著外,其余两个差数6.44、4.90极显著。表明A1饲料对鱼的增重效果极显著高于A2和A3,显著高于A4;A4饲料对鱼的增重效果极显著高于A3饲料;A4 与A2、A2与A3的增重效果差异不显著,以A1饲料对鱼的增重效果最佳。
关于法的应用有以下几点说明:
1、法实质上就是检验法。它是将检验中由所求得的之绝对值与临界值的比较转为将各对均数差值的绝对值与最小显著差数的比较而作出统计推断的。但是,由于法是利用F检验中的误差自由度查临界值,利用误差均方计算均数差异标准误,因而法又不同于每次利用两组数据进行多个平均数两两比较的检验法。它解决了本章开头指出的检验法检验过程烦琐,无统一的试验误差且估计误差的精确性和检验的灵敏性低这两个问题。但法并未解决推断的可靠性降低、犯I型错误的概率变大的问题。
2、有人提出,与检验任何两个均数间的差异相比较,法适用于各处理组与对照组比较而处理组间不进行比较的比较形式。实际上关于这种形式的比较更适用的方法有顿纳特(Dunnett)法(关于此法,读者可参阅其它有关统计书籍)。
3、因为法实质上是检验,故有人指出其最适宜的比较形式是:在进行试验设计时就确定各处理只是固定的两个两个相比,每个处理平均数在比较中只比较一次。例如,在一个试验中共有4个处理,设计时已确定只是处理1与处理2、处理3与处理4(或1与3、2与4;或1与4、2与3)比较,而其它的处理间不进行比较。因为这种比较形式实际上不涉及多个均数的极差问题,所以不会增大犯I型错误的概率。
综上所述,对于多个处理平均数所有可能的两两比较,法的优点在于方法比较简便,克服一般检验法所具有的某些缺点,但是由于没有考虑相互比较的处理平均数依数值大小排列上的秩次,故仍有推断可靠性低、犯I型错误概率增大的问题。为克服此弊病,统计学家提出了最小显著极差法。
(二)最小显著极差法(LSR法 ,Least significant ranges) 法的特点是把平均数的差数看成是平均数的极差,根据极差范围内所包含的处理数(称为秩次距)的不同而采用不同的检验尺度,以克服法的不足。这些在显著水平α上依秩次距的不同而采用的不同的检验尺度叫做最小显著极差。例如有10个要相互比较,先将10个依其数值大小顺次排列,两极端平均数的差数(极差)的显著性,由其差数是否大于秩次距=10时的最小显著极差决定(≥为显著,<为不显著=;而后是秩次距=9的平均数的极差的显著性,则由极差是否大于=9时的最小显著极差决定;……直到任何两个相邻平均数的差数的显著性由这些差数是否大于秩次距k=2时的最小显著极差决定为止。因此,有个平均数相互比较,就有-1种秩次距(, -1, -2,…,2),因而需求得-1个最小显著极差(),分别作为判断具有相应秩次距的平均数的极差是否显著的标准。
因为法是一种极差检验法,所以当一个平均数大集合的极差不显著时,其中所包含的各个较小集合极差也应一概作不显著处理。
法克服了法的不足,但检验的工作量有所增加。常用的法有检验法和新复极差法两种。
1、检验法(q test) 此法是以统计量的概率分布为基础的。值由下式求得:
(6-20)
式中,ω为极差,为标准误,分布依赖于误差自由度dfe及秩次距k。
利用检验法进行多重比较时,为了简便起见,不是将由(6-20)式算出的值与临界值比较,而是将极差与比较,从而作出统计推断。即为α水平上的最小显著极差。
(6-21)
当显著水平α=0.05和0.01时,从附表5(值表)中根据自由度及秩次距查出和代入(6-21)式得
(6-22)
实际利用检验法进行多重比较时,可按如下步骤进行:
(1)列出平均数多重比较表;
(2)由自由度、秩次距查临界值,计算最小显著极差0.05,k, 0.01,k;
(3)将平均数多重比较表中的各极差与相应的最小显著极差0.05,k, 0.01,k比较,作出统计推断。
对于【例6.1】,各处理平均数多重比较表同表6-4。在表6-4中,极差1.54、1.68、3.22的秩次距为2;极差3.22、4.90的秩次距为3;极差6.44的秩次距为4。
因为, =5.34,故标准误为
根据=16, =2,3,4由附表5查出0.05、0.01水平下临界值,乘以标准误求得各最小显著极差,所得结果列于表6-5。
表6-5 q值及LSR值
dfe | 秩次距k | q0.05 | q0.01 | LSR0.05 | LSR0.01 |
16 | 2 | 3.00 | 4.13 | 3.099 | 4.266 |
3 | 3.65 | 4.79 | 3.770 | 4.948 | |
4 | 4.05 | 5.19 | 4.184 | 5.361 | |
将表6-4中的极差1.54、1.68、3.22与表6-5中的最小显著极差3.099、4.266比较;将极差3.22、4.90与3.770、4.948比较;将极差6.44与4.184、5.361比较。检验结果,除A4与 A3的差数3.22由LSD法比较时的差异显著变为差异不显著外,其余检验结果同法。
2、新复极差法(new multiple range method) 此法是由邓肯(Duncan)于1955年提出,故又称Duncan法,此法还称SSR法(shortest significant ranges)。
新复极差法与检验法的检验步骤相同,唯一不同的是计算最小显著极差时需查表(附表6)而不是查值表。最小显著极差计算公式为
(6-23)
其中是根据显著水平α、误差自由度、秩次距,由表查得的临界值,。α=0.05和α=0.01水平下的最小显著极差为:
(6-24)
对于【例6.1】,各处理均数多重比较表同表6-4。
已算出=1.033,依=16, =2,3,4,由附表6查临界0.05(16,k)和0.01(16,k)值,乘以=1.033,求得各最小显著极差,所得结果列于表6-6。
表6-6 SSR值与LSR值
dfe | 秩次距k | SSR0.05 | SSR0.01 | LSR0.05 | LSR0.01 |
2 | 3.00 | 4.13 | 3.099 | 4.266 | |
16 | 3 | 3.15 | 4.34 | 3.254 | 4.483 |
4 | 3.23 | 4.45 | 3.337 | 4.597 | |
将表6-4中的平均数差数(极差)与表6-6中的最小显著极差比较,检验结果与检验法相同。
当各处理重复数不等时,为简便起见,不论法还是法,可用(6-25)式计算出一个各处理平均的重复数n0,以代替计算或所需的n。
(6-25)
式中为试验的处理数, (i=1,2,…,k)为第处理的重复数。
以上介绍的三种多重比较方法,其检验尺度有如下关系:
法≤新复极差法≤检验法
当秩次距=2时,取等号;秩次距≥3时,取小于号。在多重比较中,法的尺度最小,检验法尺度最大,新复极差法尺度居中。用上述排列顺序前面方法检验显著的差数,用后面方法检验未必显著;用后面方法检验显著的差数,用前面方法检验必然显著。一般地讲,一个试验资料,究竟采用哪一种多重比较方法,主要应根据否定一个正确的H0和接受一个不正确的H0的相对重要性来决定。如果否定正确的H0是事关重大或后果严重的,或对试验要求严格时,用检验法较为妥当;如果接受一个不正确的H0是事关重大或后果严重的,则宜用新复极差法。生物试验中,由于试验误差较大,常采用新复极差法;F检验显著后,为了简便,也可采用法。
(三)多重比较结果的表示法 各平均数经多重比较后,应以简明的形式将结果表示出来,常用的表示方法有以下两种。
1、三角形法 此法是将多重比较结果直接标记在平均数多重比较表上,如表6-4所示。由于在多重比较表中各个平均数差数构成一个三角形阵列,故称为三角形法。此法的优点是简便直观,缺点是占的篇幅较大。
2、标记字母法 此法是先将各处理平均数由大到小自上而下排列;然后在最大平均数后标记字母,并将该平均数与以下各平均数依次相比,凡差异不显著标记同一字母,直到某一个与其差异显著的平均数标记字母;再以标有字母的平均数为标准,与上方比它大的各个平均数比较,凡差异不显著一律再加标,直至显著为止;再以标记有字母的最大平均数为标准,与下面各未标记字母的平均数相比,凡差异不显著,继续标记字母,直至某一个与其差异显著的平均数标记;……;如此重复下去,直至最小一个平均数被标记比较完毕为止。这样,各平均数间凡有一个相同字母的即为差异不显著,凡无相同字母的即为差异显著。用小写拉丁字母表示显著水平α=0.05,用大写拉丁字母表示显著水平α=0.01。在利用字母标记法表示多重比较结果时,常在三角形法的基础上进行。此法的优点是占篇幅小,在科技文献中常见。
对于【例6.1】,现根据表6-4所表示的多重比较结果用字母标记如表6-7所示(用新复极差法检验,表6-4中A4与A3的差数3.22在α=0.05的水平上不显著,其余的与LSD法同)。
表6-7 表6-4多重比较结果的字母标记(SSR法)
处理 | 平均数 | α=0.05 | α=0.01 |
A1 | 31.18 | a | A |
A4 | 27.96 | b | AB |
A2 | 26.28 | b | B |
A3 | 24.74 | b | B |
表6-4 四种饲料平均增重的多重比较表(LSD法)
处理 | 平均数 | -24.74 | -26.28 | -27.96 |
A1 | 31.18 | 6.44** | 4.90** | 3.22* |
A4 | 27.96 | 3.22* | 1.68 ns | |
A2 | 26.28 | 1.54ns | ||
A3 | 24.74 | |||
在表6-7中,先将各处理平均数由大到小自上而下排列。当显著水平α=0.05时,先在平均数31.18行上标记字母;由于31.18与27.96之差为3.22,在α=0.05水平上显著,所以在平均数27.96行上标记字母b;然后以标记字母b的平均数27.96与其下方的平均数26.28比较,差数为1.68,在α=0.05水平上不显著,所以在平均数26.28行上标记字母b;再将平均数27.96与平均数24.74比较,差数为3.22,在α=0.05水平上不显著,所以在平均数24.74行上标记字母b。类似地,可以在α=0.01将各处理平均数标记上字母,结果见表6-7。q检验结果与SSR法检验结果相同。
由表6-7看到,A1饲料对鱼的平均增重极显著地高于A2和A3饲料,显著高于A4饲料;A4、A2、A3三种饲料对鱼的平均增重差异不显著。四种饲料其中以A1饲料对鱼的增重效果最好。
应当注意,无论采用哪种方法表示多重比较结果,都应注明采用的是哪一种多重比较法。
七、方差分析的基本步骤
在本节中,结合单因素试验结果方差分析的实例,较详细地介绍了方差分析的基本原理和步骤。关于方差分析的基本步骤现归纳如下:
(一)计算各项平方和与自由度。
(二)列出方差分析表,进行F检验。
(三)若F检验显著,则进行多重比较。多重比较的方法有最小显著差数法(LSD法)和最小显著极差法(LSR法:包括q检验法和新复极差法)。表示多重比较结果的方法有三角形法和标记字母法。
此外,若有一些特殊重要的问题需要回答,多重比较又无法或不能很好地回答这些问题时,则应考虑单一自由度正交比较法。对这些特殊问题正确而有效的回答,依赖于正确的试验设计和单一自由度正交比较法的正确应用。
第二节 单因素试验资料的方差分析
在方差分析中,根据所研究试验因素的多少,可分为单因素、两因素和多因素试验资料的方差分析。单因素试验资料的方差分析是其中最简单的一种,目的在于正确判断该试验因素各水平的优劣。根据各处理内重复数是否相等,单因素方差分析又分为重复数相等和重复数不等两种情况。上节讨论的是重复数相等的情况。当重复数不等时,各项平方和与自由度的计算,多重比较中标准误的计算略有不同。本节各举一例予以说明。
一、各处理重复数相等的方差分析
【例6.3】抽测5个不同品种的若干株的玉米颗数,结果见表6-12,试检验不同品种玉米生长颗数的差异是否显著。
表6-12 五个不同品种玉米生长颗数
品种号 | 观 察 值xij (颗/株) | xi. | |||||
1 | 8 | 13 | 12 | 9 | 9 | 51 | 10.2 |
2 | 7 | 8 | 10 | 9 | 7 | 41 | 8.2 |
3 | 13 | 14 | 10 | 11 | 12 | 60 | 12 |
4 | 13 | 9 | 8 | 8 | 10 | 48 | 9.6 |
5 | 12 | 11 | 15 | 14 | 13 | 65 | 13 |
合计 | x.. =265 | ||||||
这是一个单因素试验,k=5,n=5。现对此试验结果进行方差分析如下:
1、计算各项平方和与自由度
2、列出方差分析表,进行F检验
表6-13 不同品种玉米生长颗数的方差分析表
变异来源 | 平方和 | 自由度 | 均方 | F值 |
品种间 | 73.20 | 4 | 18.30 | 5.83** |
误差 | 62.80 | 20 | 3.14 | |
总变异 | 136.00 | 24 | ||
根据df1=dft=4,df2=dfe=20查临界F值得:F0.05(4,20) =2.87,F0.01(4,20) =4.43,因为F>F0.01(4,20),即P<0.01,表明品种间产颗数的差异达到1%显著水平。 3、多重比较 采用新复极差法,各处理平均数多重比较表见表6-14。
表6-14 不同品种玉米平均生长颗数多重比较表
(SSR法又称Duncan法)
品种 | 平均数 | -8.2 | -9.6 | -10.2 | -12.0 |
5 | 13.0 | 4.8** | 3.4* | 2.8* | 1.0 |
3 | 12.0 | 3.8** | 2.4 | 1.8 | |
1 | 10.2 | 2.0 | 0.6 | ||
4 | 9.6 | 1.4 | |||
2 | 8.2 | ||||
因为MSe=3.14,n=5,所以为:
根据dfe=20,秩次距k=2,3,4,5由附表6查出α=0.05和α=0.01的各临界SSR值,乘以=0.7925,即得各最小显著极差,所得结果列于表6-15。
表6-15 SSR值及LSR值
dfe | 秩次距k | SSR0.05 | SSR0.01 | LSR0.05 | LSR0.01 |
20 | 2 | 2.95 | 4.02 | 2.339 | 3.188 |
3 | 3.10 | 4.22 | 2.458 | 3.346 | |
4 | 3.18 | 4.33 | 2.522 | 3.434 | |
5 | 3.25 | 4.40 | 2.577 | 3.489 | |
将表6-14中的差数与表6-15中相应的最小显著极差比较并标记检验结果。检验结果表明:5号品种玉米的平均生产颗数极显著高于2号品种玉米,显著高于4号和1号品种,但与3号品种差异不显著;3号品种玉米的平均生产颗数极显著高于2号品种,与1号和4号品种差异不显著;1号、4号、2号品种玉米的平均生产颗数间差异均不显著。五个品种中以5号品种玉米的生产颗数最高,3号品种次之,2号品种玉米的生产颗数最低。
二、各处理重复数不等的方差分析
这种情况下方差分析步骤与各处理重复数相等的情况相同,只是在有关计算公式上略有差异。
设处理数为k;各处理重复数为n1, n2,…, nk;试验观测值总数为N=Σni。则
(6-28)
【例6.4】 5个不同品种番茄的生长试验,后期15天生长(cm)如表6-16所示。试比较品种间生长有无差异。
表6-16 5个品种番茄15天生长
品种 | 生 长 (cm) | ni | xi. | ||||||
B1 | 21.5 | 19.5 | 20.0 | 22.0 | 18.0 | 20.0 | 6 | 121.0 | 20.2 |
B2 | 16.0 | 18.5 | 17.0 | 15.5 | 20.0 | 16.0 | 6 | 103.0 | 17.2 |
B3 | 19.0 | 17.5 | 20.0 | 18.0 | 17.0 | 5 | 91.5 | 18.3 | |
B4 | 21.0 | 18.5 | 19.0 | 20.0 | 4 | 78.5 | 19.6 | ||
B5 | 15.5 | 18.0 | 17.0 | 16.0 | 4 | 66.5 | 16.6 | ||
合计 | 25 | 460.5 | |||||||
此例处理数k=5,各处理重复数不等。现对此试验结果进行方差分析如下:
1、计算各项平方和与自由度
利用公式(6-28)计算
2、列出方差分析表,进行F检验
临界F值为:F0.05(4,20) =2.87,F0.01(4,20) =4.43,因为品种间的F值5.99>F0.01(4,20),P<0.01,表明品种间差异极显著。
表6-17 5个品种番茄生长方差分析表
变异来源 | 平方和 | 自由度 | 均方 | F值 |
品种间 | 46.50 | 4 | 11.63 | 5.99** |
品种内(误差) | 38.84 | 20 | 1.94 | |
总变异 | 85.34 | 24 | ||
3、多重比较 采用新复极差法,各处理平均数多重比较表见表6-18。
因为各处理重复数不等,应先由公式(6-25)计算出平均重复次数n0来代替标准误中的n,此例
于是,标准误为:
表6-18 5个品种番茄平均生长多重比较表(SSR法)
品种 | 平均数 | -16.6 | -17.2 | -18.3 | -19.6 |
B1 | 20.2 | 3.6** | 3.0** | 1.9 | 0.6 |
B4 | 19.6 | 3.0** | 2.4* | 1.3 | |
B3 | 18.3 | 1.7 | 1.1 | ||
B2 | 17.2 | 0.6 | |||
B5 | 16.6 | ||||
根据dfe=20,秩次距k=2,3,4,5,从附表6中查出α=0.05与α=0.01的临界SSR值,乘以=0.63,即得各最小显极差,所得结果列于表6-19。
表6-19 SSR值及LSR值表
dfe | 秩次距(k) | SSR0.05 | SSR0.01 | LSR0.05 | LSR0.01 |
20 | 2 | 2.95 | 4.02 | 1.844 | 2.513 |
3 | 3.10 | 4.22 | 1.938 | 2.638 | |
4 | 3.18 | 4.33 | 1.988 | 2.706 | |
5 | 3.25 | 4.40 | 2.031 | 2.750 | |
将表6-18中的各个差数与表6-19中相应的最小显著极差比较,作出推断。检验结果已标记在表6-18中。
多重比较结果表明B1、B4品种的平均生长极显著或显著高于B2、B5品种的平均生长,其余不同品种之间差异不显著。可以认为B1、B4品种生长最快,B2、B5品种生长较差,B3品种居中。
单因素试验只能解决一个因素各水平之间的比较问题。如上述研究几个品种番茄的生长试验,只能比较几个品种的生长快慢。而影响生长的其它因素,如肥料中营养成分的高低、蛋白质含量的多少、施肥方式及环境温度的变化等就无法得以研究。实际上,往往对这些因素有必要同时考察。只有这样才能作出更加符合客观实际的科学结论,才有更大的应用价值。这就要求进行两因素或多因素试验。下面介绍两因素试验资料的方差分析法。
本文来源:https://www.2haoxitong.net/k/doc/d470b82d58fb770bf78a5542.html
文档为doc格式