相关分析方法
地理要素之间相互关系密切程度的测定,主要是通过对相关系数的计算与检验来完成的。
1. 两要素之间相关程度的测定
1) 相关系数的计算与检验
(1) 相关系数的计算
相关系数——表示两要素之间的相关程度的统计指标。
对于两个要素x与y,如果它们的样本值分别为xi与yi(i=1,2,...,n),它们之间的相关系数:
,
rxy>0,表示正相关,即同向相关;rxy<0,表示负相关,即异向相关。 的绝对值越接近于1,两要素关系越密切;越接近于0,两要素关系越不密切。
■ 若记:
则:
■ 若问题涉及到x1,x2,…,xn等n个要素,多要素的相关系数矩阵:
[相关系数矩阵的性质]
① rii=1(i=1,2,…,n),每一个要素xi与它自己本身的相关程度最大;
② rij= rji(i,j=1,2,...,n),第i个要素xi对第j个要素xj的相关程度,与第j个要素xj对第i个要素xi的相关程度相等。
[举例说明]
例1:中国1952~1999年期间的国内总产值(GDP)及其各次产业构成数据如表3.1.1(单击显示该表)所示。试计算GDP与各次产业之间的相关系数及相关系数矩阵。
表3.1.1 中国1952~1999年48年国内总产值及其构成数据(单位:108元)
年份 | 国内生产总值x1 | 第一产业x2 | 第二产业x3 | 第三产业x4 |
1952 | 679 | 342.9 | 141.8 | 194.3 |
1953 | 824 | 378 | 192.5 | 253.5 |
1954 | 859 | 392 | 211.7 | 255.3 |
1955 | 910 | 421 | 222.2 | 266.8 |
... | ... | ... | ... | ... |
1999 | 81910.9 | 14457.2 | 40417.9 | 27035.8 |
注:本表数据详见书本P38-39。
解:
(1) 将表3.1.1中的数据代入相关系数计算公式计算,得到国内生产总值(GDP)与第一、二、三产业之间的相关系数分别为 0.9954, 0.9994, 0.9989。
(2) 根据表3.1.1中的数据,进一步计算,得到国内生产总值及一、二、三产业之间的相关系数矩阵:
(2) 相关系数的检验
一般情况下,相关系数的检验,是在给定的置信水平下,通过查相关系数检验的临界值表来完成。表3.1.2(点击显示该表)给出了相关系数真值 (即两要素不相关)时样本相关系数的临界值
表3.1.2 检验相关系数 的临界值(ra)表
α f | 0.10 | 0.05 | 0.02 | 0.01 | 0.001 |
1 | 0.98769 | 0.99692 | 0.999507 | 0.999877 | 0.9999988 |
2 | 0.90000 | 0.95000 | 0.98000 | 0.99000 | 0.999000 |
3 | 0.8054 | 0.8783 | 0.93433 | 0.95873 | 0.991160 |
4 | 0.7293 | 0.8114 | 0.8822 | 0.91720 | 0.97406 |
... | ... | ... | ... | ... | ... |
100 | 0.1638 | 0.1946 | 0.2301 | 0.2540 | 0.3211 |
注:本表数据详见书本40和41页。
[临界值表说明]
(1) f 称为自由度,其数值为f=n-2,这里n为样本数;
(2) α代表不同的置信水平;表内的数值代表不同的置信水平下相关系数的临界值,即ra;公式 表示当所计算的相关系数 的绝对值大于在α 水平下的临界值ra时,两要素不相关(即 )的可能性只有 α。)
一般而言,当 时,则认为两要素不相关,这时的样本相关系数就不能反映两要素之间的关系。
2) 秩相关系数的计算与检验
(1) 秩相关系数的计算
秩相关系数——是描述两要素之间相关程度的一种统计指标,是将两要素的样本值按数据的大小顺序排列位次,以各要素样本值的位次代替实际数据而求得的一种统计量。实际上,它是位次分析方法的数量化。
设两个要素x和y有n对样本值,令R1代表要素x的序号(或位次),R2代表要素y的序号(或位次), 代表要素x和y的同一组样本位次差的平方,则要素x和y之间的秩相关系数被定义为
(2) 秩相关系数的检验
与相关系数一样,秩相关系数是否显著,也需要检验。表3.1.4(点击显示该表及表的说明)给出了秩相关系数检验的临界值。
表3.1.4 秩相关系数检验的临界值
n | 显著特征 | n | 显著特征 | ||
0.05 | 0.01 | 0.05 | 0.01 | ||
4 | 1.000 |
| 16 | 0.425 | 0.601 |
5 | 0.900 | 1.000 | 18 | 0.399 | 0.564 |
6 | 0.829 | 0.943 | 20 | 0.377 | 0.534 |
7 | 0.714 | 0.893 | 22 | 0.359 | 0.508 |
8 | 0.643 | 0.833 | 24 | 0.343 | 0.485 |
9 | 0.600 | 0.783 | 26 | 0.329 | 0.465 |
10 | 0.564 | 0.746 | 28 | 0.317 | 0.448 |
12 | 0.506 | 0.712 | 30 | 0.306 | 0.432 |
14 | 0.456 | 0.645 |
|
|
|
说明:表3.1.4中,n代表样本个数,α代表不同的置信水平,也称显著水平,表中的数值为临界值ra
[举例说明]
例2:全国1999年各省(市、区)的总人口(x)和社会总产值(y)及其位次列于表3.1.3( 因为缺数据,香港、澳门、台湾三个地区未列入)(点击显示该表)。试计算总人口(x)与社会总产值(y)之间的秩相关系数并对其进行检验。
表3.1.3 1999年全国各省(市、区)总人口与国内生产总值
省 | 总人口(x)及其位次 | 国内生产总值(y)及其位次 | 位次差的平方 | ||
人口数(万人) | 位次R1 | 产值(亿元) | 位次R2 | ||
北京 | 1257 | 26 | 2174.46 | 15 | 121 |
天津 | 959 | 27 | 1450.06 | 23 | 16 |
河北 | 6614 | 6 | 4569.19 | 6 | 0 |
... | ... | ... | ... | ... | ... |
新疆 | 1774 | 24 | 1168.55 | 25 | 1 |
∑ | 124219 | / | 87671.13 | / | 962 |
注:本表数据详见书本42页。
解:
(1) 计算秩相关系数。
n=31,n(n2-1)=29760,将表3.1.3中最后一列数据代入上面的秩相关系数公式计算得:
即:总人口(x)与国内生产总值(y)之间的等级相关系数为0.806。
(2) 秩相关系数的检验。
n=31,表中没有给出相应的样本数下的临界值 ,但同一显著水平下,随着样本数的增大,临界值ra减少。在n=30时,查表得:r0.05=0.306,r0.01=0.432,由于r`xy=0.806>r0.01=0.432,故r`xy在α=0.01的置信水平上是显著的。
2. 多要素间相关程度的测定
1) 偏相关系数的计算与检验
在多要素构成的地理系统中,当研究某一个要素对另一个要素的影响或相关程度时,把其它要素的影响视为常数,而单独研究两个要素之间的相互关系的密切程度时,称为偏相关。用以度量偏相关程度的统计量,称为偏相关系数。
(1) 偏相关系数的计算
偏相关系数矩阵:
① 一级偏相关系数的计算:
一级偏相关系数——可用单相关系数来计算。假设有三个要素x1、x2、x3,其两两之间的单相关系数矩阵为
对于上述三个要素x1、x2和x3,它们之间的偏相关系数共有三个,即r12·3,r13·2,r23·1其计算公式分别如下:
r12·3,r13·2,r23·1又称为一级偏相关系数。
② 二级偏相关系数的计算:
二级偏相关系数——若有四个要素x1、x2、x3和x4,则有六个偏相关系数,即r12·34,r13·24,r14.23,r23·14,r24·13,r34·12,称为二级偏相关系数,计算公式如下:
r12·34表示在x3和x4保持不变的条件下,x1和x2的偏相关系数,其余r23·14,r24·13,r34·12的计算公式依次类推
(2) 偏相关系数的性质
① 范围在[-1,1];
② 绝对值越大,偏相关程度越大;
③ 偏相关系数的绝对值必小于或最多等于由同一系列资料所求得的复相关系数(详见后述)。
(3) 偏相关系数的显著性检验
偏相关系数的显著性检验,一般采用t检验法。
计算公式为
[举例说明]
例3:对于某四个地理要素x1,x2,x3,x4的23个样本数据,经过计算得到了如下的单相关系数矩阵:
试计算各个一级和二级偏相关系数并对其进行显著性检验。
解:
(1) 求一级偏相关系数;
把数值代入一级偏相关系数公式计算得:
同理,依次可以计算出其它各一级偏相关系数, 见表3.1.5。
表3.1.5 一级偏相关系数
r12·3 | r13·2 | r14·2 | r14·3 | r23·1 |
0.821 | 0.808 | 0.647 | 0.895 | -0.863 |
r24·1 | r24·3 | r24·1 | R34·2 |
|
0.956 | 0.945 | -0.875 | 0.371 |
|
(2) 求二级偏相关系数;
求出一级偏相关系数后,可代入公式计算二级偏相关系数:
同理,依次可计算出其它各二级偏相关系数,见表3.1.6。
表3.1.6 二级偏相关系数
r12·34 | r13·24 | r14·23 | R23·14 | r24·13 | R34·12 |
-0.170 | 0.802 | 0.635 | -0.187 | 0.821 | -0.337 |
(3) 显著性检验。
对于r24·13=0.821,
在自由度为23-3-1=19时,查表得 t0.001=3.883,t>ta ,这表明在置信度水平 =0.001上,偏相关系数r24·13是显著的。
2) 复相关系数的计算与检验
复相关分析法能够反映各要素的综合影响。几个要素与某一个要素之间的复相关程度,用复相关系数来测定。
(1) 复相关系数的计算
复相关系数,可以利用单相关系数和偏相关系数求得。
设y为因变量,x1,x2,…,xk为自变量,则将y与x1,x2,…,xk之间的复相关系数记为Ry·12…k。则其计算公式如下。
当有k个自变量时,
(2) 复相关系数的性质
① 复相关系数介于0到1之间
② 复相关系数越大,要素(变量)的相关程度越密切。复相关系数为1,完全相关;复相关系数为0,完全无关。
③ 复相关系数必大于或至少等于单相关系数的绝对值。
(3) 复相关系数的显著性检验
一般采用F检验法。
计算公式:
n为样本数,k为自变量个数。查F检验的临界值表,可以得到不同显著性水平上的临界值Fα,若F>F0.01,则表示复相关在置信度水平a=0.01上显著,称为极显著;若 ,则表示复相关在置信度水平a=0.05上显著;若 ,则表示复相关在置信度水平a=0.10上显著;若 F
[举例说明]
例4:对于某四个地理要素x1,x2,x3,x4的23个样本数据,经过计算得到了如下的单相关系数矩阵:
若以x4为因变量,x1,x2,x3为自变量,试计算x4与x1,x2,x3之间的复相关系数并对其进行显著性检验。
解:
(1) 计算复相关系数
按照公式 计算:
(2) 显著性检验
,复相关达到了极显著水平。
本文来源:https://www.2haoxitong.net/k/doc/a44d1ff1178884868762caaedd3383c4bb4cb48c.html
文档为doc格式