相关矩阵

发布时间:   来源:文档文库   
字号:


本文讨论了2819-22岁男学生的10项体检指标间的相关性问题。
针对问题一,建立多元数据的相关分析模型,利用Matlab软件通过计算样本数据的均值、方差及协方差,得到观测数据的协方差矩阵;进一步利用Pearson相关系数计算其样本数据的相关矩阵。
针对问题二,同理,利用秩的概念结合Spearman相关系数计算其Spearman相关矩阵。
针对问题三,计算Pearson相关矩阵和Spearman相关矩阵的p值,检验各对变量的相关系数是否为零。并得出结论:对于Pearson相关矩阵R的对应p,对显著水平0.01,身高与坐高、体重、肺活量,坐高与体重、肺活量,体重与胸围、肺活量,胸围与肺活量的相关性较强,数据具有明显统计意义;对于Spearman相关矩阵Q的对应p,对显著水平0.01,身高与坐高、体重,坐高与体重、肺活量,体重与胸围、肺活量,胸围与肺活量,脉搏与肺活量,收缩压与舒张压的相关性较强,数据具有明显统计意义。

关键词协方差矩阵;Pearson相关矩阵;Spearman相关矩阵
1


多元数据相关分析习题解答
1.9.1计算样本数据的协方差矩阵和Pearson相关矩阵
(X1,X2,,XPTp元总体,其样本数据观测矩阵为
x11x21xn1xxx1222n2
X
x1px2pxnp
Xpn矩阵,n个列即是n个样品x1,x2,,xn,且组成来自p元总体
(X1,X2,,XPT的样本;p个行分别是p个变量X1,X2,,XPn次实验中所取的值,记x(j(x1j,x2j,,xnjT,(j1,2,,p,因而有
xT1Tx2X
TxP
则样本观测数据的第jx(j均值为
1n
1xjxij(j1,2,,p
ni1
jx(j方差
1n
sj(xijxj2(j1,2,,pn1i1
2
x(j,x(k的协方差
1n
2sjk(xijxj(xikxk(j,k1,2,,pn1i1
则协方差矩阵为
s11s12s1p
sss21222p3sp1sp2spp
其中sijsjiij故协方差矩阵为对角阵(以下计算结果只写下三角部分)相关矩阵是p元观测数据的最重要的数字特征,它刻画了变量之间线性联系的密切程度。因此建立样本观测数据的Pearson相关矩阵,主要是确定其x(j,x(k相关系数,即x(jx(k的相关程度:
rjk
sjksjjskk
sjksjsk
(j,k1,2,,p4
且总有rjj1,rjk1
进而得到Pearson相关矩阵为
2


1r12r1pr1r212pR5rr1p1p2
其中rijrjiij),故Pearson相关矩阵为对角阵(以下计算结果只写下三
角部分)。而R常常是正定的。
对公式(123)结合原始数据利用Matlab软件求解得到其协方差矩阵为
2.06360.9450
2.1058
0.79470.1185
0.05540.4715
1.185828.1324175.0926
40.47370.95340.37340.07680.06260.6516
2.94741.22190.18910.03922.0168
1.78550.13280.20650.16950.243226.2583
0.07610.46142.5559
0.14760.39685.37238.7672

2.6922

0.25566.5499
21.291550.111014091.3314
122.6315139.12413353.198126019.8148
0.17201.16390.82600.07620.037418.350416.9186
78.5150213.4019104.94546.9267
对公式1245结合原始数据利用Matlab软件求解得到其Pearson
相关矩阵为
10.95571
0.85390.80681
10.41400.40600.5326
0.18150.24560.24230.05411R
0.10040.23470.05950.33020.43580.20000.15230.41320.37670.1022
0.32250.36990.45900.07110.39670.39000.40290.40980.46760.08070.75560.70720.77060.48690.0945

1

0.06081
0.06490.47431

0.46330.33700.17511
10.00540.42030.33950.1218
1.9.2计算Spearman相关矩阵
对于n元总体(X1,X2,XnT的样本观测数据:
x11,x12,,x1nT,x21,x22,,x2nT,……,xp1,xp2,,xpnT
X1的秩统计量:S11S12,S1n……
Xp的秩统计量:Sp1Sp2,Spn
Spearman相关系数为
qjk
(S
i1
n
ji
Sj(SkiSk
(S
i1
n
ji
Sj2
(S
i1
n

ki
Sk2
3


1n
其中SjSji(i1,2,,n
ni1
由秩的定义可知:
1n1nn1SjSjj(j1,2,,p
nj1nj12
易得qjk1其中diSjiSki(i1,2,,n
6
2
n(n
j,k1,2,,p
d1
i1
n
2i
6
样本观测数据的Spearman相关系数记为qjk,则Spearman相关矩阵为:
1q12q1p
q1q212p7Qqq1p1p2
其中qijqjiij时,Spearman相关矩阵为对角阵(以下计算结果只写下
三角部分)。
根据公式(6)(7)结合原始数据利用Matlab软件对样本数据求解得到其Spearman相关矩阵为:
10.940710.84380.794710.40030.35850.541910.37580.34390.33700.16731Q
10.11050.23160.12460.33290.2904
0.19290.17030.41750.36570.03670.02151
10.26830.28130.39170.10110.41610.35330.0205
0.41920.34630.39890.41550.22850.36090.08650.520010.73400.73180.81610.52160.17030.21950.49330.36350.27271
1.9.3分析各指标间的相关性
Pearson相关矩阵的基础上利用Matlab软件计算其p值为(只写下三角部分):
000

0.03210.00350
0.20780.21400.78460

0.22930.76370.08610.43580
0.43900.02890.04810.60480.75710

0.05270.01400.71910.03660.02760.75840
0.03350.03030.01210.68310.07710.74280.01080

000.00860.63440.53700.01300.07950.26560
对于Pearson相关矩阵,对显著水平0.01p12p13p1,10p23p2,10

4
0
00
0.02850.3554p
0.61120.3074
0.09410.04020


p34p3,10p4,10p值均小于0.01,故认为X1(身高)与X2(坐高)、X3(体重)、X10(肺活量),X2(坐高)与X3(体重)、X10(肺活量),X3(体重)与X4(胸围)、X10(肺活量),X4(胸围)与X10(肺活量)具有较强相关性,数据具有明显统计意义,其他元素rjkp值皆大于0.01,故可认为rjk无明显统计意义。
Spearman相关矩阵的举出上利用Matlab软件求得其p值为(只写下三角部分):
0000000.03480.06170.003300.04880.07320.07950.39490p
00.57560.23570.52770.08350.1338
0.32530.38630.02710.05560.85290.72870
00.16750.14700.03930.60880.02760.06520.9173
0.02660.07100.03680.02790.23890.05920.66150.00460000.00500.38630.18230.00760.05730.164000对于Spearman相关矩阵,对显著水平0.01,有p12p13p1,10p23
p2,10p34p3,10p4,10p7,10p89p值均小于0.01,故认为X1(身高X2(坐高X3(体重)、X10(肺活量),X2(坐高)与X3(体重)、X10(肺活量),X3(体重)与X4(胸围)、X10(肺活量),X4(胸围)与X10(肺活量),X7(脉搏)与X10(肺活量),X8(收缩压)与X9(舒张压)具有较强相关性,数据具有明显统计意义,其他元素rjkp值皆大于0.01,故可认为rjk无明显统计意义。
5

本文来源:https://www.2haoxitong.net/k/doc/bcc81373bb68a98271fefaab.html

《相关矩阵.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式