摘要本文讨论了28位19-22岁男学生的10项体检指标间的相关性问题。
针对问题一,建立多元数据的相关分析模型,利用Matlab软件通过计算样本数据的均值、方差及协方差,得到观测数据的协方差矩阵;进一步利用Pearson相关系数计算其样本数据的相关矩阵。
针对问题二,同理,利用秩的概念结合Spearman相关系数计算其Spearman相关矩阵。
针对问题三,计算Pearson相关矩阵和Spearman相关矩阵的p值,检验各对变量的相关系数是否为零。并得出结论:对于Pearson相关矩阵R的对应p值,对显著水平0.01,身高与坐高、体重、肺活量,坐高与体重、肺活量,体重与胸围、肺活量,胸围与肺活量的相关性较强,数据具有明显统计意义;对于Spearman相关矩阵Q的对应p值,对显著水平0.01,身高与坐高、体重,坐高与体重、肺活量,体重与胸围、肺活量,胸围与肺活量,脉搏与肺活量,收缩压与舒张压的相关性较强,数据具有明显统计意义。
关键词协方差矩阵;Pearson相关矩阵;Spearman相关矩阵
1
多元数据相关分析习题解答
1.9.1计算样本数据的协方差矩阵和Pearson相关矩阵
设(X1,X2,,XPT是p元总体,其样本数据观测矩阵为
x11x21xn1xxx1222n2
X
x1px2pxnp
X为pn矩阵,n个列即是n个样品x1,x2,,xn,且组成来自p元总体
(X1,X2,,XPT的样本;p个行分别是p个变量X1,X2,,XP在n次实验中所取的值,记x(j(x1j,x2j,,xnjT,(j1,2,,p,因而有
x