正在进行安全检测...
发布时间:2023-10-31 02:51:27 来源:文档文库
小
中
大
字号:
第27卷第1期 2O11年2月 大 学 数 学 CO I I EGE MAT H EMATICS Vo1.27,№.1 Feb.2O11 相关系数矩阵与多元线性相关分析 章舜仲 。, 王树梅 (1.南京财经大学电子商务系,南京210046; 2.南京理工大学计算机科学系,南京210094) [摘 要]相关系数指度量两个随机变量间线性关系的无量纲指标,在研究了相关系数矩阵性质及其与 多元随机变量线性相关性之间关系的基础上,提出多元线性相关系数的定义,用于衡量多个变量间线性相关 强弱的无量纲指标.分析表明,所提多元线性相关系数能够较全面地反映变量间的线性相关强度. [关键词]相关系数矩阵;多元线性;主子式;特征值 [中图分类号]021 2.4 [文献标识码]C [文章编号]1672—1454(2011)01 0195—04 两个随机变量 和Y之间的线性相关程度可以用其协方差Cov(x, )和相关系数 ,来表示,由于 是一个无量纲的量,而Cov(x, )必须依赖于.27与Y的度量单位,因此实际人们总是使用相关系数来 判断z与Y的相关程度 ].对于 个随机变量 ,.27 ,…, 之间相关性,人们一般使用协方差矩阵来表 示,近年来已有一些关于 元随机变量线性相关性研究_2 ],也有关于多元线性相关系数定义的提出L4j. 本文与已有研究不同,基于最小均方误差法,在多元随机变量之间的线性相关性分析基础上,提出了新 的关于 元随机变量之间相关性度量的无量纲标量lD …… 的定义,能较好地表示多元变量问的线性 相关程度. 1相关系数矩阵性质 f 1 lDl,2 …R一 …』D1, P2,n —pn,z … 1 存在,则R有如下性质: 性质1 R是半正定矩阵. 证根据相关系数定义,有 一 , 一1,Vk一(是 , z,…,k ) ≠0,有 忌 一 一E骞klkjpo= i=1 j =l E ki X i- E(cr1)尼 E j- E(xj)] {[ i=1 x i-E (.;r1) ]。 。. 所以R是半正定矩阵.由实对称及半正定矩阵性质可知R有以下结论. (i)存在正交阵P,使得pTRp===A,其中A是以R的 个特征值为对角元素的对角阵. (ii)lRl≥O. (iii)R的所有特征值大于等于0. [收稿日期]2008—04—17
196 (iv)R的所有主子式大于等于0. 性质2 lRl≤1. 大 学 数 学 第27卷 证 设R的特征值为 , ,…, ,由于 + 。+…+ 一lD +lDzz+…十lD 一 ,由性质1可知所有 特征值非负,则有不等式 成立. ≤ ± 一lfRf≤1,等号当且仅当所有特征值均为1时 ,性质1和2表明相关系数矩阵行列式取值0和1之间,需注意该结论仅指相互之间具有线性关系 的随机变量,否则将不适用.如矩阵R 一l 1 1 0 l,l R l一一1,不在0和1区间内,原因在于:随机变 f 1 1] l1 0 1 J 量-z , :,和 。,若 和z:之间以及z 和z。之间以概率1存在线性关系,设表示为z ===a+bxz, :f+ 3,则bx2--dx3+口~f一0,z2和 3之问也具有线性关系,而矩阵Rl则表示z2和 。不存在 线性关系,说明矩阵R 所表示的随机变量不满足线性关系,因此不适用性质l和2. 2 多元随机变量间线性关系 性质3 n元随机变量 , :,…, ,若相关系数矩阵R中存在k阶(2≤志≤,2)主子式等于0,则变 量问以概率1存在线性关系. 证令R的k阶主子式 Il Pm 肫一 p 1,i2 lOi2,i2 J0订, pi2. : ● : ● , |0 ,i2 p .谴 已知f i一0,则齐次方程 x=O有非零解考===( ,龟,…, ),使得∑∑ 手 一o,将考向量扩 展至7z维,得口一(0,…,a,…,0,…,已,…,0,…, ,…,o),分量e在Ct中所处位置为其对应的P 在矩 阵R中对角线的位置,有∑∑ n n 一0.∑∑ n 。 记为e,则 e一骞骞 一E[耋骞n  ̄/D(xi) n ]一E[骞n 『. 令b 一 兰二,则 e—El∑bi(z 一E(x l—El∑bl 一∑blE(x )1. 令6一∑biE(x ),则e—EI∑bi.z 一6 I. 考虑线性函数bl37 +6 .22 +…+6 一b,均方误差 一E[-(b +6:-z:+…+6 一6)] ===e:0, 值越小表示变量间的线性关系越弱, =0时变量间以概率1存在线性关系. 性质4若 元随机变量.27 , ,…, 之间以概率1存在线性关系,即有一组不全为0实数b , …,b ,b,使得P(b +6 Iz +…+6 z ===6)一1,则有1RI一0. 证 由已知条件,线性函数b +b:z:+…+6 z 一6的均方误差 P—E[(6lz1+62z2+…+,) lz -