正在进行安全检测...

发布时间:2023-10-31 02:51:27   来源:文档文库   
字号:
第27卷第1期 2O11年2月 大 学 数 学 CO I I EGE MAT H EMATICS Vo1.27,№.1 Feb.2O11 相关系数矩阵与多元线性相关分析 章舜仲 。, 王树梅 (1.南京财经大学电子商务系,南京210046; 2.南京理工大学计算机科学系,南京210094) [摘 要]相关系数指度量两个随机变量间线性关系的无量纲指标,在研究了相关系数矩阵性质及其与 多元随机变量线性相关性之间关系的基础上,提出多元线性相关系数的定义,用于衡量多个变量间线性相关 强弱的无量纲指标.分析表明,所提多元线性相关系数能够较全面地反映变量间的线性相关强度. [关键词]相关系数矩阵;多元线性;主子式;特征值 [中图分类号]021 2.4 [文献标识码]C [文章编号]1672—1454(2011)01 0195—04 两个随机变量 和Y之间的线性相关程度可以用其协方差Cov(x, )和相关系数  来表示,由于 是一个无量纲的量,而Cov(x, )必须依赖于.27与Y的度量单位,因此实际人们总是使用相关系数来 判断z与Y的相关程度 ].对于 个随机变量 ,. ,…, 之间相关性,人们一般使用协方差矩阵来表 示,近年来已有一些关于 元随机变量线性相关性研究_ ],也有关于多元线性相关系数定义的提出L4j. 本文与已有研究不同,基于最小均方误差法,在多元随机变量之间的线性相关性分析基础上,提出了新 的关于 元随机变量之间相关性度量的无量纲标量lD …… 的定义,能较好地表示多元变量问的线性 相关程度. 相关系数矩阵性质  1 Dl …R一 D1 P2,n pn,z … 1 存在,则R有如下性质: 性质1 R是半正定矩阵. 根据相关系数定义,有 一 , 一1,Vk一(是 , z,…,k ) ≠0,有 忌 一 骞k                  。 所以R是半正定矩阵.由实对称及半正定矩阵性质可知R有以下结论. (i)存在正交阵P,使得pTRp=A,其中A是以R的 个特征值为对角元素的对角阵. (i)lRl≥O. (i)R的所有特征值大于等于0. [收稿日期]2008—04—17 
196 (iv)R的所有主子式大于等于0. 性质2 lRl≤1. 大 学 数 学 第27卷 证 设R的特征值为 , ,…, ,由于 + 。+…+ 一l +lDzz+…十lD 一 ,由性质1可知所有 特征值非负,则有不等式 成立. ≤ ± 一lRf≤1,等号当且仅当所有特征值均为1时 性质1和2表明相关系数矩阵行列式取值0和1之间,需注意该结论仅指相互之间具有线性关系 的随机变量,否则将不适用.如矩阵R 一l  1 0 l,l R l一一1,不在0和1区间内,原因在于:随机变  1 1]  0 1  量-z , :,和 。,若 和z:之间以及z 和z。之间以概率1存在线性关系,设表示为z ==a+bxz, :f+ 3,则bx2-dx3+口~f一0,z2和 3之问也具有线性关系,而矩阵Rl则表示z2和 。不存在 线性关系,说明矩阵R 所表示的随机变量不满足线性关系,因此不适用性质l和2. 2 多元随机变量间线性关系 性质3 n元随机变量  :,…, ,若相关系数矩阵R中存在k阶(2≤志≤,2)主子式等于0,则变 量问以概率1存在线性关系. 令R的k阶主子式  Pm 一 p 1, Oi2,i2 0订, pi2. : ● : ● , 0 ,i2 p .谴 已知f 一0,则齐次方程 x=O有非零解考==( ,龟,…, ),使得∑∑ 手 一o,将考向量扩 展至7z维,得口一(0,…,a,…,0,…,已,…,0,…, ,…,o),分量e在Ct中所处位置为其对应的P 在矩 阵R中对角线的位置,有∑∑ n  一0.∑∑ n 。 记为e,则 e一骞骞 一E耋骞n /D(xi  一E[骞n 『. 令b 一 兰二,则 —El∑b 一E( l—El∑b 一∑bE( )1. 令6一∑bE(x ),则e—EI∑b 一6 I. 考虑线性函数bl37 +6 . +…+6 一b,均方误差 一E[-(b +6:-z:+…+6 一6)] ==e:0, 值越小表示变量间的线性关系越弱, =0时变量间以概率1存在线性关系. 性质4若 元随机变量. , ,…, 之间以概率1存在线性关系,即有一组不全为0实数b , b ,b,使得P(b +6 Iz +…+6 z ==6)一1,则有1RI一0. 证 由已知条件,线性函数b +b:z:+…+6 z 一6的均方误差 P—E[(6lz1+62z2+…+, lz -b)] 一0. 因为 b===E(blz1+6zzz+…+6 ), —E ∑b 一∑bE( )I=El∑b  一E( )l, 
第1期 令& 一b  ̄/D(z ),贝0 
e=E章舜仲,等:相关系数矩阵与多元线性相关分析 197 
          +…+      . 一0. (1) 所以有n 'n一∑∑aia, .由R的性质,存在正交阵P,a=Py,使得yTAy一0,其中A是以R的特征 值 为对角元素的对角阵,则有下式 由R的性质可知 ≥0.又由Y—P a,l P l≠0,可知Y一0,则(1)式若要成立必存在零特征值, 所以fR f一0. 多元线性相关系数 由以上线性相关性分析可知,71元随机变量 ,z。,…, 的线性相关程度由均方误差e衡量, e=a'Ra= Y— +…+ ≥0.当变量的线性组合为常系数方程时,e的大小由特征值 , 。,…, 决定,特征值越小 越小.当有零特征值时,8—0.因此特征值乘积即相关系数矩阵R的行列式lRl在一 定程度上反映了”元随机变量的线性相关程度,I R 越小,线性相关程度越高,则1一I R 1可作为线性相 关度量指标,0≤1一lRI≤1.当1一lRl一1时,变量间以概率1存在线性关系. 然而由性质3可知,在 个随机变量中,若有任意是(是≥2)个变量之问以概率1存在线性关系即意 味着这 个随机变量之间的完全线性相关,比较以下两个矩阵. 1 1 0 0 1 R 一 O O 1 0 0 0 0 1 1 1 1 0 1 0 0 , 1 1 1 0 Ry一 1 1 1 0 O 0 O 1 R 和R 分别是两组随机变量X一(z ,.z。,…)和j,一( ,-y2,…)所对应的相关系数矩阵,其中X中有两 个分量 和z 完全相关,Y中有三个分量  和Y。两两完全相关,明显Y相比 应该具有更高的相 关性度量值.然而l R l—l R l==0,此时整体相关性被若干分量之间的相关性屏蔽,1一l R l指标不能较 好地反映一组随机变量的整体相关性.为此我们考虑矩阵秩的因素,定义多元随机变量问的线性相关系 数如下: p 一 Dx一—— 二丁一 (2) 式(2)px定义了”元随机变量X一(z , 。,…, )的线性相关系数, 的相关系数矩阵R的秩为r,IR I 为最大非零子式.分析该式,由于O<fR i≤l,1≤r≤ ,则O≤px≤1. 按式(2)计算以上两个矩阵R 和R 的相关系数,有   , === 号.  (R )> (R ),公式能够反映X和Y之间相关性的差别.下面对几种情形进行讨论. (i)只有两个变量z 和 :. 此时n一2相关系数矩阵为( )=0时,秩为2 一  一。—1时,秩为] 一l因 <l<1时,秩为2最大非零子式即矩阵x一1 一 ±丢 此在只有两个变量时,式(2)的多元线性相关系数即为相关系数的平方. (i 个变量之间两两相关系数为0.此时矩阵秩为 ,最大非零子式即矩阵行列式等于1, 
198 大 学 数 学 第27卷 _o. (i)n个变量之间两两相关系数为1.此时矩阵秩为1, n——1+1——1 —— 二广一L (iv)若n个变量中有m个两两相关,系数1,其余则为0.则此时矩阵秩为 一 +1,最大非零子式 为1, ( —m+1)十1—1
1 
 
 
 
‘ 4 结 论 
随机变量的相关系数矩阵反映了变量相互间的线性相关程度,本文通过对相关系数矩阵的分析,分 析了多元随机变量之间的线性关系和其相关系数矩阵的关系,提出了一个多元线性相关系数的定义,能 够较好地反映随机变量之间的整体线性相关程度.多相关系数取值0和1之间,系数为0表示任意变量 之间均不存在线性关系,系数越大表示相关程度越高,系数为1则表示变量之间的任意组合均为概率l 存在线性关系. [参 考 文 献] [1] 谢明文.关于协方差、相关系数与相关性的关系[J].数理统计与管理,2004,23(3):33—36. [2] 蒋福坤,刘正春,柴惠文.多维随机变量的线性相关性fJ].数理统计与管理,2008,27(1):96—99. [3] Takahashi Susumu.A study on mul relaton coefnt among varables[J].Proceedings of the School of Information Technology and Electronics of Tokai University,2004,4(1):67—72. [4] Bocchieri E,Mark B.Subspace distributon clusterng hidden Markov model[J].IEEE Transactons on Speech and Audio Processing,200i,9(3):264—275. Analysis on Correlation Coefficients Matrix and MultivariabIe Linear Correlation ZHANG Shun—zhong ~。WANG Shu一 ei (1.Department of E-Business,Nan]ing University of Finance and Economies,Nanjing 210046,China; 2.Department of Computer Science,Naniing University of Science and Technology,Nanjing 210094,China) Abstract:Correlation coefficient is a non—dimensional index for measuring the linearity between two variables.0n the basis of studying correlation coefficients matrix and its relation to the linearity among multiple variables,this paper proposed a definition of multivariable correlation coefficient,which is a non-dimensional index for evaluating the linear ntensity among multiple variables.Analysis shows the multivariable correlation coefficient presented in the paper can comprehensively express the lnearity among multiple variables, Key words:correlation coefficients matrix;multivariable linearity;principal minor determinant;eigenvalues 

本文来源:https://www.2haoxitong.net/k/doc/2af0f651340cba1aa8114431b90d6c85ed3a8857.html

《正在进行安全检测....doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式