协方差矩阵和相关矩阵

发布时间:2018-06-27 17:32:00   来源:文档文库   
字号:

一、协方差矩阵

变量说明:

word/media/image1.gif为一组随机变量,这些随机变量构成随机向量word/media/image2.gifword/media/image3.gifword/media/image4.gifword/media/image5.gif,每个随机变量有m个样本,则有样本矩阵

               word/media/image6.gif                

word/media/image7.gif  

其中word/media/image8.gif对应着每个随机向量X的样本向量,word/media/image9.gif对应着第i个随机单变量的所有样本值构成的向量。

单随机变量间的协方差:

随机变量word/media/image10.gif之间的协方差可以表示为

           word/media/image11.gif    

根据已知的样本值可以得到协方差的估计值如下:

                word/media/image12.gif   

可以进一步地简化为:

                           word/media/image13.gif               

协方差矩阵:

word/media/image14.gif 

                        word/media/image15.gif5

其中word/media/image16.gif,从而得到了协方差矩阵表达式。

如果所有样本的均值为一个零向量,则式(5)可以表达成:

word/media/image17.gif   

补充说明:

1、协方差矩阵中的每一个元素是表示的随机向量X的不同分量之间的协方差,而不是不同样本之间的协方差,如元素Cij就是反映的随机变量Xi, Xj的协方差。

2、协方差是反映的变量之间的二阶统计特性,如果随机向量的不同分量之间的相关性很小,则所得的协方差矩阵几乎是一个对角矩阵。对于一些特殊的应用场合,为了使随机向量的长度较小,可以采用主成分分析的方法,使变换之后的变量的协方差矩阵完全是一个对角矩阵,之后就可以舍弃一些能量较小的分量了(对角线上的元素反映的是方差,也就是交流能量)。3、必须注意的是,这里所得到的式(5)和式(6)给出的只是随机向量协方差矩阵真实值的一个估计(即由所测的样本的值来表示的,随着样本取值的不同会发生变化),故而所得的协方差矩阵是依赖于采样样本的,并且样本的数目越多,样本在总体中的覆盖面越广,则所得的协方差矩阵越可靠。

4、如同协方差和相关系数的关系一样,我们有时为了能够更直观地知道随机向量的不同分量之间的相关性究竟有多大,还会引入相关系数矩阵。

5协方差作为描述XY相关程度的量,在同一物理量纲之下有一定的作用,但同样的两个量采用不同的量纲使它们的协方差在数值上表现出很大的差异。由此引入相关系数。

word/media/image18.gif

二、相关矩阵(相关系数矩阵)

相关系数:

       著名统计学家卡尔·皮尔逊设计了统计指标——相关系数。相关系数是用以反映变量之间相关关系密切程度的统计指标。相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数

       依据相关现象之间的不同特征,其统计指标的名称有所不同。如将反映两变量间线性相关关系的统计指标称为相关系数(相关系数的平方称为判定系数);将反映两变量间曲线相关关系的统计指标称为非线性相关系数、非线性判定系数;将反映多元线性相关关系的统计指标称为复相关系数、复判定系数等。

       相关系数用r表示,它的基本公式(formula)为:

                   

  相关系数的值介于–1+1之间,即–1≤r≤+1。其性质如下:

r>0时,表示两变量正相关,r<0时,两变量为负相关。

|r|=1时,表示两变量为完全线性相关,即为函数关系

r=0时,表示两变量间无线性相关关系

0<|r|<1时,表示两变量存在一定程度的线性相关。且|r|越接近1,两变量间线性关系越密切;|r|越接近于0,表示两变量的线性相关越弱。

一般可按三级划分|r|<0.4为低度线性相关;0.4≤|r|<0.7为显著性相关;0.7≤|r|<1为高度线性相关。

       相关矩阵也叫相关系数矩阵,是由矩阵各列间的相关系数构成的。也就是说,相关矩阵第i行第j列的元素是原矩阵第i列和第j列的相关系数。

3、协方差矩阵和相关矩阵的关系

    由二者的定义公式可知,经标准化的样本数据的协方差矩阵就是原始样本数据的相关矩阵。这里所说的标准化指正态化,即将原始数据处理成均值为0,方差为1的标准数据。

    即:

                                     X'=(X-EX)/DX

本文来源:https://www.2haoxitong.net/k/doc/0b721cec9b89680203d825f3.html

《协方差矩阵和相关矩阵.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式