相关性分析

发布时间:2019-01-01 07:14:37   来源:文档文库   
字号:

word/media/image2.gif第八章 相关分析

教学目的与要求

通过本章的学习,使学生了解相关关系和相关分析基本概念,掌握相关分析理论。学生必须深刻领会相关关系的概念,弄清相关分析和回归分析之间的关系,掌握相关分析和回归分析的统计分析方法。

重点和难点

相关分析的概念

相关系数的含义与计算

回归方程的建立

回归系数的含义

【课堂讲授内容】

前述分析方法如综合分析法、动态分析法、因素分析法、抽样推断法均是对同一现象的数量特征进行描述和分析,而相关分析与之最大区别为相关分析侧重于两个现象之间的数量联系的研究,当然也不排除时间数列的自相关分析。相关分析有广义与狭义之分,广义的相关分析还包括回归分析,本章的相关分析是广义的概念。

第一节 相关分析概述

一、变量关系的类型

在大量变量关系中,存在着两种不同的类型:函数关系和相关关系。

是指变量之间存在的一种完全确定的一一对应的关系,它是一种严格的确定性的关系。

是指两个变量或者若干变量之间存在着一种不完全确定的关系, 它是一种非严格的确定性的关系。

word/media/image4.gif两者之间的联系:

1 由于人类的认知水平的限制,有些函数关系可能目前表现为相关关系。

2 对具有相关关系的变量进行量上的测定需要借助于函数关系。

二、相关关系的种类

word/media/image5.gif按照相关关系涉及的因素的多少,可分为 单相关

复相关

按照相关关系的方向,可分为 正相关

负相关

按照相关的表现形式,可分为 直线相关

曲线相关

word/media/image6.gif按照相关的程度,可以分为 完全相关

完全不相关

不完全相关

三、相关分析的内容

对于相关关系的分析我们可以借助于若干分析指标(如相关系数或相关指数)对变量之间的密切程度进行测定,这种方法通常被称作 (狭义概念),广义的相关分析还包括回归分析。对于存在的相关关系的变量,运用相应的函数关系来根据给定的自变量,来估计因变量的值 ,这种统计分析方法通常称为。相关分析和回归分析都是对现象的之间相关关系的分析。广义相关分析包括的内容有:

第二节 一元线性相关分析

一、 相关关系密切程度的测定

在判断相关关系密切程度之前,首先确定现象之间有无相关关系。确定方法有:一是根据自己的理论知识和实践经验综合分析判断;二是用相关图表进一步确定现象之间相关的方向和形式。在此基础上通过计算相关系数或相关指数来测定相关关系密切的程度。相关系数是用来说明直线相关的密切程度;相关指数则是用来判断曲线相关的密切程度。这是主要介绍相关系数的计算。

是用来分析判断直线相关的方向和程度的一种统计分析指标,其计算方法中最简单是最常用的为,是用两个变量的协方差与两变量的标准差的乘积之比来计算的,计算公式如下:

word/media/image8_1.pngword/media/image9_1.png (1)

word/media/image10_1.png (2)

13ec21784d882c3e6310127b63dad285.png (3)

上述三个公式均可以使用,由于(3)式是通常原始资料计算,所以较为准确,也较为常用。相关系数的取值范围是:-1r+1 正的表示正相关负的表示负相关

利用相关系数判断相关关系的密切程度通常认为

二、一元线性回归分析

是对具有相关关系的两个变量之间的数量变化的一般关系确定一个合适的数学表达式,以便进行估计和预测的统计方法。用一条回归直线来表明两个相关变量之间一般数学关系的方程式,成为。这种分析方法称为

(一) 一元线性回归分析的特点

1. 在两个变量之间,必须根据研究目的具体确定哪个是自变量(x),哪个是因变量(y)。

2. 没有明显因果关系的两个变量(x)(y)可以求得两个方程——yx回归方程和xy的回归方程.两个方程式相互独立的,不能相互替换。

3. 回归方程的主要作用在于给出自变量的数值来估计因变量的数值。一个回归方程只能做一种推算

4.计算相关系数时, 要求相关的两个变量都是随机的变量;但是进行回归分析时,尽管两个变量也都是随机变量,但要求自变量是给定的,因变量是随机的。

(二) 一元线性回归模型与参数估计

1.直线方程的模型为:

word/media/image15_1.png

式中,yc 表示因变量的估计理论值;x 为自变量的实际值; ab为待定参数。其几何意义是:a是直线方程的截距b是斜率。其经济意义是:ax等于0时, y的估计值;b是当x每增加一个单位时,y平均增加或减少的量,b也叫回归系数。(与相关系数的关系

ab两个参数的计算公式为:

word/media/image16.gif07b21c8f8fa207154603608cd9ecda8e.png

79e83fb4faf73ae0643b3209dc7f0647.png

2.一元线性回归方程的估计标准误差

估计标准误差是用来说明回归方程代表性大小的统计分析指标,是指示实际观察值和理论值的平均误差。其计算公式为:

b1ba48ae3cb3073db0697bf0af6234be.png

然而,估计标准误差根号内的分母部分不是n,而是n-2,其表示估计回归线失去两个自由度,即样本数据的个数减去自变量的个数(m=1),再减1。在实际应用中,当n很大时,一般是n30时,计算估计标准误差时就用n来代替n-2,则计算公式就成为:

word/media/image20_1.png

简便公式为:

82296ff79cf3f8b5a4a4ea109d6b15db.png

第三节 多元线性相关分析*

一、多元线性相关的涵义

在统计中,研究一个变量与多个变量之间相关关系的理论和方法,称为;研究一个因变量和多各自变量的回归分析就是。多元回归可分为两个主要方面:一是线性回归;二是非线性回归。

二、多元线性回归模型

多元线性回归模型

多元线性回归模型的一般表达式为

f2f39c476cf1fc03841896d08fb995af.png

式中,3e5dc8a9e58fac43ec3377c25606be6b.png表示截距,5f55e710a6e786875c52420bc72acb64.png分别表示与个自变量相联系的斜率,24d83a37508452537d66cff51c78d168.png表示剩余残差项或称作随机扰动项服从e532a8c8c424a8e03cd98ba573c7020a.png

多元线性回归方程为:

93fe7aa7ec457a54cbad7e511c061b88.png

方程式中的参数3e5dc8a9e58fac43ec3377c25606be6b.png,5f55e710a6e786875c52420bc72acb64.png的求解方程式组为:

word/media/image28.gif3fd8fe34b4de54880db871bf57e5ed16.png

9163a295065fb860ba0673073d3f9f85.png bba1a93db2518a3e3a42a474d71309df.png

………………………

8ec10c0960f35d30eb3b6309c8a96cf0.png

(二)二元线性回归模型

两个自变量(用word/media/image33_1.pngword/media/image34_1.png表示)分别与因变量之间呈现线性相关时,可用二元线性回归模型来表示:

f94ea622e4807b4db29d2f40b4d2714f.png

上式中,24d83a37508452537d66cff51c78d168.png表示剩余残差项或称作随机扰动项服从e532a8c8c424a8e03cd98ba573c7020a.png

二元线性回归方程:

08c3192e3b350b84d1eb4365e9a9b368.png

求解4d57b7c1dbd5fea1a66e3c9c0c765aa4.png参数的方程组为:

word/media/image38.gif3f197539c34503def655bcf40a4e9980.png

7e81aeefa36cdbc1c4d3a687752585f3.png

a44b6ea802dedfbc0414cf00b72dad1d.png

三、多元线性回归方程的估计标准误差

在多元线性回归分析中,回归估计标准误差的计算同一元线性回归标准误差的计算方法相同。公式如下:c151ca6a7bf86811da86c6d3e3c209df.png

四、复相关系数和偏相关系数

(一) 复相关系数

复相关系数是指在具有多元相关关系的变量中,用来测定因变量y与一组自变量word/media/image43_1.png之间相关程度的指标。

复相关系数的计算公式为:

237a7a31dc85bd21deedd01b07086587.png

复相关系数的取值是介于-1+1之间,和简单相关系数一样,也是用其绝对值的大小来判断相关的密切程度。

偏相关系数

偏相关系数是在多个变量中,当其他变量保持不变的情况下,测定任意两个变量之间的相关程度的指标。偏相关系数取值是介于-1+1之间,和简单相关系数一样,也是用其数值的大小来判断相关的密切程度。

设有三个变量word/media/image45_1.png,如果在这三个变量中,剔除word/media/image46_1.png的影响,可计算word/media/image47_1.pngword/media/image48_1.png word/media/image46_1.png偏相关系数,记作word/media/image49_1.png,其计算公式为:

b8d6d1c61602387409f955cc14b0e744.png

如果在这三个变量中,剔除word/media/image51_1.png的影响,可计算word/media/image47_1.pngword/media/image52_1.png word/media/image53_1.png偏向关系数,记作word/media/image54_1.png,其计算公式为:da124e48f73025ee3dee19546a190959.png

如果在这三个变量中,剔除word/media/image56_1.png的影响,可计算word/media/image57_1.pngword/media/image58_1.png word/media/image59_1.png偏向关系数,记作word/media/image60_1.png,其计算公式为:b1bc2ea5a56bb26ee1243b624d45c129.png

【知识要点网络图】

word/media/image62.gif

word/media/image63_1.png【随堂练习】

1.抽取由10名大学生组成的随机样本,研究他们在高中与大学的英语成绩得出下表结果:

试用相关系数r测定其相关程度。

2.下面是几家百货商店销售额和利润率的资料:

要求:

以纵轴表示利润率,横轴表示每人月平均销售额,画

出散点图,观察并说明两变量之间存在何种关系。

计算每人月平均销售额与利润率之间的相关系数,并说明

其相关的密切程度。

求出利润率对每人月平均销售额的回归方程,解释方程式

斜率的经济意义,并在散点图中绘制出回归直线。

若商店每人月平均销售额2千元,试估计其利润率。

计算估计标准误差。

本文来源:https://www.2haoxitong.net/k/doc/d394ace8172ded630b1cb653.html

《相关性分析.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式