多元回归(多重共线-异方差-残差检验eviews-spss)

发布时间:   来源:文档文库   
字号:
数据处理:4.3模型建立
设年末实有耕地面积,有效灌溉率,农用塑料薄膜使用量,农药使用量,农业机械总动力,农业从业人数,农业投资额分别为X1,X2,L,X7农业产值为Y此我们假设上述七个变量都与农业产值有显著影响,SPSS中用进入法对其做出预判。
4-3回归预判表
模型(常数)年末实有耕地面积有效灌溉率

农用塑料薄膜使用量
农药使用量农业机械总动力农业从业人数农业投资额
因变量:农业产值
非标准化系数
标准化系数
共线性统计允差.026
B1.987E-15.225.208-.396-.426.831.024.197
标准误差.018.291.116.489.564.282.179.140
Bata
.225.208-.396-.426.831.024.197
T.000.7751.797-.810-.7562.946.1361.401
显著性1.000.464.115.445.475.022.895.204
VIF
38.086
.004239.655.001677.462.001899.494.004225.582.011.018
90.38155.747

可以从表中得出回归方程:
Y0.225X10.208X20.396X30.426X40.831X50.024X60.197X7
从显著性水平上看,小于0.05的只有一个农业机械动力,显然不能够准确的表达出与农业产值之间的关系。根据表中的VIF值均大于10其中四个大于了100,这说明模型中存在严重的多重共线性。并且在相关系数表中(附表1-2我们也能够看出各个自变量之间相关系数较大,有较大的相关性。为了保证得到的回归模型能较好的反映真实意义,就要解决多重共线性问题。解决多重共线性我们一般使用逐步回归的方法。
4.3.1逐步回归
将标准化后的数据输入EVIEWS,首先找出与因变量拟合度最高自变量,的经过回归拟合可以得出7个变量的拟合优度,按降序排列如下表:



4-4拟合优度表
变量拟合优度0.9843250.9722720.9720240.9069870.9030330.845010.684597
X5X3X4X1
X7X2X6

拟合优度的大小也能在一定程度上表现出自变量与因变量的影响大小。这里
X5是农业机械总动力,说明农业机械总动力对农业产值有较大的影响。在近年来江苏省整体经济发展迅速,科技水平大大提高,使农业的机械化水平发展迅速,机械设备的使用极大促进了农业产值的提高。
由表44得,YX5的拟合优度最高,故YX5作为基本方程。依次按拟合优度降序排列进入模型,检验新进入的变量是否显著并且拟合优度是否提高。合优度排第二的是变量X3,所以将X3进入基础模型。
X3进入基本方程,结果如下图:
4-1变量判断图


从图41的运行结果我们可以看出,X3的估计量对应的p0.8094大于

0.05,不显著,所以X3不符合回归模型。X3是农膜使用量,可以看出其对农业
产值的影响不显著。农膜主要使用在经济作物的种植中,近年来有部分农户利用地膜覆盖技术和塑料大棚进行种植、栽培瓜果蔬菜,获得了可观的收益,但是普及率不是很高,是一个对农业产值的影响不是很大。
所以我们不选择变量X3,再将X4进入基本方程。
4-2第一步逐步回归图


由图42可以看出,X4的估计量对应的p0.8548值大于0.05,所以没有显著性,所以X4同样不符合回归模型,故删去变量X4X4为农药使用量,所以农药使用量对农业产值没有显著影响。
再将X1,X7,X2,X6依次进入方程判断最优拟合方程,X1X6不显著,X7著,X2也是具有显著性的,表明农业投资额,有效灌溉率对农业产值也有显著影响,但是农业投资额对农业产值的影响大还是有效灌溉率对农业产值的影响大,还需要进一步比较。

4-5拟合优度表

变量常数
1
系数
标准差
t
p1.00000.00000.00111.00000.24530.0000
0.9860580.9937700拟合优度
-1.57E-070.022013-7.11E-060.765190.2468768.13E-100.9999220.901298
0.0578830.0578830.032930.08180.0818
13.219694.265182.47E-081.22154411.01832
X5X7
常数
2
X2X5


由表45可得,但由于模型YX5X7的拟合优度为0.993770模型YX2X5
的拟合优度为0.986058比较他们两个的拟合优度,发现模型YX5X7的拟合优度较大,故选则YX5X7作为基本方程。然后按照第一次逐步回归法的步骤依次添加变量,并根据p值判断其显著性。
Y
X5X7X2p
p20.0107,p20.0000,p20.0001,均显著。经过逐步回归依次得到农业机械总动力,农业投资额,有效灌溉率对农业产值的影响较为显著。估计结果如下图:
4-3逐步回归模型结果图


从图43中可以得出系数:
01.59107,20.129540,50.263208,70.263208
所以写出对应的估计方程为:
Y1.591070.129540X20.632418X50.263208X7
得出估计方程还要进行各项检验,只有通过检验才能说明我们得到的方程有效,才具有实际意义。
4.3.2F检验
F检验的原假设和备择假设如下:
H0:01Ln0
H1:i(i0,1,L,n不全为零。
从图43中可以看出F检验(F-statistic对应的p值小于0.05所以拒绝H0所以我们得出的估计方程存在显著的线性关系。
4.3.3t检验
t检验的原假设和备择假设为:

H0:i0H1:i0
43
X2X5X7

p20.0107,p20.0000,p20.0001均小于0.05,拒绝原假设H0
同样可以看模型得出的t值,t23.067362,t510.20083,t75.887977,通过查找t分布表得,用t值与t0.052(112.201进行比较,如果tit0.052(11,则拒绝原假设所以回归系数显著。变量X5X7X2Y有显著影响。
4.3.4异方差检验
由于异方差的存在使得最小二乘估计量不再是最好线性无偏估计量,会导致模型的残差不再是同方差的,所以要对模型进行异方差检验。
1)图示法
此方法是较为原始的一种检验异方差的方法,可以直观的看出残差平方的散点图是否与样本数据XiYi有明显的关系,若随着XiYi的变化而变化,那么就说明存在异方差性。
这里我们可以看出残差平方的散点图呈不规则状,散乱分布,所以我们得出的回归模型不存在异方差性。
4-4异方差散点图


2)怀特(white)检验
可以看出模型中有三个解释变量,那么模型辅助回归可以写成:
ut01xt12xt23xt34xt215xt226xt237xt1xt28xt1xt39xt2xt3t
其原假设和备择假设分别为:
H0:i0i1,L,9

H1:1,L,9中至少一个不为零。
怀特检验的运行图如下:
4-5怀特检验图

给定显著性水平0.05obs*R-squared对应的p0.5587大于0.05(错了要改正))拒绝原假设,故不存在异方差。
4.3.5自相关检验
误差存在自相关时,模型中的系数用最小二乘估计计算会不准确,往往会算出的系数的真实方差值和误差项的方差值会偏小。为了检验得到的方程的准确性,我们进行自相关检验。
DW检验的原假设和备择假设分别为:
H0:0ut不存在自相关)
H1:0(ut存在一阶自相关

4-6DW检验运行结果图


从表中得出,DW值为1.964452,通过查找DW表可得,当n=15,k=3时,
dL0.82,dU1.75,所以DW值在区间(1.752.25)之间。这说明所建立的线性回归模型无自相关现象,不需要修正DW值检验。
4.3.6残差检验


4-7残差分析图


由于JB对应的p0.76874大于0.05,所以拒绝原假设。从残差分析图上也可以直观的看出残差直方图中间高,两边低,基本服从正态分布。所以我们估计的线性回归模型是有意义的。
4.3.7组内预测
对样本内数据进行组内预测:

4-8组内预测图

由图4-8可知,预测值和真实值几乎完全重合,且残差在零水平线上下波动,说明模型总体上效果较好。

本文来源:https://www.2haoxitong.net/k/doc/d8514ef986254b35eefdc8d376eeaeaad1f316d6.html

《多元回归(多重共线-异方差-残差检验eviews-spss).doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式