多元线性回归分析实例分析

发布时间:2023-12-19 16:47:23   来源:文档文库   
字号:
多元线性回归分析实例分析
作者:王华丽
来源:《科技资讯》2014年第29

王华丽

(湖北文理学院数学与计算机科学学院湖北襄阳441052
:多元线性回归是简单线性回归的推广,研究的是一个变量与多个变量之间的依赖关系。作为质量统计软件领域的领导者,MINITAB是一个精确的、强大的、使用方便的统计软件。多元回归分析预测法,是指通过对两个或两个以上的自变量与一个因变量的相关分析,建立预测模型进行预测的方法。当自变量与因变量之间存在线性关系时,称为多元线性回归分析。该文通过一个具体实例介绍如何运用MINITAB软件,建立儿子身高与父母身高、年锻炼次数的多元线性回归模型,并对MINITAB的输出结果进行分析,得出方程效果良好的结论。

关键词:MINITAB软件多元线性回归显著性实例分析

中图分类号:O212文献标识码:A文章编号:1672-3791(201410(b-0022-02
回归分析是数据分析中使用很多的一种方法。回归分析是定量的给出变量间的变化规律,不仅提供变量间的回归方程,而且可以判断所建立回归方程的有效性。在方程有效性的前提下,可以用方程做预测和控制,并了解预测和控制的精度。多元回归分析预测法,是指通过对两个或两个以上的自变量与一个因变量的相关分析,建立预测模型进行预测的方法。当自变量与因变量之间存在线性关系时,称为多元线性回归分析。

MINITAB软件是现代质量管理统计的领导者,全球六西格玛实施的共同语言,它以无可比拟的强大功能和简易的可视化操作获得了广大质量学者和统计专家的青睐。MINITAB软件是为质量改善、教育和研究应用领域提供统计软件和服务,是质量管理和六西格玛实施软件工具,更是持续质量改进的良好工具软件。

1多元线性回归分析的一般模型

多元线性回归分析的一般模型为:x1,x3,…,xpp(≥2个自变量(解释变量,是因变量,多元线性回归模型的理论假设是



2MINITAB软件建立模型


下面通过一个实例来详细讲解,如何运用MINITAB软件进行多元线性回归。现抽取20个家庭调查资料的部分变量,数据见表1,试对父母身高与儿子身高进行回归分析。



使用MINITAB软件,输入表1中数据,选择指令“统计>回归>回归”,在出现界面输入相应的变量名;打开“图形”窗,选择“四合一”及在“残差与变量”中填入各自变量名称;打开“存储”窗,选择“残差”、“标准化残差”及“拟合值”,点击“确定”后,得到输出结果。

MINITAB输出结果:
回归方程:
儿子身高=-23.7+0.303父亲身高+0.880母亲身高+0.0593锻炼次数

S=1.11974R-sq=96.33%R-sq(调整=95.65%
回归方程拟合出来以后,我们要解决以下几个问题:(1给出方程显著性检验,从总体上判定回归方程有效与否。(2给出方程总效果好坏的度量。(3在回归方程效果显著时,对各个回归系数进行显著性检验,将效应不显著的自变量删除,以优化模型,这点在多元回归中尤为重要。(4残差诊断,检验数据是否符合回归的基本假定,检验整个回归模型与数据拟合的是否很好,可否进一步改进回归方程来优化现有模型。

3MINITAB输出结果分析

如何判断整个回归方程是否有意义?就要进行回归方程显著性检验,也就是要检验下列问:H0:模型无意义,H1模型有意义。本例(3ANOVA表中P=00.05,所以拒绝H0:模型无意,接受H1模型有意义。说明在显著性水平a=0.05,线性回归方程总效果是显著的。

如果实际观测值与拟合出来的回归线很接近,就说明回归线与数据拟合的很好,就可以说回归方程的总效果很好。(表2我们通常用RsqRsq(adjS作为回归方程总效果的度量,以此来比较几种回归方程效果的好坏。Rsq是回归平方和占离差平方和的比率,其数值越接近1代表模型拟合的越好。当然Rsq并不是回归模型拟合效果的最好度量指标,因为当多一个自变量加入模型时,不管这个自变量是否显著,回归平方和就会增大,Rsq也会增大,这样就看不出新增加的自变量是否有意义,这点在多元回归中更为明显。

因此我们用Rsq(adj去修正Rsq,以考虑总项数给模型带来的影响。Rsq(adj≤Rsq两者数值越接近越好,另一个指标是残差标准差,它是从观察值与拟合回归线的平均偏离程度来度量的,也是回归模型中标准差σ的估计值。对于几个不同的回归方程的效果加以比较时,S是个最重要的指标,那个S最小,哪个回归方程就最小。




从本例输出结果看Rsq96.33%,Rsq(adj=95.65%来看,两者很接近,S=1.11974比较小,模型还可以。

回归方程显著时,做回归系数显著性检验,一般假设H0:β=0,H1:β≠0,若P0.05,则回归系数不为零,说明系数对应的自变量是显著的。当只有一个自变量时,回归方程显著性检验与回归系数检验是等价的,但是当自变量不止一个时,回归总效果显著不能排除某几个变量是无意义的。我们进行回归方程系数检验的目的,就是要找出是否有“滥竽充数”的自变量,把这些多余的自变量从方程中删除掉,以修正现有模型。

从本例输出结果看到三个自变量P值都小于0.05,故三个都为显著因子。

综上所述:我们认为模型为

y=-23.7+0.303x1+0.880x2+0.0593x3
模型中,X1系数0.303表示:如果父亲比同一代人的平均身高多1cm,那么他的儿子将比儿子那一代人的平均身高多出0.303cm;X2的系数解释也是如此;X3的系数表示参加体育锻炼的次数和身高之间存在正相关;常数项一般没有与它相对应的实际意义上的解释。

参考文献

[1]海燕.基于多元线性回归模型的四川农村居民收入增长分析[J].统计观,2010(13:88-90.
[2]雪飞.回归分析在房地产销售中的应用[J].科技咨询导报,2007(26:168-169.
[3]逢时.六西格玛管理统计指南[M].北京:中国人民大学出版社,2012.

本文来源:https://www.2haoxitong.net/k/doc/1cd68b5ecad376eeaeaad1f34693daef5ff713d7.html

《多元线性回归分析实例分析.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式