正在进行安全检测...

发布时间:2023-10-19 00:09:41   来源:文档文库   
字号:
一、什么是回归分析
回归分析RegressionAnalysis是研究变量之间作用尖系的一种统计分析方法其基本组成是一个(或一组)自变量与一个(或一组)因变量。回归分析研究的目的是通过收集到的样本数据用一定的统计方法探讨自变量对因变量的影响尖系,即原因对结果的影响程度。回归分析是指对具有高度相另尖系的现象,根据其相尖的形态,建立一个适当的数学模型(函数式),来近似地反映变量之间尖系的统计分析方法。利用这种方法建立的数学模型称为回归方程,它实际上是相尖现象之间不确定、不规则的数量尖系的一般化。二、回归分析的种类
1.按涉及自变量的多少,可分为一元回归分析和多元回归分析一元回归分析是对一个因变量和一个自变量
建立回归方程。多元回归分析是对一个因变量和两个或两个以上的自变量建立回归方程。
2.按回归方程的表现形式不同可分为线性回归分析和非线性回归分析若变量之间是线性相尖尖系可通过
建立直线方程来反映,这种分析叫线性回归分析。若变量之间是非线性相另另系,可通过建立非线性回归方程来反映,这种分析叫非线性回归分析。三、回归分析的主要内容
1.建立相尖尖系的数学表达式。依据现象之间的相尖形态,建立适当的数学模型,通过数学模型来反映现象
之间的相尖尖系从数量上近似地反映变量之间变动的一般规律。
2.依据回归方程进行回归预测。由于回归方程反映了变量之间的一般性尖系,因此当自变量
发生变化时,可依据回归方程估计出因变量可能发生相应变化的数值。因变量的回归估计值,虽然不是一个必然的对应值(他可能和系统真值存在比较大的差距
度或平均意义角度反映因变量可能发生的数量变化。
3.计算估计标准误差。通过估计标准误差这一指标,可以分析回归估计值与实际值之间的差异程度以及估计
值的准确性),但至少可以从一般性角
和代表性,还可利用估计标准误差对因变量估计值进行在一定把握程度条件下的区间估计。四、一元线性回归分析
1.一元线性回归分析的特点
1两个变量不是对等尖系,必须明确自变量和因变量。2
如果xy两个
x为自变量,y
变量无明显因果尖系,则存在着两个回归方程:一个是以
为因变量建立的回归方程;另一个是以y为自变量,X为因变量建立的回归方程。若绘出图形,则是两条斜率不同的回归直线。
3
直线回归方程中,回归系数b
0b>,表示直线上升,说
以是正值,也可以是负值。若
明两个变量同方向变动;若0bV,表示直线下降,说明两个变量是反方向变动。
2.建立一元线性回归方程的条件
任何一种数学模型的运用都是有前提条件的,配合一元线性回归方程应具备以下两个条件:
1两个变量之间必须存在高度相尖的尖系。
两个变量之间只有存在着高度相尖的尖系,回归方程才有实际意义。
2两个变量之间确实呈现直线相尖尖系。
两个变量之间只有存在直线相尖尖系才能配合直线回归方程。
3.建立一元线性回归方程的方法
一元线性回归方程是用于分析两个变量(一个因变量和一个自变量)线性尖系的数学表达式,一般形式为:yc=a+bX式中:X代表自变量;
yc代表因变量y的估计值(又称理论值);

ab为回归方程参数。其中,a是直线在y轴上的截距,它表示当自变量X等于O时,因变量所达到的数值;b是直线的斜率,在回归方程中亦称为回归系数,它表示当自变量X每变动一个单位时,因变量y均变动的数值。一元线性回归方程应根据最小二乘法原理建立,才可以同时满足两个条件:
12
因为只有用最小二乘法原理建立的回归方程
因变量的实际值与回归估计值的离差之和为零;因变量的实际值与回归估计值的离差平方和为最小值。
只有满足这两个条件,建立的直线方程的误差才能最小,其代表性才能最强。现在令要建立的一元线性回归方程的标准形式为
y*a+bx,依据最小二乘法原理因变量实际
y与估计值yc的离差平方和为最小值,即Qy-yc2取得最小值。为使Qyyc2=最小值根据微积分中求极值的原理,需分别对方程组:
Xy=an+b2xXxy=aEx+bx2
a,b求偏导数,并令其为0,经过整理,可得到如下
解此方程组可求得a,b两个参数
4计算估计标准误差
回归方程只反映变量Xy之间大致的、平均的变化尖系。因此,对每一个给定的归方程的估计值yc与因变量的实际观察值y之间总会有一定的离差,即估计标准误差。估计标准误差是因变量实际观察值
y与估计值yc离差平方和的平均数的平方根,它反映因
X值,回
变量实际值y与回归直线上各相应理论值yc之间离散程度的统计分析指标。
估计标准误差:式中:Sy——估计标准误差;y——因变量实际观察值;yc——因变量估计值;n2——自由度如何描述两个
变量之间线性相尖尖系的强弱?利用相尖系数r来衡量
r>0时,表示Xy为正相尖;当rvO时,表示Xy为负相尖。
5
残差分析与残差图:
残差是指观测值与预测值
之间的差,即是实际观察值与回归估计值的差
在研究两个变量间的尖系时,
a要根据散点图来粗略判断它们是否线性相尖;b判断是否可以用回归模型来拟合数据;
C可以通过残差来判断模型拟合的效果,判断原始数据中是否存在可疑数据,这方面的分析工作就称为残差分析。6残差图的制作及作用。
坐标纵轴为残差变量,横轴可以有不同的选择;若模型选择的正确,残差图中的点应该分布在以横轴为心的带状区域,带状区域的宽度越窄精度越高。对于远离横轴的点,要特别注意。

本文来源:https://www.2haoxitong.net/k/doc/b5c9a982824d2b160b4e767f5acfa1c7ab0082ee.html

《正在进行安全检测....doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式