第八章直线相关与回归分析
发布时间:2019-08-20 来源:文档文库
小
中
大
字号:
第十章 一元回归与相关分析
概述:许多问题需要研究多个变量之间的关系,例如生物的生长发育速度就与温度,营养,湿度等许多因素有关。
相关关系:两变量X,Y均为随机变量,任一变量的每一可能值都有另一变量的一个确定分布与之对应。
回归关系:X是非随机变量(如施肥)或随机变量(如穗长),Y是随机变量,对X的每一确定值xi都有Y的一个确定分布与之对应。
区别:1.相关中的两个变量地位对称,互为因果;回归中X是自变量,Y是因变量。
两种意义不同,分析的数学概念与推导过程不同,但如果使用共同标准即使y的残差平方和最小(最小二乘法),可得到相同的参数估计式。因此主要讨论X为非随机变量(不包含有随机误差)的情况,所得到的参数估计式也可用于X为随机变量的情况。
2.分析目的不同。回归分析是建立X与Y之间的数学关系式,用于预测;而相关分析研究X与Y两个随机变量之间的共同变化规律,例如当X增大时Y如何变化,以及这种共变关系的强弱。
分类:
从两个变量间相关(或回归)的程度分三种:
(1)完全相关。一个变量的值确定后,另一个变量的值可通过公式求出(函数关系);生物学研究中不太多见。
(2)不相关。变量之间完全没有任何关系。一个变量的值不能提供另一个变量的任何信息。 (3)统计相关(不完全相关)。介于上述两情况之间。知道一个变量的值通过某种公式就可以提供另一个变量的均值的信息。一个变量的取值不完全决定另一个变量的取值,但可或多或少地决定它的分布。科研中最常遇到。
研究“一因一果”,即一个自变量与一个依变量的回归分析称为一元回归分析; 研究“多因一果”,即多个自变量与一个依变量的回归分析称为多元回归分析。
一元回归分析又分为直线回归分析与曲线回归分析两种;多元回归分析又分为多元线性回归分析与多元非线性回归分析两种。
对两个变量间的直线关系进行相关分析称为直线相关分析; 研究一个变量与多个变量间的线性相关称为复相关分析;研究其余变量保持不变的情况下两个变量间的线性相关称为偏相关分析。
注意:1.相关与回归只是一种工具,不是不相干的数据拼凑在一起。 2.除X、Y等需研究的因素外,其他的要严格控制一致。(身高与胸围的关系要控
制体重)
3.对子一般在5对以上
4.需限制自变量范围,结果不能随意外延。
第一节 一元线性回归
(一)直线回归方程的建立
对于两个相关变量,一个变量用x表示,另一个变量用y表示,如果通过试验或调查获得两个变量的n对观测值: (x1,y1),(x2,y2),……,(xn,yn)
为直观看出x和y间的变化趋势,可将每一对观测值在平面直角坐标系描点,作出散点图
例11.1 对大白鼠从出生第6天起,每三天称一次体重,直到第18天。数据见表11.1。试计算日龄X与体重Y之间的回归方程。
表