数学

发布时间:2014-11-08 10:48:57   来源:文档文库   
字号:

第四章 MATLAB在概率论与数理统计问题求解中的应用

概率论与数理统计是实验科学中常见的数学分支,其问题的求解是很重要的,MATLAB提供了专用的统计学工具箱(Stats Toolbox),其中包含了大量的函数,可以直接求解概率论与数理统计领域的问题。本章主要介绍概率分布与概率问题的求解、假设检验、方差分析回归分析协方差分析等。

4.1. 概率分布与概率问题的求解

常见的几种概率分布的命令字符见表4.1.1

4.1.1 几种概率分布的命令字符

Matlab工具箱对每一种分布都提供五类函数,其命令字符见表4.1.2

4.1.2 五类函数命令字符

当需要一种分布的某一类函数时,将以上所列的分布命令字符与函数命令字符接起来,并输入自变量(可以是标量、数组或矩阵)和参数即可.

1 画出正态分布的概率密度函数图形.

解:

clear all;

x=-6:0.01:6;

y=normpdf(x); z=normpdf(x,0,2);

plot(x,y,x,z)

1 正态分布的概率密度函数图形

2.计算标准正态分布的概率P{-1

解:

clear all;

p=normcdf(1)-normcdf(-1)

p =

0.6827

3α=0.05,求.的含义是:

P{X<}= XN(0,1)

解:α=0.05时,p=0.975, norminv(0.975)=1.96

此题中norminv命令可用来求逆概率分布调用格式为:x=norminv(p,mu,sigma). 即求出x,使得P{X<x}=p,此命令也可用来求分位数.

4 求正态分布N(3,52)的均值与方差.

解:

clear all;

[m,v]=normstat(3,5)

m =3 v =25

5

>>M=normrnd([1 2 3;4 5 6],0.1,2,3)

M =

0.9567 2.0125 2.8854

3.8334 5.0288 6.1191

此命令产生了2×3的正态分布随机数矩阵,各数分别服从N(1,0.1), N(2, 0.1), N(3, 0.1), N(4,0.1), N(5, 0.1),N(6, 0.1)

4.2. 几种假设检验

假设检验就是先对未知总体提出某种假设或推断,然后利用抽取的样本,通过一定的方法,检验这个假设是否合理,从而做出接受还是拒绝这个假设的结论。

主要的假设检验方式见表4.2.1所示。

4.2.1 常见假设检验的MATLAB命令

1 Matlab统计工具箱中的数据文件gas.mat.中提供了美国1993年一月份和二月份的汽油平均价格(price1,price2分别是一,二月份的油价,单位为美分),它是容量为20的双样本.假设一月份油价的标准偏差是一加仑四分币(=4),试检验一月份油价的均值是否等于115.

这是正态总体方差σ2已知,正态总体均值u的检验问题,作假设:m = 115.

clear all;

load gas

[h,sig,ci] = ztest(price1,115,4)

h =

0

sig =

0.8668

ci =

113.3970 116.9030

此检验结果说明:

1.布尔变量h=0, 表示不拒绝零假设. 说明提出的假设均值115是合理的.

2. sig-值为0.8668, 远超过0.05, 不能拒绝零假设

3. 95%的置信区间为[113.4, 116.9], 它完全包括115, 且置信度很高

2 试检验例1中二月份油价 Price2的均值是否等于115.

这是正态总体方差σ2未知,正态总体均值u的检验问题,作假设:m = 115

clear all;

load gas

[h,sig,ci] = ttest( price2 ,115)

h =

1

sig =

4.9517e-004

ci =

116.7521 120.2479

此检验结果说明:

1. 布尔变量h=1, 表示拒绝零假设. 说明提出的假设油价均值115是不合理的。

2. 95%的置信区间为[116.8 120.2], 它不包括115, 故不能接受假设。

3. sig-值为4.9517e-004, 远小于0.05, 不能接受零假设。

3 试检验例1中一月份油价Price1与二月份的油价Price2均值是否相同.

这是正态总体均值的假设检验问题

clear all;

load gas

[h,sig,ci] = ttest2(price1,price2)

h =

1

sig =

0.0083

ci =

-5.7845 -0.9155

此检验结果说明:

1. 布尔变量h=1, 表示拒绝零假设. 说明提出的假设油价均值相同是不合理的.

2. 95%的置信区间为[-5.8,-0.9],说明一月份油价比二月份油价约低16.

3. sig-值为0.0083, 远小于0.05, 不能接受油价均相同假设.

4 一道工序用自动化车床连续加工某种零件,由于刀具损坏等会出现故障.故障是完全随机的,并假定生产任一零件时出现故障机会均相同.工作人员是通过检查零件来确定工序是否出现故障的.现积累有100次故障纪录,故障出现时该刀具完成的零件数如下:

459 362 624 542 509 584 433 748 815 505

612 452 434 982 640 742 565 706 593 680

926 653 164 487 734 608 428 1153 593 844

527 552 513 781 474 388 824 538 862 659

775 859 755 49 697 515 628 954 771 609

402 960 885 610 292 837 473 677 358 638

699 634 555 570 84 416 606 1062 484 120

447 654 564 339 280 246 687 539 790 581

621 724 531 512 577 496 468 499 544 645

764 558 378 765 666 763 217 715 310 851

试观察该刀具出现故障时完成的零件数属于哪种分布.

clear all;

x=[459 362 624 542 509 584 433 748 815 505

612 452 434 982 640 742 565 706 593 680

926 653 164 487 734 608 428 1153 593 844

527 552 513 781 474 388 824 538 862 659

775 859 755 49 697 515 628 954 771 609

402 960 885 610 292 837 473 677 358 638

699 634 555 570 84 416 606 1062 484 120

447 654 564 339 280 246 687 539 790 581

621 724 531 512 577 496 468 499 544 645

764 558 378 765 666 763 217 715 310 851];

hist(x,10);

normplot(x);

[muhat,sigmahat,muci,sigmaci]=normfit(x);

[h,sig,ci]=ttest(x ,594)

muhat =

594

sigmahat =

204.1301

sigmaci =

179.2276 237.1329

muci =

553.4962 634.5038

h =

0

sig =

1

ci =

553.4962 634.5038

4.2.1 正态检验图

此检验结果说明:

1. 估计出该刀具的均值为594,方差204,均值的0.95置信区间为[ 553.4962634.5038],方差的0.95置信区间为[ 179.2276237.1329].

2. 从正态检验图上,可以看出数据大致集中在一条直线上,说明该刀具出现故障时完成的零件数符合正态分布.

3. 布尔变量h=0, 表示不拒绝零假设. 说明提出的假设寿命均值594是合理的.

4. 95%的置信区间为[553.5634.5], 它完全包括594, 且置信度很高。

5. sig-值为1, 远超过0.05, 不能拒绝零假设.

4.3. 方差分析

方差分析是英国统计学家兼遗传学家Fisher R A提出的一种分析方法,在农业、科学试验和现代工业质量控制等众多领域有着广泛的应用。

在实际的生产和经营管理过程中,影响产量、产品质量、数量或销量的因素很多。如何从众多的因素中,分清哪些主要,哪些次要?这就是本节所要研究的内容。一般我们称产量、产品的质量、数量或销量为试验指标,对试验指标起一定影响作用的称为因素或因子(factor)。在众多因素中,有些因素可能对试验指标影响大,有些可能影响小,经常需要分析哪几种因素对生产质量(数量)或销量起决定性的作用,并需知道最优的生产(工艺或销售)条件是什么?方差分析就是解决这些问题的一种有效方法。

1.单因素方差分析模型

    若只考虑一个因素对试验指标的影响,这种分析问题的方法称为单因素方差分析(analysis of variance),方差分析简称“ANOVA”。该方法的主要目的是:通过试验数据分析推断因素A对指标影响是否显著。

1问题的一般提法

假定要检验的因子有m种水平,X1X2,…,Xmm个相互独立的正态总体,分别服从于Nμis2),i =12,…,m。另外,xiji =12,…,mj = 12,…,ni)是分别服从正态分布抽得的简单随机样本。

则单因素方差分析模型:           

                                 εij~ N0s2,且各εij相互独立

2显著性检验

对于上面所提出的多个正态总体均值是否相等的问题,也就是检验假设:

H0μ1=μ2==μm  H1: μii=1,2,m)不全相等

定义:

则有平方和分解公式:

                     

其中,Q1被称为组内离差平方和(或误差平方和)。它反映了数据xij在抽样过程中产生总的误差程度的一个评价指标。Q2是各组平均值与总平均值的离差平方和,反映了各总体的样本平均值之间的差异程度,被称之为组间平方和。通过Q2取值的大小可以反映原假设H0是否成立。

3F-检验法

构造F-统计量:

给定显著性水平α,查表,当 F>Fα(m-1,n-m)时,则拒绝H0

4 方差分析表

4.3.1

2.双因素方差分析

许多实际问题中,对试验指标的影响不仅仅只有一个因素,可能需要同时考虑几个因素对试验指标的影响。这种同时分析多个因素对试验指标的影响作用大小的方法,就是多因素的方差分析如果只考虑两个因素,称之为双因素方差分析。

1数学模型

 双因素方差分析数学模型:

  其中:xijk 服从Nμijs2)分布,i =1,2,,r, j = 1,2,s, k = 1,2,,n.且各xijk 相互独立;μ是总的平均值,αi是因子A水平Ai效应βj为因子B的水平Bj的效应,γijAiBj交互效应值εijk 服从N0s2)分布,且相互独立.

 2提出三个假设:

HA0α1=α2==αr=0 HA1至少有某个αi0

HB0β1=β2==βr=0 HA1至少有某个βj0

HAB0γij =0i =1,2,,r, j = 1,2,s, HAB1至少有某个γij0

同样有平方和分解公式:Q = Q1 + Q2 + Q3 + Q4 (具体公式及公式推导略)

 3方差分析表:

4.3.2

3MATLAB实现

对于方差分析,MATLAB统计工具箱中提供了如下调用格式:

           [p,tab,stats]= anova1(X)

           [p, tab, stats]= anova2(X)

前一个命令是单因素方差分析,后一个命令是双因素方差分析。更具体的功能可用help查询。

1某公司为了研究三种内容的广告宣传对某种汽车销售量的影响,进行了统计调查。经广告广泛宣传后,按寄回的广告上的订购数计算,一年四个季度的销售量如下表所示:

4.3.3

表中 A1:强调运输方便性的广告;A2强调节省燃料的经济性的广告;A3强调噪音低的优良性的广告;试问哪一种类型的新闻广告促进汽车销量增加所起的宣传效果最佳?

解:

clear all;

x=[163 184 206;176 198 191; 170 179 218;185 190 224];

[p, tab, stats]=anova1(x)

p =

0.0039

计算结果p =0.0039α= 0.05,表明拒绝H0

   得到两个图形界面:

               4.3.1  单因素方差分析表

4.3.2  box

Box图反映了各组数据的特征。另一方面经查表得:F0.052,9=4.26。由方差分析

表知F=10.93 >F0.052,9=4.26, 所以拒绝H0,即认为不同类型的广告内容对汽车销售量有显著影响。进一步问哪一种广告形式最佳?

因此需要计算各水平效应值:

 

计算结果表明,效应值α3最大。这说明广告A3的汽车销售量最多,因此A3为最优水平。此,在今后的广告宣传中,应该注意多宣传噪音低的好处,同时也提出在汽车的生产中应注意改进工艺以降低噪音,从而促进汽车销量增加。

2.为比较3种松树在4个不同地区的生长情况有无差别,在每个地区对每种松树随机的选择5株,测量它们的胸径,得出的数据在表4.3-4中给出,试对它们进行双因素方差分析。

4.3.4 松树数据

:

clear all;

x=[23 15 26 13 21 25 20 21 16 18 21 17 16 24 27 14 17 19 20 24;28 22 25 19 26 30 26 26 20 28 19 24 19 25 29 17 21 18 26 23;18 10 12 22 13 15 21 22 14 12 23 25 19 13 22 16 12 23 22 19];

anova2(x',5);

输出方差分析表为:

4.3.3  因素方差分析表

从双因素方差分析表中可以看出,第一个因素松树种类对应的概率p=0.00029466值很小,所以应该拒绝原假设,从而认为树种对观测树的胸径有显著影响。进一步计算树种在3个不同的水平下的均值分别为

y=[ ];

for i=1:3

for j=1:4

y(i,j)=mean(x(i,[1:5]+(j-1)*5));

end

end;

y=[y;mean(y)];

y=[y mean(y')']

y =

19.6000 20.0000 21.0000 18.8000 19.8500

24.0000 26.0000 23.2000 21.0000 23.5500

15.0000 16.8000 20.4000 18.4000 17.6500

19.5333 20.9333 21.5333 19.4000 20.3500

y的最后一列可以看出,树种2的树胸径最大,树种3的最小。而方差分析表中的另外两个概率的值都很大,所以没有理由拒绝另外两个假设。故得出结论:地区对树的胸径无显著影响,不同区域对不同树种的胸径观测结果也无显著影响。

4.4. 回归分析

许多实际问题往往需要对大量数据进行分析,尤为重要的是统计分析(statistical analysis)。如统计预报中的预测、经验公式中的参数确定等等,常常用到各种统计方法。回归分析(regression analysis)是研究各变量间相互关系的一种统计方法。

1.一元线性回归模型

我们称模型Y=a+bx+ε, εN(0,σ2)YN(a+bx,σ2)一元线性回归模型,Yx之间存在线性回归关系,其中参数ab称为一元线性回归的回归系数。

1回归系数ab的最小二乘估计

  已知观测值为(xi, yi)i=12,…,n)。将它代入回归模型中有如下关系:

yi=a+bxi+εi  

其中i = 12…,n。采用最小二乘法,求观测值与期望值的离差平方和最小。

求出的解记为回归方程为:

2回归模型的统计检验

回归模型的假设(f(x)= a+bx)是否成立?该问题可转化为对系数b提出假设,

H0:b=0;H1:b0,然后判断H0是否成立,这就是假设检验问题。有两种检验方法:

1相关系数检验法

其中,当越接近于1时,说明XY的线性关系就越显著;当靠近零时,表明XY的线性关系越不明显,或者XY之间可能是非线性的关系,或者是两者根本不存在什么关系。

检验上述原假设H0:b=0,其拒绝域为:α为检验水平。

2F检验法

平方和分解公式: 

简记为:Lyy=Q+U   其中Q被称为残差平方和(residual sum of squares)U被称为回归平方和(regressive sum of squares)

考虑检验假设H0:b=0;H1:b0 H0为真时,可证明:

其拒绝域为:

3)回归模型的应用

1)预测

对于给定的控制量x=x0可以给出E(y0)的点估计:,以及y0的置信度为(1-a)%的预测区间为:

其中

2)控制

观察值y在某个区间(y1,y2)取值时,应如何控制x的取值范围, 使得相应的观察值落入指定区间(y1,y2)内的概率至少为1-a %.

解方程   

求解得的x1,x2,x的控制区间的两个端点值.

2.多元线性回归模型

多元线性回归模型的形式及假设:

      Y=β0+β1x1++βmxm+εεN(0,σ2)

1回归系数β0β1,…,βm的确定

根据观测值xi1xi2,…,ximyi(i=1,2,,n),要确定回归系数β0β1,…,βm,其方法仍然是最小二乘法。

建立优化目标函数:

2回归模型的检验

问题可转化为:

                   H0β0=β1==βm=0H1:存在某个βi0

判断H0是否成立,可以用F检验法。

平方和分解公式: 

简记为:Lyy=Q+U其中Q被称为剩余平方和,自由度为n-m-1U被称为回归平方和,自由度为m

F检验统计量,H0为真时,可证明:

其拒绝域为:

3回归系数的检验

问题提出:H0βi=0i=1m),H1βi0

可以证明:i=1m)。可用该结果求95%的置信区间和对上述假设进行检验。若检验结果是接受H0,则说明自变量xi对因变量y的影响较小,可以将该变量从回归模型中剔除。实际上,该检验结果成为剔除哪些自变量的一个重要依据。

4预测

   给定一组值(x10,x20,…,xm0),可以得到点估计值y0。同理,可以计算它的预测区间。

3MATLAB实现

      MATLAB统计工具箱用命令regress实现多元线性回归,调用格式为

        b = regress(YX)[bbintrrintstats] = regress(YXalpha)

其中Y是因变量数据向量,X是自变量数据矩阵,其排列方式如下:

 

alpha为显著性水平(缺省时设定为0.05),输出向量bbint为回归系数估计值β0β1,…,βm和它们的置信区间,r,rint为残差(向量)及其置信区间,stats是用于检验回归模型的统计量,有三个数值,第1个是R2R2样本决定系数,第2个是F统计量值,第三个是与统计量F对应的概率p,当p<α时拒绝H0,说明回归模型假设成立。

116名成年女子的身高与腿长所得数据如4.4.1所示

4.4.1 身高与腿长数据

以身高x自变量,以腿长y因变量建立回归方程.

:

clear all;

x=[143 145 146 147 149 150 153 154 155 156 157 158 159 160 162 164];

X=[ones(16,1) x];

Y=[88 85 88 91 92 93 93 95 96 98 97 96 98 99 100 102]';

[b,bint,r,rint,stats]=regress(Y,X)

b = -16.0730

0.7194

bint =-33.7071 1.5612

0.6047 0.8340

stats =0.9282 180.9531 0.0000

95%的置信区间为[-33.70171.5612], 95%的置信区间为[0.6047,0.834]; R2=0.9282, F=180.9531, p=2.1312e-009p<0.05, 可知回归方程 y=-16.073+0.7194x显著成立.

4.5. 协方差分析

1协方差

假设随机数(x1,y1),(x2,y2),,(xn,yn)为二维随机变量对(x,y)的样本,则可以分别定义出二维样本的协方差sxy与二维样本的相关系数ρ

由上述式子还可以定义出一个矩阵C

式中,,,该矩阵称为协方差矩阵(covariance matrix).

多个随机变量的协方差矩阵可以由上述定义扩展出来。MATLAB中提供了一个专门求解多元随机变量协方差的函数cov( )。该函数的调用格式为

C=cov(X)

其中,X的各列均表示不同的随机变量的样本值。若X是向量,则得出的是其方差,否则将返回协方差矩阵C

1 试用MATLAB语言产生4个满足标准正态分布的随机变量,并求出其协方差矩阵。

解:用MATLAB给出的randn( )函数可以生成一个标准正态分布的随机数矩阵。

clear all;

p=randn(10,4);

cov(p)

ans =

1.1048 -0.1967 0.0582 -0.3182

-0.1967 0.4751 0.0926 0.0349

0.0582 0.0926 1.0791 -0.2017

-0.3182 0.0349 -0.2017 0.9820

2.相关系数

相关系数是标准化协方差,是度量随机变量之间线性相关程度的一个指标,其MATLAB的调用格式为

C=corrcoef(X,Y)或者C= corrcoef (A)

前者返回列向量XY的相关系数矩阵,后者返回矩阵A的列向量的相关系数矩阵

2

clear all;

A=[1 2 3;4 0 -1;1 3 9]

A =

1 2 3

4 0 -1

1 3 9

C1=corrcoef(A) %求矩阵A的相关系数矩阵

C1 =

1.0000 -0.9449 -0.8030

-0.9449 1.0000 0.9538

-0.8030 0.9538 1.0000

C1=corrcoef(A(:,2),A(:,3)) %A的第2列与第3列列向量的相关系数矩阵

C1 =

1.0000 0.9538

0.9538 1.0000

练习题四

1.设X~N3, 22),求P{2P{-4

2某车间用一台包装机包装葡萄糖,包得的袋装糖重是一个随机变量,它服从正态分布。当机器正常时,其均值为0.5公斤,标准差为0.015。某日开工后检验包装机是否正常,随机地抽取所包装的糖9袋,称得净重为(公斤)

0.497, 0.506, 0.518, 0.524, 0.498, 0.511, 0.52, 0.515, 0.512

问机器是否正常?

3.据说某地汽油的价格是每加仑115美分,为了验证这种说法,一位学者开车随机选择了一些加油站,得到某年一月和二月的数据如下:

一月:119 117 115 116 112 121 115 122 116 118 109 112 119 112 117 113 114 109 109 118

二月:118 119 115 122 118 121 120 122 128 116 120 123 121 119 117 119 128 126 118 125

1)分别用两个月的数据验证这种说法的可靠性;

2)分别给出1月和2月汽油价格的置信区间;

3)给出1月和2月汽油价格差的置信区间

4经试验证明,影响火箭射程有两个重要因素——燃料A和推进器B,那么这两种因素的不同水平组合对火箭射程是否有显著影响?这两种因素在什么状态下最好,最佳的水平组合为多少?在火箭研制和发射过程中这是研究员们非常想知道的一些问题。为了回答上述问题,研究员对火箭射程进行了模拟试验,取出四种燃料和三种推进器,每种燃料与每种推进器的组合各发射火箭两次,得如下表(单位:km

5.考察温度x对产量y的影响,测得下列10组数据:

y关于x的线性回归方程,检验回归效果是否显著,并预测x=42时产量的估值及预测区间(置信度95%)。

练习题四答案:

1.解:>> normcdf(5,3,2)-normcdf(2,3,2)

ans =

0.5328

所以P{2

>> normcdf(10,3,2)-normcdf(-4,3,2)

ans =

0.9995

所以P{-4

2.解: 作假设:机器正常工作.

然后用以下命令检验

>> A=[0.497 0.506 0.518 0.524 0.498 0.511 0.52 0.515 0.512];

>> [h,sig,ci]=ztest(A,0.5,0.015)

h =

1

sig =

0.0248

ci =

0.5014 0.5210

[h,sig,ci] = ztest(price1,115,4)

返回:h = 1sig = 0.0248ci = [0.5014 0.5210]

检验结果: 1.布尔变量h=1, 表示拒绝零假设。说明提出的假设是不合理的。

2sig-值为0.0248,不超过0.5, 拒绝零假设

395%的置信区间为[0.5014 0.5210],它不包括115

3.解:1作假设:1月份汽油价为115

不知其方差,故用以下命令检验

>> A=[119 117 115 116 112 121 115 122 116 118 109 112 119 112 117 113 114 109 109 118;

118 119 115 122 118 121 120 122 128 116 120 123 121 119 117 119 128 126 118 125];

>> [h,sig,ci] = ttest(A(1,:),115)

h =

0

sig =

0.8642

ci =

113.3388 116.9612

返回:h = 0sig = 0.8642ci =[113.3388 116.9612]

检验结果: 1. 布尔变量h=0, 表示不拒绝零假设. 说明提出的假设油价均值115是合理的。

2. 95%的置信区间为[113.3388 116.9612],它包括115, 故接受假设。

3. sig-值为0.8642, 远大于0.5, 接受零假设。

作假设:2月份汽油价为115

>> [h,sig,ci] = ttest(A(2,:),115)

h =

1

sig =

1.3241e-006

ci =

119.0129 122.4871

返回:h = 1sig = 1.3241e-006ci =[119.0129 122.4871]

检验结果: 1. 布尔变量h=1, 表示拒绝零假设. 说明提出的假设油价均值115是不合理的。

2. 95%的置信区间为[119.0129 122.4871],它不包括115, 故不接受假设。

3. sig-值为1.3241e-006,远小于0.5, 不接受零假设.

所以,可以说“某地汽油的价格是每加仑115美分”的说法是错误的。

21月份油价的95%置信区间为:ci =[113.3388 116.9612]

2月份油价的95%置信区间为:ci =[119.0129 122.4871]

3)假设:1月份平均油价等于2月份平均油价

>> [h,sig,ci] = ttest2(A(1,:),A(2,:),0.05,0)

h =

1

sig =

3.6952e-005

ci =

-8.0273 -3.1727

返回h=1 表示可以拒绝假设,sig=3.6952e-005远小于0.05,所以原假设不成立,12月汽油价格差的95%置信区间为:[-8.0273 -3.1727]

4.解: x=[58.2 52.6 56.2 41.2 65.3 60.8;49.1 42.8 54.1 50.5 51.6 48.4;60.1 58.3 70.9 73.2 39.2 40.7;75.8 71.5 58.2 51.0 48.7 41.4];

>> anova2(x',2);

ANOVA Table

Source SS df MS F Prob>F

-----------------------------------------------------

Columns 261.68 3 87.225 4.42 0.026

Rows 370.98 2 185.49 9.39 0.0035

Interaction 1768.69 6 294.782 14.93 0.0001

Error 236.95 12 19.746

Total 2638.3 23

从方差分析表中可以看出,第一个因素燃料对应的概率p=0.026 值小于0.05,所以应该拒绝原假设,从而认为燃料对火箭射程有显著影响。进一步计算燃料在4个不同的水平下的均值分别为

>> y=[];

>> for i=1:4

for j=1:3

y(i,j)=mean(x(i,[1:2]+(j-1)*2));

end

end

>> y=[y;mean(y)];

>> y=[y mean(y')']

y =

55.4000 48.7000 63.0500 55.7167

45.9500 52.3000 50.0000 49.4167

59.2000 72.0500 39.9500 57.0667

73.6500 54.6000 45.0500 57.7667

58.5500 56.9125 49.5125 54.9917

y的最后一列可以看出,燃料A4的射程最远,燃料A2的最小。而方差分析表中的另外两个概率的值都很小,所以拒绝另外两个假设。故得出结论:燃料和推进器对火箭射程影响显著,不同燃料和不同推进器的组合对火箭射程影响显著。

y可以看出,最佳组合为燃料A4和推进器B1的组合。

5.解:

1、输入数据

>> x=20:5:65;

>> x=x';

>> x=[ones(length(x),1),x];

>> y=[13.2 15.1 16.4 17.1 17.9 18.7 19.6 21.2 22.5 24.3]';

>> [b,bint,r,rint,stats]=regress(y,x)

b =

9.1212

0.2230

bint =

8.0211 10.2214

0.1985 0.2476

stats =

0.9821 439.8311 0.0000

95%的置信区间为[8.0211 10.2214], 95%的置信区间为[0.1985 0.2476]; R2=0.9821F=439.8311p=0.0000p<0.05, 可知回归方程

y= 9.1212+0.2230x

显著成立。

x=42时,>> 9.1212+0.2230*42

ans =

18.4872

y=18.4872

输入命令如下:

>> x=20:5:65;

>> Lxx=(x-mean(x))*(x-mean(x))';

>> yy= 9.1212+0.2230*x;

>> Q=(yy'-y)'*(yy'-y);

>> n=10;

>> sgm=Q/(n-2);

>> dn=tinv(0.975,8)*sgm*sqrt(1+1/n+(42-mean(x))/Lxx)

dn =

0.5641

所以,x=42时产量的估值为18.4872,预测区间(置信度95%)为[18.4872-dn 18.4872+dn][ 17.9231 19.0513]

本文来源:https://www.2haoxitong.net/k/doc/ecc33750ee06eff9aef80769.html

《数学.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式