常用分布概率计算的Excel应用

发布时间:2018-12-05 18:01:09   来源:文档文库   
字号:

上机实习 常用分布概率计算的Excel应用

利用Excel中的统计函数工具,可以计算二项分布、泊松分布、正态分布等常用概率分布的概率值、累积(分布)概率等。这里我们主要介绍如何用Excel来计算二项分布的概率值与累积概率,其他常用分布的概率计算等处理与此类似。

§3.1 分布的

一、二项分布的(累积)概率值计算

Excel来计算二项分布的概率值Pn(k)、累积概率Fn(k),需要用BINOMDIST函数,其格式为:

BINOMDIST (number_strials, probability_s, cumulative)

其中 number_s 试验成功的次数k

trials 独立试验的总次数n

probability_s 一次试验中成功的概率p

cumulative 为一逻辑值,若取0FALSE时,计算概率值Pn(k)若取1TRUE时,则计算累积概率Fn(k),。

即对二项分布B(n,p)概率值Pn(k)累积概率Fn(k),有

Pn(k)=BINOMDIST(k,n,p,0) Fn(k)= BINOMDIST(k,n,p,1)

现结合下列机床维修问题的概率计算来稀疏现象(小概率事件)发生次数说明计算二项分布概率的具体步骤。

3.1 某车间有各自独立运行的机床若干台,设每台机床发生故障的概率为0.01,每台机床的故障需要一名维修工来排除,试求在下列两种情形下机床发生故障而得不到及时维修的概率

1)一人负责15台机床的维修;

23人共同负责80台机床的维修。

:(1)依题意,维修人员是否能及时维修机床,取决于同一时刻发生故障的机床数。

X表示15台机床中同一时刻发生故障的台数,则X服从n=15,p=0.01的二项分布:

XB(15,0.01)

P(X= k)= C15k(0.01)k(0.99)15-k k = 0, 1, , 15

故所求概率为

P(X2)=1-P(X1)=1-P(X=0)-P(X=1)

=1-(0.99)15-15×0.01×(0.99)14

=1-0.8600-0.1303=0.0097

2)当3人共同负责80台机床的维修时,设Y表示80台机床中同一时刻发生故障的台数,则Y服从n=80p=0.01的二项分布,即

YB(80,0.01)

此时因为 n=8030, p=0.010.2

所以可以利用泊松近似公式: n很大,p较小时(一般只要n30,p0.2),对任一确定的k,(其中 =np

word/media/image1_1.png

来计算。

=np=80×0.01=0.8, 利用泊松分布表,所求概率为

P(Y4)=word/media/image2_1.pngword/media/image3_1.png=0.0091

我们发现,虽然第二种情况平均每人需维修27台,比第一种情况增加了80%的工作量,但是其管理质量反而提高了。

Excel求解:已知15台机床中同一时刻发生故障的台数XB(n,p), 其中n=15, p=0.01,则所求概率为

P(X2)=1-P(X1)=1-P(X=0)-P(X=1)=1- P15(0)-P15(1)

利用Excel计算概率值P15(1)的步骤为:

(一)函数法:

在单元格中或工作表上方编辑栏中输入“= BINOMDIST(1,15,0.01,0) 后回车,选定单元格即出现P15(1)概率为0.130312(图3-1)。

3-1 直接输入函数公式的结果(函数法)

(二)菜单法:

1. 点击图标“fx 或选择“插入”下拉菜单的“函数”子菜单,即进入“函数”对话框(图3-2);

2. 在函数对话框中,“函数分类”中选择“统计”,“函数名字”中选定“BINOMDIST”,再单击“确定”;(图3-2

3-2 “插入”下的“函数”对话框

2. 进入“BINOMDIST”对话框(图3-3),对选项输入适当的值:

Number_s窗口输入:1试验成功的次数k);

Trials窗口输入:15(独立试验的总次数n);

Probability_s窗口输入:0.01(一次试验中成功的概率p);

Cumulative窗口输入:0(或FALSE,表明选定概率值Pn(k));

3-3 BINOMDIST”对话框

4.最后单击“确定”,相应单元格中就出现P15(1)的概率0.130312

类似地若要求P15(0)的概率值,只需直接输入= BINOMDIST(0,15,0.01,0)”或利用菜单法,在其第3步选项Number_s窗口输入0,即可得概率值0.860058,则

P(X2)= 1- P15(0)-P15(1)=1-0.860058-0.130312=0.00963

另外,P(X2)=1-P(X1)=1-F15(1),即也可以通过先求累积概率F15(1)来求解。而要求出F15(1)的值,只需在单元格上直接输入“= BINOMDIST(1,15,0.01,1)”回车即可;或利用上述菜单法步骤,在第3步的选项Cumulative窗口输入:1,即得到累积概率F15(1)的值0.99037,故有

P(X2)=1-P(X1)=1- F15(1)=1-0.99037=0.00963

对于3.1Y表示80台机床中同一时刻发生故障的台数,则Y服从n=80p=0.01的二项分布,即YB(80,0.01)

所求概率为

P(Y4)=1- P(Y3)=1- F80(3)

利用Excel,在单元格上直接输入“= BINOMDIST(3,80,0.01,1)”回车或与上述菜单法类似操作可得累积概率F80(3)=0.991341,故所求概率的精确值为

P(Y4)=1- P(Y3)=1- F80(3)=1-0.991341=0.00866

(注意:例3.1原解中的结果是泊松近似值)

对于泊松分布、正态分布、指数分布等的概率计算步骤与上述二项分布的概率计算过程类似,只需利用函数法正确输入相应分布的函数表达式即得结果;或在菜单法的第2步选择POISSONNORMDISTEXPONDIST等函数名,根据第3步对话框的指导输入相应的值即可。下面我们列出这些常用分布的统计函数及其应用。

§3.2 泊松分布的

一、泊松分布的(累积)概率值计算

Excel中,我们用POISSON 函数去计算泊松分布的概率值和累积概率值。其格式为:

POISSON(x,mean,cumulative)

其中 x: 事件数;

Mean 期望值即参数

Cumulative 为逻辑值,若取值为1 TRUE,则计算累积概率值P(Xx),若取值为0 FALSE,则计算随机事件发生的次数恰为 x的概率值P(X=x)

即对服从参数为 的泊松分布的概率值P(X=k)和累积概率值P(Xk),有

P(X=k)=POISSON(k, ,0)P(Xk)= POISSON(k, ,1)

例如,在例3.12)的原解的泊松近似计算中,Y近似服从 =np=80×0.01=0.8的泊松分布P( ),需求P(Y4)则在Excel中,利用函数POISSON(3,0.8,1)就可得到累积概率分布P(Y3)的值0.99092,则所求概率为

P(Y4)=1- P(Y3)=1-0.99092=0.00908

§3.3 分布的

一、NORMDIST函数计算正态分布N( , 2)的分布函数值F(x)和密度值f(x)

Excel中,用函数NORMDIST计算给定均值 和标准差 的正态分布N( , 2)的分布函数值F(x)P(Xx)和概率密度函数值f(x)。其格式为:

NORMDIST(x,mean,standard_dev,cumulative)

其中 x: 为需要计算其分布的数值;

Mean: 正态分布的均值

standard_dev: 正态分布的标准差

cumulative: 为一逻辑值,指明函数的形式。如果取为1TRUE,则计算分布函数F(x)P(Xx);如果取为0FALSE,计算密度函数f(x)

即对正态分布N( , 2)的分布函数值F(x)和密度函数值f(x),有

F(x)=NORMDIST(x, , ,1);f(x)=NORMDIST(x, , ,0)

说明:如果 mean=0standard_dev=1,函数 NORMDIST将计算标准正态分布N(0,1)的分布函数 (x)和密度 (x)

Excel求解例3.2 (1)零件直径XN(135,52),应求概率

P(130X150)= F(150)-F(130)

Excel中,输入 =NORMDIST(150,135,5,1) 即可得到(累积)分布函数F(150)的值“0.998650”,或用菜单法进入函数“NORMDIST对话框,输入相应的值(见图3-4)即可得同样结果。

3-4 NORMDIST对话框

再输入“=NORMDIST(130,135,5,1)(或菜单法)得到F(130)的值“ 0.158655,故

P(130X150)= F(150)-F(130)= 0.998650-0.158655=0.839995

二、NORMSDIST函数计算标准正态分布N(0,1)分布函数 (x)

函数NORMSDIST是用于计算标准正态分布N(0,1)(累积)分布函数 (x)的值,该分布的均值为 0,标准差为 1,该函数计算可代替书后附表所附的标准正态分布表。其格式为

NORMSDIST(z)

其中 z:为需要计算其分布的数值。

即对标准正态分布N(0,1)分布函数 (x),有

(x)= NORMSDIST(x)

3.3 ZN(0,1), 试求P(-2Z2)

则输入“= NORMSDIST(2) 可得 (2)的值“ 0.97724994,输入“= NORMSDIST(-2) 可得 (-2) 的值“0.02275006”,故

P(-2Z2)= (2)- (-2)=0.97724994-0.02275006=0.95449988

三、NORMSINV函数计算标准正态分布N(0,1)的分位数

函数NORMSINV用于计算标准正态分布N(0,1)(累积)分布函数的逆函数 -1(p)。即已知概率值 (x)=p,由NORMSINV(p)就可以得到x(= -1(p))的值,该x就是对应于p=1- 的标准正态分布N(0,1)位数Z1- 。函数NORMSINV的格式为

NORMSINV(probability)

其中 probability: 标准正态分布的概率值p

则对标准正态分布N(0,1)的分位数Z ,有

Z = NORMSINV(1- )

Excel求解例3.2(2):在例3.22)原解的计算中,已求得

word/media/image8_1.png

则由Excel中,NORMSINV(0.9)= 1.281551,得

word/media/image9_1.png

= 5/1.281551=3.901522

§3.4 分布的

一、指数分布分布函数值和密度值的计算

Excel中,函数EXPONDIST用于计算指数分布(累积)分布函数值F(x)和概率密度函数值f(x)。其格式为:

EXPONDIST(x,lambda,cumulative)

其中 x 为需要计算其分布的数值;

Lambda  指数分布的参数值

Cumulative 为逻辑值,指定函数形式。若取 1TRUE,将计算分布函数F(x);若 0 FALSE,则计算密度函数f(x)

即对指数分布的分布函数值F(x)和密度函数值f(x),有

F(x)= EXPONDIST(x, ,1);f(x)= EXPONDIST(x, ,0)

Excel求解例3.4:因X服从 =1/1000=0.001的指数分布,

EXPONDIST10000.0011

可得分布函数F(1000)=P(X1000)的概率值0.632121,故所求的概率为

P(X>1000)=1- P(X1000)=1- F(1000)=1-0.632121=0.367879

§3.5 2分布的

一、CHIDIST函数计算 2分布的概率值

ExcelCHIDIST函数用于计算 2分布的单侧概率值 = P( 2>x)。其格式为

CHIDIST(x, deg_freedom)

其中: x   用来计算 2分布单侧(尾)概率的数值。

Deg_freedom   2分布的自由度n

说明:如果参数deg_freedom 不是整数,将被截尾取整。

即对 2n)分布单侧概率值P( 2>x),有

P( 2(n)>x)= CHIDIST(x,n)

例如 已知 2 2(15),要计算P( 2>20)的概率值,则只要在Excel中,输入函数“=CHIDIST(20,15)”即可得到所求值0.1719327。即

P( 2>20)= 0.1719327

二、CHIINV函数计算 2分布的上侧 分位数

CHIINV函数用于计算 2分布的上侧 分位数 2 (n), 也就是计算单侧概率的CHIDIST函数的逆函数,即如果 =CHIDIST(x,n),则 CHIINV( ,n)=x。该函数的计算可代替概率统计书后所附的 2分布表。其格式为

CHIINV( ,deg_freedom)

其中    2分布的单侧概率

Deg_freedom   2分布的自由度n

说明: 如果参数deg_freedom 不是整数,将被截尾取整。

即对 2分布的上侧 分位数 2 (n),有

2 (n)= CHIINV( ,n)

例如, =0.05n=10, 要求上侧 分位数 20.05(10)的值,只要在Excel中输入“=CHIINV(0.05,50)”即可得到18.307029,即 20.05(10)= 18.307029

§3.6 t分布的

一、TDIST函数计算t分布的概率值

ExcelTDIST函数用于计算t分布的单侧概率值

=P(t>x)

和双侧概率值

=P(|t|>x)

其格式为

TDIST(x, deg_freedom, tails)

其中 x   为需要计算t分布的数字。

deg_freedom  t分布的自由度n

tails   指明计算的概率值是单侧还是双侧的。若 tails=1计算单侧概率值 =P(t>x);若 tails=2,则计算双侧概率值 =P(|t|>x)

说明 参数 deg_freedom tails不是整数时将被截尾取整。

即对t(n)分布的单侧概率值P(t>x)和双侧概率值P(|t|>x),有

P(t(n)>x)= TDIST(x,n,1)P(|t(n)|>x)= TDIST(x,n,2)

例如:要计算P(|t(60)|>2)的概率值,用“TDIST(2,60,2)”即得 0.050033

P(|t(60)|>2)= 0.050033

二、TINV函数计算t分布双侧 分位数

TINV函数用于计算t分布的满足

P(|t|> t /2(n))= (即 P(t>t /2(n)) = /2

双侧 分位数t /2(n), 也就是计算双侧概率值函数TDIST( ,n,2)的逆函数,即如果 =TDIST(x,n,2),则TINV( ,n)=x。该函数的计算可代替书后t分布表(附表6)。其格式为

TINV( , deg_freedom)

其中    为对应于t分布的双侧概率值;

Deg_freedom   t分布的自由度n

说明:如果 deg_freedom 不为整数时将被截尾取整。

注意,函数 TINV( ,n)的值是t /2(n),如果需要计算t分布的上侧 分位数t (n),应由“=TINV(2* ,n)”得到,即

t (n)=TINV(2 ,n)

例如,对n=10, t0.025(10)可由“=TINV(0.05,10)”得,其值为2.228139

t0.05(10)应由“=TINV(0.05*2,10)”得,其值为1.812462

=0.05n=50, t0.05(50) 由“=TINV(0.05*2,50)”得,其值为1.675905

TINV(0.05,50)=2.00856,是t0.025(50)(≈Z0.025=1.96)的值。

§3.7 F分布的

一、FDIST函数计算F分布的概率值

ExcelFDIST函数用于计算F分布的单侧概率值

=P(F>x)

其格式为

FDIST(x,deg_freedom1,deg_freedom2)

其中: x   用来计算F分布单侧概率的数值;

Deg_freedom1   F分布的第一(分子)自由度n1

Deg_freedom2   F分布的第二(分母)自由度n2

说明:如果参数deg_freedom1 deg_freedom2 不是整数,将被截尾取整。

即对F(n1,n2)分布的单侧概率值P{F(n1,n2)>x},有

P{F(n1,n2)>x}=FDIST(x,n1,n2)

例如,对FF(10,5),需求概率值P(F>0.3),则在Excel中由“= FDIST(0.3,10,5)0.950303,故

P(F(10,5)>0.3)= 0.950303

二、FINV函数计算F分布的上侧 分位数

FINV函数用于计算F分布的上侧 分位数F (n1,n2), 也就是计算单侧概率的FDIST函数的逆函数,即如果 =FDIST(x,n1,n2),则 FINV( ,n1,n2)=xFINV函数的计算可代替书后所附的F分布表。其格式为

FINV( ,deg_freedom1,deg_freedom2)

其中     对应于F分布的单侧概率值;

Deg_freedom1   F分布的第一(分子)自由度n1

Deg_freedom2   F分布的第二(分母)自由度n2

说明:如果 deg_freedom1 deg_freedom2 不是整数,将被截尾取整。

即对F分布的上侧 分位数F (n1,n2),有

F (n1,n2)= FINV( ,n1,n2)

例如,对 =0.05F0.05(10,5)可由“=FINV(0.05,10,5)”得,其值为4.735057

F0.05(5,10)则由“=FINV(0.05,5,10)”得,其值为3.325837

另外,F0.95(10,5)可由“=FINV(0.95,10,5)”直接求得,其值为0.300677

最后我们给出Excel中常用连续型分布统计函数的简明意义对照表,供查阅。

上机训练题三

1. 一电子仪器由200个元件构成,每一元件在一年的工作期内发生故障的概率为0.001。设各元件是否发生故障是相互独立的,且只要有一元件发生故障,仪器就不能正常工作。利用Excel中的统计函数来求:(1)仪器正常工作一年以上的概率;(2)一年内有2个以上(2)元件发生故障的概率。

2. 已知X服从 =4的泊松分布P( )试用ExcelP(X<6)

3. 已知X~Ν(1.5, 22),试用Excel中的统计函数来求:

(1) P(2<ξ≤2.5)(2) P(ξ<5)(3) P(|X-1.5|>2)

4.利用Excel中的统计函数来计算下列各值

1 20.99(10) 20.90(12) 20.01(60) 20.05(16)

2t0.90(4)t0.01(10)t0.05(12)t0.025(60)

3F0.01(10, 9)F0.05(10, 9)F0.90(28, 2)F0.95(10, 8)

5.用Excel求以下各分布的概率值

1P ( 2(21)10) P ( 2(21)15);

2P(t(4)3) P(|t(4)| 1.5);

3P (F(4,12) 5); P(F(4,12)>3)

上机实习四 Excel求正态总体参数的置信区间

首先我们列出求解单个总体常用参数的置信区间简要结果表,可供查阅。

4-1 单个总体参数的100(1 )%置信区间

下面讨论用Excel软件来求正态总体的总体均值和方差的常用置信区间问题。

§4.1 Excel 2已知时总体均的置信区间

总体方差 2已知时,求总体均值 100(1 )%的置信区间公式为:

word/media/image10_1.png

word/media/image16_1.png

4.1 设某药厂生产的某种药片直径X是一随机变量,服从方差为0.82的正态分布。现从某日生产的药片中随机抽取9片,测得其直径分别为(单位:mm

14.114.714.714.414.614.514.514.814.2

试求该药片直径的均值 95%置信区间。

解:对药片直径X,已知X服从N( , 0.82)

对于1 =0.95,则 =0.05查标准正态分布分位数表得临界值

Z /2 =Z0.025=1.96,

又已知 =0.8n=9,

word/media/image17_1.png

所以,该药片直径的均值 95%置信区间为(13.9815.02)。

Excel中,利用样本均值函数AVERAGE和置信区域函数CONFIDENCE就可以分别得到word/media/image18_1.pngword/media/image19_1.png的值,由此即可得到置信区间的上、下限。

其中统计函数AVERAGECONFIDENCE的格式分别为:

AVERAGE(number1,number2, ...) 返回参数平均值(算术平均值)word/media/image18_1.png

其中 Number1, number2, ... 要计算平均值的 130 个参数。参数可以是具体数字,或者是涉及数字的名称、数据范围或引用。

CONFIDENCE(alpha, st_dev, size)返回总体均值的置信区域,即样本均值任意一侧的区域大小word/media/image20_1.png

其中 alpha   显著水平 ,对应的置信度等于100*(1- )%

亦即,如果 alpha 0.05,则置信度为 95%

st_dev   数据区域的总体标准差 ,假设为已知。

size   样本容量n

现以例4.1的求解来说明已知方差 2时,用Excel构造总体均值的置信区间的具体步骤。

Excel求解例4.1为构造例4.1所求的置信区间,我们在工作表中输入下列内容:

A列输入例4.1的样本数据;C列输入指标名称;D列输入计算公式

即可得到所需估计的95%置信区间上、下限(见图4-1)。

由图4-1中计算结果知,所求药片直径均值 95%置信区间为(13.9815.02

4-1

说明:(1在图4-1中,F列为D列的计算显示结果,当输入完公式后,回车即显示出F列结果,这里只是为了看清公式,才给出了D列的公式形式。

2)对于不同的样本数据,只要输入新的样本数据,再对D列公式中的样本数据区域相应修改,置信区间就会自动给出。如果需要不同的置信水平,只需改变置信区域函数CONFIDENCE相应数值即可。

§4.2 Excel 2未知时总体均的置信区间

总体方差 2未知时,求总体均值 100(1 )%的置信区间公式为:

word/media/image22_1.png word/media/image23_1.png

4.2 设有一组共12例儿童的每100ml血所含钙的实测数据为(单位:微克):

54.872.353.664.743.658.363.049.666.252.561.269.9

已知该含钙量服从正态分布,试求该组儿童的100ml平均含钙量的90%置信区间。

解:由实测数据的计算可得到:

word/media/image24_1.png=59.14, S2=word/media/image25_1.png=74.15 word/media/image26_1.png8.61

又对于 1 =0.90 =0.1,而自由度n-1=11, t分布表得临界值

t /2(n-1) = t0.05(11)=1.796

word/media/image27_1.png

所求平均含钙量的90%置信区间为(54.6863.6)。

Excel中,利用“数据分析”菜单的“描述统计”计算结果中“平均”和“置信度”,就可分别得到word/media/image18_1.pngword/media/image28_1.png的值,由此即可得到所求置信区间。

Excel求解例4.1现以4.1的求解来说明求置信区间的具体操作步骤:

1. 输入数据:将4.1样本数据输入到工作表中的A1:A12(见图4-3);

2.在菜单中选取“工具→数据分析→描述统计”,点击“确定”;

3.当出现“描述统计”对话框后,指定参数:(图4-2

在“输入区域”方框内键入A1:A12

在“分组方式”圆点内选择逐列;

在“输出选项”中选择“输出区域”为C1

选定“汇总统计”;

选定“平均数置信度”,并将置信度改为“90%

6.点击“确定”。如下列图4-2所示

4-2

由此即可得到样本数据的描述性统计量的结果,如图4-3所示

4-3

根据描述统计量计算结果中样本均值(平均)=59.142和置信区间半径(置信度)=4.464,就可得所求平均含钙量90%置信区间为(59.142-4.46459.142+4.46454.67763.606)。

§4.3 Excel求正态总体方差 2的置信区间

根据样本数据,求正态总体方差 2100(1 )%置信区间公式为

word/media/image13_1.png

其中S2是样本方差, 2 /2 21- /2 2(n-1)分布的双侧临界值。

4.3 设某生物寿命服从正态分布,今观察其一组样本寿命,得数据为:(小时)

105011001080112012001250104011301300120012701300

试估计该生物寿命的总体方差的90%置信区间。

由样本数据计算得 S2=9127.27, n=12,

对于1 =0.90,则 =0.10n-1=11,查 2分布表,得临界值

2 /2(n-1)= 20.05(11)=19.675 21- /2(n-1)= 20.95(11)=4.575

word/media/image13_1.png = word/media/image31_1.png

总体方差 290%置信区间是(5102.9221945.34)。

Excel求解:下面我们通过对该例的求解来说明用Excel构造方差 2置信区间的过程。

Excel中,为构造例4.3所求方差 2置信区间工作表,我们在工作表中输入下列内容:

A列输入例4.8的样本数据;C列输入指标名称;D列输入计算公式

即可得到所需估计的方差 290%置信区间上、下限(见图4-4)。

1- =0.90,则 =0.10,两个临界值为

2 /2(11)= 20.05(11) 21- /2(11)= 20.95(11)

可分别由CHIINV(0.05,11)CHIINV(0.95,11)计算得到。

4-4

因此,所求总体方差 290%置信区间是(5102.8821946.27。结果见图4-4

注意:在图4-4中,F列为D列所显示公式的计算结果,当在D列输入完公式后,回车在D列即显示出F列的计算结果,这里只是为了看清公式,才在D列给出具体的公式形式。

上机训练题四

1.已知来自正态总体的样本值为7.08.07.89.26.4,求(1 =1.2时,总体均值 90%置信区间;(2 未知时总体均值 90%置信区间。

2. 测得9个蓄电池的电容量(单位:A·h)如下:

138139140143141142142137139

设电容量服从正态分布N , 2),求(1)总体方差 2对应的95%置信区间;(2)总体均值 95%置信区间。

3.对某地区随机调查18020岁男青年的身高,得均值167.10cm,标准差4.90cm,求该地区20岁男青年平均身高的95%置信区间。

4.在一指定地区的选民中,随机挑选300名选民进行民意测验,结果有182人对某个指定的候选人是满意的,求在所有选民中,对该候选人满意率的95%置信区间。

本文来源:https://www.2haoxitong.net/k/doc/b6d7ff6da45177232e60a204.html

《常用分布概率计算的Excel应用.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式