中心极限定理及其意义
———————————————————————————————— 作者:
———————————————————————————————— 日期:
题目:中心极限定理及意义
课 程 名 称: 概率论与数理统计
专 业 班 级:
成 员 组 成:
联 系 方 式:
2012年5月25日
摘要:
本文从随机变量序列的各种收敛与他们的关系谈起,通过对概率经典定理——中心极限定理在独立同分布和不同分布两种条件下的结论做了比较系统的阐述,揭示了随机现象最根本的性质——平均结果的稳定性。经过对中心极限定理的讨论,给出了独立随机变量之和的分布用正态分布来表示的理论依据。同样中心极限定理的内容也从独立分布与独立不同分布两个角度来研究。同时通过很多相关的正反例题,进行说明这些定理所给出的条件是否是充要条件;签掉在实际问题中灵活的应用和辨别是否服从我们给出的定理条件。最后了解一些简单简便的中心极限定理在数理统计、管理决策、仅是计算以及保险业务等方面的应用,来进一步的阐明了中心极限定理分支学课中的中重要作用和应用价值。
关键词:
随机变量,独立随机变量,特征函数,中心极限定理
引言:
在客观实际中有许多随机变量,他们是由大量的相互独立的随机因数的综合影响所形成的,而其中每一个别因数在总的影响中所起的作用都是渺小的,这种随机变量往往近似地服从正态分布,这种现象就是中心极限定理的客观背景。
中心极限定理自提出至今,其内容已经非常丰富。在概率论中,把研究在什么条件下,大量独立随机变量和的分布以正态分布为极限的这一类定理称为中心极限定理。但其中最常见、最基本的两个定理是德莫佛-拉普拉斯中心极限定理和林德贝格-勒维中心极限定理。
一、三个重要的中心极限定理
1.独立同分布的中心极限定理
设随机变量937d94f88934124ed49e09a193738ed5.png
654462f8fa4a82caa17fad5289ba8ce8.png
的分布函数c194cb5de628955c53fdc2dd7bcacfe7.png
eec1e1098a2f199c7d545e72dbb7f9a1.png
2.李雅普诺夫定理
设随机变量937d94f88934124ed49e09a193738ed5.png
c1966c248e64401e607da108155feb3c.png
记 5788e5fae1c61350fcf77776c25a7df6.png
若存在正数1834dcb80855b642c985cbd1b4409b26.png
115044f27d094a58f2ecb3bc023f6678.png
则随机变量之和edb4d884e79f3d74ac2387965f3f6c29.png
839dc4a0b630cf0b19da67a132cc0f9e.png
的分布函数c194cb5de628955c53fdc2dd7bcacfe7.png
ab34c8855cf8de6024969d8a8d97e16a.png
3.棣莫弗—拉普拉斯定理
设随机变量482ec0b6633f36e091f6a0ab5bfcaace.png
二、中心极限定理的意义:
首先,中心极限定理的核心内容是只要n足够大,便可以把独立同分布的随机变量和的标准化当作正态变量,所以可以利用它解决很多实际问题,同时这还有助于解释为什么很多自然群体的经验频率呈现出钟形曲线这一值得注意的事实,从而正态分布成为概率论中最重要的分布,这就奠定了中心极限定理的首要功绩。其次,中心极限定理对于其他学科都有着重要作用。例如数理统计中的参数(区间)估计、假设检验、抽样调查等;进一步,中心极限定理为数理统计在统计学中的应用铺平了道路,用样本推断总体的关键在于掌握样本特征值的抽样分布,而中心极限定理表明只要样本容量足够地大,得知未知总体的样本特征值就近似服从正态分布。从而,只要采用大量观察法获得足够多的随机样本数据,几乎就可以把数理统计的全部处理问题的方法应用于统计学,这从另一个方面也间接地开辟了统计学的方法领域,其在现代推断统计学方法论中居于主导地位.
三、中心极限定理的应用:
1.1保险学的概率论数学原理
保险体现了“人人为我,我为人人”的互助思想,它以数理统计为依据。保险中的风险单位是发生一次风险事故可能造成标的物损失的范围,也就是遭受损失的人、场所或事物。风险单位是保险公司确定其能够承担的最高保险责任的计算基础。理想状态下的风险单位应独立同分布,这种现象的意义在于保险人可以据此向每个潜在的被保险人收取同样的保费。同时根据中心极限定理,含有n个风险单位的随机样本的平均损失符合正态分布,这个结论对保险费率的厘定极为重要。保险公司各险种的交费标准是经过精算后以同期银行利率比照制定的,所以在此基础上应尽可能地多承保风险单位,也就越可能有足够的资金赔付保险期内发生的所有索赔,从而使保险公司的运营更加平稳,也就越有利于投保人或被保险人.
既然可利用中心极限定理能合理地厘定保险费率,为何老年人投保一再被提高门槛呢?京江晚报3月28日就有报道“对保险公司来说,老年人属于高风险人群,存在的不确定因素较多,老年人发生医疗费用支出和意外事故的风险要比年轻人大。所以,从赔付率的角度考虑,保险产品在推出前会经过精密测算,设置相应的年龄门槛和不同的缴费标准”.
我们以最简单的一年定期寿险为例说明保险公司为何对中老年人保险总提高门槛,老年人投保寿险与年轻人有何区别。如表1所示是台湾远雄人寿千喜男性一年定期寿险的部分费率及死亡率(见附录三、四)。为说明问题,我们选取25-29岁作为年轻人的代表,61-65岁为老年人的代表,将这两个年龄段进行比较。
远雄人寿千喜男性一年定期寿险的部分费率及死亡率 表1
单位:元/每万元基本保额
现假定每个年龄各有1000个人投保,则按照下列计算公式得出表2:
总保费=1000 6392228661363e75c352077a2cfe66d7.png
赔付额=68ee049001ba00afcedcb0eea9e86cb5.png
不同年龄的总保费及赔付额 表2
单位:万元
由于计算中假定每个年龄的投保数相同,而老年人的死亡率比年轻人高,则导致赔付额的基数较大,所以还不能很好的解释问题,这里再引入赔付率(赔付率=赔付额/总保费),得出表3。
各年龄的赔付率 表3
从表3可知,25-29岁总体的赔付率呈下降趋势,而61-65岁总体的赔付率呈上升趋势且赔付率处于较高水平。那么对于一个保险公司,她的经营主要是以盈利为目的,老年人身体状况较差,是疾病、死亡的多发群体,面临的风险大,所以为老年承保寿险时保险公司的赔付率相对较高。因此老年人投保寿险一再被提高门槛。同时,老年人寿险的保费若定价较高,但老年人收入相对偏低,可能买不起,而定价过低,保险公司也承受不起,从而更加影响公司的盈利。因此,寿险公司更愿意把目光投向年轻人群体。
1.2 定期寿险保险金的给付模型
在上述比较中,我们知道了保险公司更青睐于年轻群体,但是在保险公司追求利益的同时还应考虑到他们的偿还能力。我国《保险法》规定“保险公司应该具有与其业务相适应的最低偿付能力。”下面我们就将建立定期寿险保险金给付模型。
首先,根据国际精算协会的惯例,采用下列符号:
(x):一个新生儿生存至x岁,记为个体(x);
69b28f957f89f788ab26d82f703eeebb.png
69b28f957f89f788ab26d82f703eeebb.png
1834dcb80855b642c985cbd1b4409b26.png
9e3669d19b675bd57058fd4664205d2a.png
T(x): 个体(x)的未来生存时间aa4f1cb03026fec91e880f9912c48370.png
现假定利率为常数i,则有:
9ffd21716fdf88a071d61f783a3ca841.png
再记n年定期寿险的保险人给付额的现值为Z,则Z的精算现值为
ca0c8ac9b82fe7ff01db2494325bd57f.png
Z的j阶矩为
48a65259d82fa400672806c2d15ab4b8.png
=85d1547f453b11f27c227a47132222c0.png
现假定1000个x岁独立的个体投保一年定期寿险,死亡保险金为1万元,在死亡后立即给付。死亡力为常数a1155692e3f69913320174f980c7eaf1.png
记1000个个体的未来生存时间分别为4312fcf245819809524a0e80071cb6bc.png
78e8309b3a70c9148a728e7722fc4d46.png
二阶矩为
c98eefa646ca3f4bda59672ac6c44e83.png
因此方差09ef00e0b9d1cf90c9083dd759dbf6c3.png
度,利用中心极限定理,我们可以得到:
c5395b8a0a23c39f73f6783be3a2f186.png
再利用正态分布0.975的分为点1.96,得
9654e219a714b00b656c32eb650b38f4.png
即W953f2b15b42147df5182f2ef59b20ee4.png
1.3 定期寿险业的盈亏
我们已经知道寿险公司的经营是为了盈利,而一个保险公司的盈亏,是否破产,我们也可以运用中心极限定理的知识做到估算和预测。例如设某寿险公司在一段时间内有n个同一年龄的人投保一年定期寿险,他们是相互独立彼此互不影响的,且在一年内没有新的投保人加入该项保险业务,也没有人退保。那么就可以利用中心极限定理估计该公司接下这些保单的盈亏概率。设每份保单的保费为M,保额为Q,该年龄的死亡率为p,令
4fc3e3c98d13ed389817f11dc66c10a6.png
则有
3317a4f07bc329946e1e0dd7f0647c4f.png
再结合中心极限定理有该保险公司的亏本概率为
a1500206e1db1409fda4f91a90a4f81e.png
d6f47419071068d2e72d3bd146180c18.png
若计算出的dc5233cb1d950ecad15b1e9b2514f665.png
1.4 实例分析
例1 :某保险公司的老年人寿保险有10000人参加,每人每年交200元。若老人在该年内死亡,公司付给其家属1万元。设老年人的死亡率为0.017,问:(1)保险公司在一年内的这项保险中亏本的概率多大?
(2)保险公司一年的利润不少于20万元的概率多大?
解:设8b8bf6c426eb40b0d06df646f36a4ae3.png
(1)要使保险公司亏本,必须满足
2006392228661363e75c352077a2cfe66d7.png
95e029696a8e77db6f75665e6464c095.png
则P(8b8bf6c426eb40b0d06df646f36a4ae3.png
953f2b15b42147df5182f2ef59b20ee4.png
=1- ea2204597853ad49a098d79acec3f98a.png
即保险公司亏本的概率为1%。
(2)要使保险公司一年的利润不少于20万元,必须满足
200 6392228661363e75c352077a2cfe66d7.png
95e029696a8e77db6f75665e6464c095.png
则P(0d607ddcb86a5f9b9fba1db17aa88fccd.png
=505160120add15aaacafb6563bf660bc.png
即保险公司一年的利润不少于20万元的概率为78.23%。
2.1中心极限定理在决策问题中的应用
决策是为了达到某种预定的目标,在若干可供选择方案中决定一个合适方案的过程。那么在就某事的可行性进行决策时,单个人认为是否可行称为个体决策,几个人(至少3个人)按照少数服从多数的方法决定是否可行称为集体决策。俗话说,人多力量大,那么我们习惯上认为的集体正确决策的概率大于每个单个个体正确决策的概率是否正确呢?下面将应用中心极限定理来讨论分析这个问题。
首先,我们给出一些简单的数据,利用特殊法看看该说法是否正确。见表4。记n为参与集体决策的人数,假定每个个体做出正确决策的概率相同,且均为p,决策方式也是根据少数服从多数原则,则在空格中所填数据为集体决策正确的概率,记为ff0a83b5e47fad1ad99f3989206fd475.png
集体决策做出正确决策的概率 表4
从表4中,我们可以看到以下两个情况:
情况一:848078811159217d04d5283fb500a99e.png
由此我们得出第一个猜测,
猜测一:0cd6802233104c883fad6526155a6c43.png
情况二:d8cbbf8ba4093e9189a5cd5b9799d854.png
显然由这一情况可知,集体正确决策的概率大于每个单个个体正确决策的概率这一说法是不一定正确的,同时我们也得出了第二个猜测,
猜测二:78c2a766842cb723d3bb4dc4365ddccf.png
现在就利用一般法检验两个猜测是否正确,下面将结合中心极限定理来做出判断。设X为n个人中做出正确决策的人数,令
a8ebd59ba9cde16edf227a20eb1a1446.png
记35d2234c9adb1c7c3ee03a001068353b.png
a65779f9141a753b90d673530cf8b2ab.png
将X标准化,并由中心极限定理可得
9485aec54a553411770d102f0f8d3ca6.png
当n成分大时,
a5de9ca3cd1ebc86a5175ef24c4c1257.png
为下面讨论方便,令
f10921735b199db5e14ad751b6fdd482.png
c9b153054edf84b844dcbdcfcc0e3271.png
那么对于猜测一:(1)当2c6528f604e4e1087b06870834cee646.png
若16edf34704f7c1de6e1890a90a67b3d2.png
41d39b5938d85ea48cedada70a79600d.png
902f34e58bfde7cd53915e6bf332a8cb.png
同理可证明(2),(3)。
所以猜测一是正确的。
对于猜测二:当n充分大时,我们可以得到
93d68bded57e682f95a9e01b54b5de9b.png
由此可知,当n充分大时,若98756540a9757a9843f4a4c723d6729d.png
ea5877c61ebec443db8f97a45aaed809.png
矛盾。若0 93b05c90d14a117ba52da1d743a43ab1.png ea5877c61ebec443db8f97a45aaed809.png 而p是一个大于0小于93b05c90d14a117ba52da1d743a43ab1.png 在验证猜测一与二的基础上,我们可以得出这样的结论:当且仅当0.5<p<1时集体决策为正确的概率大于个体决策为正确的概率,并且当参与人数n不断增加时,集体决策正确的概率也不断趋向于1 3.0 中心极限定理在生产供应、需求上的应用 现实生活中,当厂家的生产量大于需求量时,会导致商品的积压以及商品价值难以体现;而当厂家的生产量小于需求量时,供给又难以满足社会需求。为了尽量防止“供”过于大于“求”及尽可能的满足社会需求度,我们就要利用中心极限定理来估算一些值,具体如下。 3.1 根据现有生产能力及用户需求状态,估算能满足社会需求的可靠程度 某工厂负责供应某地区n个人的商品供应,在一段时间内每人需用一件该商品的概率为p,假定在这段时间内每个人购买与否彼此独立,现该工厂仅生产M件商品,试估计能满足该地区人们需求的概率dc5233cb1d950ecad15b1e9b2514f665.png 若记 920a692060557bb112f4044ac4ac6d38.png 则 ded81fefa71b91e232af3c5b42058345.png 通过查正态分布表可求得dc5233cb1d950ecad15b1e9b2514f665.png 3.2 根据社会需求状态来确定生产任务 某工厂负责供应某地区n个人的商品供应,在一段时间内每人需用一件该商品的概率为p,假定在这段时间内每个人购买与否彼此独立,现该工厂至少有dc5233cb1d950ecad15b1e9b2514f665.png 若记 920a692060557bb112f4044ac4ac6d38.png 则 ae405cb82d2674b972854d8008250cb6.png 95e029696a8e77db6f75665e6464c095.png 令 5532756fa6eae76d27b8bea715667783.png 则 M5d95b39c7de15fbd82caf892cadc9121.png 所以该工厂至少需要生产891ce5a405c018e316f47a64d2ab0f8c.png 3.3 根据需求及产品质量情况来确定生产量 某工厂负责供应某地区的商品供应,该商品的次品率为p,而在一段时间内共需M件该商品且要求至少有dc5233cb1d950ecad15b1e9b2514f665.png b8d8fc7e8cf751a6f246095b16301eef.png 则 95ce660eb2fd967a1c33cb0328088d2c.png 所以由 6f77e55cfbadf138b7b7d4e1439138bb.png 可知 59c4bcf09a2b986dac802551654f79bd.png 令 eec1926c798a1531f730778ca78aaddd.png 再通过解不等式 9f36ef16c4e5b600abf602cba266fb84.png 由上式可解出生产量N的范围。 3.4 例题分析 设某电视机厂生产液晶电视机以满足某地区100家客户的需求,若由以往的统计资料表明:每一用户对该电视机的年需求量服从6af8e2f02f674b41b6ccf43debc252d2.png 解:设这100户客户对这种液晶电视机的年需求量依次为ccc9c68bc0c7bf304ae8e77ed2713804.png 9e4a789f4faaa03536676dd469d64cb0.png 即 36d78c30c20eb5d93663041670a46e8a.png 那么根据泊松分布的知识知 c4d94021d1f8f2de3a6bfa1ded8d6b5a.png 再设5e8e5d438d80cb1e942e36951a2b2cdd.png 5e8e5d438d80cb1e942e36951a2b2cdd.png 由于n=100较大,根据中心极限定理我们有:5e8e5d438d80cb1e942e36951a2b2cdd.png 现在该厂的年产量为220台,则能满足客户需求的把握为 P(5e8e5d438d80cb1e942e36951a2b2cdd.png 即能满足客户需求的把握为91.924%。 又若该厂要有97.5%的把握满足需求,则设该厂安排年产量为M台,则M应满足下式: P(5e8e5d438d80cb1e942e36951a2b2cdd.png 从而有 P(0aed86a5ad7426a663426e75a77c71c9.png 由正态表查得3adfa34d6aae0631c7a78468e6d186c8.png 6dc911085029643f63fd292c617fac09.png 即取M=228(台)。 最后我们设N为当液晶电视机正品率为95%时的生产量,设c7934d6441a5ecba3373b796c3ffd0e3.png 60ef92fff6f894ade6ca99834c8f9ba4.png 为N台液晶电视机中的次品总数,而N-60ef92fff6f894ade6ca99834c8f9ba4.png P(N-60ef92fff6f894ade6ca99834c8f9ba4.png 即 P(60ef92fff6f894ade6ca99834c8f9ba4.png 由题意知 60ef92fff6f894ade6ca99834c8f9ba4.png 从而 E60ef92fff6f894ade6ca99834c8f9ba4.png 结合中心极限定理知60ef92fff6f894ade6ca99834c8f9ba4.png P(60ef92fff6f894ade6ca99834c8f9ba4.png 再通过查正态分布表知 7b1647e92892a695072651b91ff515f1.png 就有 e415b5ea508f90324da57846c4f455d4.png 解此不等式得 Nd871caac112fc0a2039d49b61a782304.png 取N=542(台)所以在这种情况下应生产出542台液晶电视机才能有99.7%的把握客户买到的是正品。 本文来源:https://www.2haoxitong.net/k/doc/5113de64ec06eff9aef8941ea76e58fafbb04579.html
文档为doc格式