超级大乐透中奖预测模型
摘 要
彩票有无规律一直就是具有争议性的问题,有人认为:彩票就是摇奖机随机产生的,毫无规律可言,而有的人认为万事万物都有其内在的规律,彩票也一样,只就是其规律较隐蔽不易发现。世界上的任何事物都有两面性,对于彩票而言,虽然规律性不就是很强,但不就是没有规律。只要经过大量的观察,根据概率统计学的知识,就可以对彩票选号进行统计预测,提高中奖概率。
本题就是一个概率统计预测与最优策略的问题。根据每个问题的提示,都可以建立起简单数学模型进行求解。
对于问题一,先在知名权威的网站上下载数据,通过
一等奖 | 二等奖 | 三等奖 | 四等奖 | 五等奖 | 六等奖 | 七等奖 | 八等奖 |
并与双色球的对比可知,大乐透的高奖级有优势,固定奖逊于双色球。
对于问题二,分析历史数据,找出大乐透中奖号码规律,计算分析前后区号与、二连号、三连号、极差、奇偶性、总投注金额等参数。首先对超级大乐透彩票
(1) 奇偶搭配:选号时注意奇偶搭配的比例,应该接近
(2) 关于极差:选出的5个号中,最大号与最小号的差值应注意在
(3) 连号方面:二连号明显多于三连号,应考虑多买二连号。
对于问题三,先对复式投注与胆拖投注方式建立数学模型,求解它们各种不同的组合中各奖级的概率,并与问题一的单式投注概率相比较。在进行多注彩票的购买时,复式投注的方式要优于单式投注。前区2胆拖28,后区1胆拖3这种方式进行投注就是不错的选择。风险与收益的分析通过期望值与期望效用来刻画,可知在复式投注组合中,8+9、9+11、10+8几种组合投注方式最优。
对于问题四,就是结合以上三问,列举出最为合理投注方法,复式前区控制在十个以内,胆拖可尝试前区三胆四拖、后区一胆七拖。
在文章的最后,给出了模型的若干改进,使模型趋于完善。分析了模型的优缺点,本文的最大优点就是思路清晰,简洁明了,可操作性强,结合历史数据,给出了彩票的预测号码。
关键字:彩票,概率,预测, 期望效用,最优策略
一 问题重述
超级大乐透就是由国家体育总局体育彩票管理中心发行、娱乐性极强的乐透型数字彩票游戏,大奖很大、小奖很多、易选易中,每逢加奖时最高奖金可超越500万!每周一、三、六晚上开奖。目前受到诸多彩民的青睐。
超级大乐透:从01—35共35个号码中选取5个号码为前区号码,并从01—12共12个号码中选取2个号码为后区号码组合为一注彩票进行的基本投注。每注金额人民币2元。在基本投注的基础上,可进行追加投注,每注追加金额人民币1元。
超级大乐透的奖级、中奖条件与奖金设置见原题。
大乐透的一、二、三等奖都就是浮动奖金,即根据当期奖池的多少来分别计算,规则如下:
一等奖:当奖池资金低于1亿元时,奖金总额为当期奖金额减去固定奖总额后的75%与奖池中累积的奖金之与,单注奖金按注均分,单注最高限额封顶500万元。当奖池资金高于1亿元(含1亿元)时,奖金总额包括两部分,一部分为当期奖金额减去固定奖总额后的45%与奖池中累积的奖金之与,单注奖金按注均分,单注最高限额封顶500万元;另一部分为当期奖金额减去固定奖总额后的30%,单注奖金按注均分,单注最高限额封顶500万元。
二等奖:奖金总额为当期奖金额减去固定奖总额后的20%,单注奖金按注均分,单注最高限额封顶500万元。
三等奖:奖金总额为当期奖金额减去固定奖总额后的5%,单注奖金按注均分,单注最高限额封顶500万元。
另外,超级大乐透经常有加奖活动。加奖时,单注奖金将超越500万元! 当期每注彩票只有一次中奖机会,不兼中兼得,另行设立的特别奖除外。
附件 1 中的表格“历史号码”数据表示了从大乐透开始的7001期至13090期的所有955期历史开奖数据,包括了前区的5个号码与后区的2个号码;“后区组合”表示了后区的2个号组合出现的频数统计,2013期只就是部分统计,未全部完成;”开奖详情”详尽的显示了历史各期的开奖日期、开奖号码、奖池奖金、一二等奖的注数及奖金、以及当期的总投注额。
相关的历史数据可在国内知名彩票网站下载。
问题1 试补全超级大乐透附件1表格的所有相关数据。若有错误,请修正之。计算出大乐透获奖等级的中奖概率?并与目前热门的双色球等彩票进行对比。
问题2 根据补全的历史数据尽可能的找出您们认为的大乐透中奖号码规律。如前后区号与、二连号、三连号、极差、奇偶性、总投注金额的历年变化等。当然您们也可以加上一些其它有用的历史数据,找出规律,并用简洁的语言概括出来。
问题3 建立相应的数学模型,来研究合理的下注方法(目前常用的就是单式投注、复式投注及胆拖投注),以及如何提高所投注彩票的中奖概率?试估算其风险与收益?以及其它有意义的要素来研究。
问题4 写一则短文,简述您们投注方法,及如何提高中奖概率的?
二 问题的分析
本题就是一个比较典型的概率统计与预测方面的问题。
问题一通过对超级大乐透附件1表格的所有相关数据的分析与题意可知,附件的数据就是不全的且有一定的错误,需要从权威网站查阅加以补充与更正。由于数据量大,需要借助统计软件与编程来实现。其次,计算出大乐透获奖等级的中奖概率,根据题意大乐透的中奖号码就是随机产生的,就是从01—35共35个号码中选取5个号码为前区号码,并从01—12共12个号码中选取2个号码为后区号码组合为一注彩票进行的基本投注,依据各获奖等级的规则,运用组合与概率的数学知识计算出中奖概率,同时与双色球的中奖概率相比较。
问题二根据补全的历史数据找出大乐透中奖号码规律,如前后区号与、二连号、三连号、极差、奇偶性、总投注金额的历年变化,这就需要建立相应的简单的数学模型,通过
问题三本题主要研究的就是选择合理的下注方法,来提高所投注彩票的中奖概率,并使得投注的收益最大且风险最低,而投注彩票的方法无非只有单式投注、胆拖投注与复式投注。需要运用概率组合的数学理论分别对其求解,通过编程求解出以上三种投注方式对中不同等级奖的概率以及收益值,比较最后的结果,来确定最优的投注方式。
问题四在问题二与问题三的基础上考虑最佳的投注策略,给出具体的投注方式。
三 模型假设
1. 摇奖器排除了任何的人为干扰,摇出每组的号码概率就是相等的。
2. 根据国家有关规定,设返奖率就是定值为50%。
3. 补充完的历史数据完全真实有效。
四 符号说明
五 模型的建立与求解
5、1问题一的解答
5.1.1附加相关数据的补全
1、根据附件中的表格“历史号码”数据从13001期至13090期,通过
表1 2013期后区的2个号组合出现的频数
3+10 | 1 | 8+10 | 0 | 3+12 | 1 |
3+6 | 2 | 2+7 | 2 | 5+11 | 2 |
6+8 | 1 | 1+12 | 0 | 5+9 | 1 |
4+10 | 1 | 4+11 | 1 | 8+11 | 0 |
10+12 | 2 | 4+6 | 2 | 10+11 | 1 |
1+2 | 0 | 2+8 | 1 | 6+7 | 0 |
9+10 | 1 | 3+8 | 2 | 3+7 | 1 |
3+9 | 1 | 7+10 | 1 | 2+12 | 0 |
5+10 | 3 | 3+4 | 1 | 4+7 | 0 |
6+10 | 0 | 9+12 | 1 | 1+9 | 0 |
2+10 | 0 | 2+9 | 1 | 6+12 | 1 |
5+8 | 1 | 7+12 | 2 | 1+7 | 2 |
5+12 | 1 | 6+9 | 1 | 2+6 | 1 |
11+12 | 1 | 1+8 | 1 | 2+3 | 0 |
5+7 | 3 | 7+9 | 1 | 1+5 | 1 |
1+11 | 4 | 5+6 | 1 | 4+8 | 1 |
7+11 | 1 | 2+5 | 0 | 4+5 | 0 |
8+9 | 1 | 4+12 | 0 | 7+8 | 1 |
4+9 | 0 | 1+4 | 1 | 2+4 | 1 |
1+6 | 1 | 1+3 | 2 | 6+11 | 0 |
1+10 | 1 | 9+11 | 1 | 3+5 | 1 |
2+11 | 1 | 8+12 | 1 | 3+11 | 2 |
完整数据表见附件1。
2、 附件中的表格“开奖详情”数据从13015期开始奖池奖金、一二等奖的注数及奖金、以及当期的总投注额都有缺少,从13049期至13090期的所有详情需要补充,从权威网站查阅数据并制成表格将其补充完整,由于数据过多,完整数据见附件1。
5.1.2中奖概率模型的建立与求解
由题意可知,从01—35共35个号码中选取5个号码为前区号码,并从01—12共12个号码中选取2个号码为后区号码组合为一注彩票进行的基本投注,那么前区总情况数:
根据各奖级的中奖规则,计算各奖级的中奖概率如下:
一等奖:
5+2情况数1种,则概率为:
二等奖:
5+1情况数,前区1种,后区
三等奖:
5+0情况数,前区1种,后区
四等奖:
4+2情况数,前区
五等奖:
4+1情况数,前区
六等奖:
4+0,前区
3+2,前区
七等奖:
3+1:前区
2+2:前区
八等奖:
3+0:前区
2+1:前区
1+2:前区
0+2:前区
故可以计算最后总的中奖的概率为6、67%。
同理根据双色球的选号与中奖规则可以计算出各等级的中奖概率,见表2。
表2 双色球的中奖概率
一等奖 | 1/17721088 |
二等奖 | 1/11814005、9 |
三等奖 | 1/109389、4 |
四等奖 | 1/2302、9 |
五等奖 | 1/128、9 |
六等奖 | 1/16、9 |
总中奖概率 | 6、25% |
所以通过对上述的中奖概率与它们的奖金设置的分析,不难发现一等奖:双色球 1772万分之一,大乐透 2142万分之一,一等奖考虑到大乐透的奖金额要高,其实二者很相近。 二等奖:双色球111万分之一,大乐透195万分之一,二等奖双色球明显占优势。 三等奖:双色球13、5万分一,大乐透33万分之一,考虑到大乐透的三等奖的奖金额,双色球的三等奖的设置就是不合理的,此项大乐透占有绝对优势。四等奖:双色球: 1612分之一,大乐透11万分之一,注意一下大乐透的4等奖与双色球的三等奖的奖金就是一样的,双色球概率就是13、5万分一,大乐透就是11万分之一,比较接近。另外,从固定奖对比情况来瞧,双色球中奖率更高一些,但大乐透固定奖设置更多,因此可以说就是各有千秋。
5、2问题二的解答
5.2.1奇偶数分析
1、 记彩票从
2、根据上述的模型,通过
表3 前区奇偶性分析对比
奇数个数 | 偶数个数 | 实际出现期数 | 实际出现概率 | 理论概率 |
0 | 5 | 12 | 0、012579 | 0、019067 |
1 | 4 | 112 | 0、1174 | 0、131965 |
2 | 3 | 278 | 0、2914 | 0、320486 |
3 | 2 | 350 | 0、36688 | 0.34852 |
4 | 1 | 169 | 0、17715 | 0、160243 |
5 | 0 | 33 | 0、034591 | 0、019062 |
表4 后区奇偶性分析对比
奇数个数 | 偶数个数 | 实际出现期数 | 实际出现概率 | 理论概率 |
0 | 2 | 219 | 0、22956 | 0、2273 |
1 | 1 | 539 | 0、56499 | 0、5454 |
2 | 0 | 196 | 0、20545 | 0、2273 |
从表3可以瞧出,实际出现的概率与理论计算出的概率相差很小,并且可以瞧到,出现2 个奇数3个偶数与3个奇数2个偶数概率最大,两者理论与为0、662338,即在中奖号码有将近70%的机会出现。从表4可以瞧出,出现1个奇数1个偶数概率最大。
5.2.2二连号与三连号分析
1、考虑同一期中中奖号码出现两个连续、三个连续的情况,即彩票从
2、 根据上述的模型,通过
表5 前区连号情况
二连号率 | 三连号率 | 斜二连号率 | 斜三连号率 |
0、51992 | 0、057652 | 0、15094 | 0、0052411 |
从上表可以瞧出二连号的概率最大,在实际的购买彩票中可以适当的考虑买二连号。
5.2.3极差分析
1、极差就是指最大号码减去最小号码的差值。彩票从
2、根据上述的模型,通过
表6 极差分析
极差 | 实际出现的期数 | 实际概率 | 理论概率 |
4 | 0 | 0 | 0.000009 |
5 | 1 | 0、0010482 | 0.000370 |
6 | 2 | 0、0020964 | 0.000893 |
7 | 0 | 0 | 0.001725 |
8 | 4 | 0、0041929 | 0.002911 |
9 | 2 | 0、0020964 | 0.004485 |
10 | 5 | 0、0052411 | 0.006469 |
11 | 12 | 0、012579 | 0.008716 |
12 | 10 | 0、010482 | 0.011690 |
13 | 15 | 0、015723 | 0.014909 |
14 | 18 | 0、018868 | 0.018501 |
15 | 22 | 0、023061 | 0.02 425 |
16 | 26 | 0、027254 | 0.026630 |
17 | 21 | 0、022013 | 0.031051 |
18 | 24 | 0、025157 | 0.035610 |
19 | 28 | 0、02935 | 0.040212 |
20 | 41 | 0、042977 | 0.044774 |
21 | 46 | 0、048218 | 0.043988 |
22 | 45 | 0、04717 | 0.053260 |
23 | 51 | 0、053459 | 0.056926 |
24 | 58 | 0、060797 | 0.060009 |
25 | 73 | 0、07652 | 0.062348 |
26 | 54 | 0、056604 | 0.063765 |
27 | 51 | 0、053459 | 0.064073 |
28 | 60 | 0、062893 | 0.063071 |
29 | 67 | 0、070231 | 0.060549 |
30 | 68 | 0、071279 | 0.056279 |
31 | 54 | 0、056604 | 0.050026 |
32 | 37 | 0、038784 | 0.041539 |
33 | 33 | 0、034591 | 0.038558 |
34 | 26 | 0、027254 | 0.016807 |
根据表6对中奖的号码的极差分布进行卡方拟合优度检验:
卡方统计量:
其中,
5.2.4总投注金额的历年变化
通过
图1 总投注金额的历年变化
观察变化趋势图可知,虽然总投注金额的偶尔有较大的起伏,但总的来说就是不断的增加的。
5、3问题三的解答
5.3.1概率比较
1、单式投注的中奖概率已在问题一中求解出。
2、复式投注方式概率的计算,设
则可得:
复式投注最大的优点就就是可以同时获得不同等级的奖项,根据中奖规则得出中各奖级概率:
于就是可以建立中各奖级概率的模型:
…
通过
表7
a | b | ||||||||
6 | 8 | 7、84E-06 | 8、96E-06 | 1、68E-06 | 0、00056848 | 0、00064969 | 0、011952 | 0、083755 | 0、71735 |
6 | 9 | 1、01E-05 | 7、56E-06 | 8、40E-07 | 0、0007309 | 0、00054817 | 0、014983 | 0、10233 | 0、87898 |
6 | 10 | 1、26E-05 | 5、60E-06 | 2、80E-07 | 0、00091362 | 0、00040605 | 0、018394 | 0、1227 | 1 |
6 | 11 | 1、54E-05 | 3、08E-06 | 3、53E-05 | 0、0011166 | 0、00022333 | 0、022184 | 0、14487 | 1 |
6 | 12 | 1、85E-05 | 2、65E-05 | 2、74E-05 | 0、00134 | 0、001235 | 0、026353 | 0 | 0、19297 |
7 | 3 | 2、94E-06 | 3、14E-05 | 2、06E-05 | 0、00013722 | 0、0014637 | 0、0048713 | 0 | 0、27455 |
通过对数据进行分析,以6+11这种组合购买彩票,中奖概率最大。将复式投注的中奖概率与单式投注的中奖概率进行比较,不难发现就单注而言它们的中奖概率就是相同的,但采用复式投注可以大大增加同时获得不同奖级的概率,所以在进行多注彩票的购买时,复式投注的方式要优于单式投注。
3、 胆拖投注方式概率的计算,设
通过
表8
j | k | ||||||
2 | 27 | 3 | 0、00040955 | 0、0010921 | 0、0038225 | 9、83E-05 | 0、00026211 |
2 | 28 | 2 | 0、0003058 | 0、0013761 | 0、0055044 | 5、88E-05 | 0、00026464 |
2 | 28 | 3 | 0、0004587 | 0、0012232 | 0、0042812 | 8、82E-05 | 0、00023523 |
2 | 29 | 2 | 0、00034109 | 0、0015349 | 0、0061395 | 5、05E-05 | 0、00022739 |
2 | 30 | 2 | 0、00037898 | 0、0017054 | 0、0068217 | 4、06E-05 | 0、00018272 |
3 | 3 | 2 | 2、80E-07 | 1、26E-06 | 5、04E-06 | 4、06E-06 | 1、83E-05 |
通过对数据进行分析,得出以前区2胆拖28,后区1胆拖3这种方式进行投注中奖概率最大,如表所示。从数据中可以瞧出这种投注方式中奖概率相对较高,且呈明显的区域分布。
5.3.2收益与风险分析
1、风险原理
原理1(边际效用递减原理) 个人对商品与财富所追求的满足程度由其相对于她的主观价值——效用值来衡量商品与财富的效用值随着绝对数量(或货币单位量)的增加,但增加的速率却逐渐递减。
原理2(最大期望效用原理) 在具有风险与不确定的条件下,个人的行为动机与准则就是为了获得最大期望效用值,而不就是为了获得最大期望金额值。
如果按上述原理,彩票的购买者应该考虑所获得金额值的效用,而非金额的本身。可以计算期望效用值以评估方案的优劣,可以把购买者的风险态度与其效用函数联系起来。根据风险理论,如果
2、计算购买者的期望效用。
单张彩票投注中各项中
单张彩票的中奖期望值为:
单张彩票能获得的期望效用,有如下计算公式:
由于一等奖、二等奖、三等奖都就是浮动奖金,这里采用一般情况下的平均值作为一、二、三等奖的奖金,分别为500万、18、2万、1、6万。
(1)复式投注中奖期望值与期望效用的计算:
用
表9
a | b | 期望效用 | 中奖期望值 |
6 | 3 | -31、8 | 4、2 |
6 | 4 | -63、6 | 8、4 |
6 | 5 | -106 | 14 |
6 | 6 | -159 | 21 |
通过将复式投注的中奖概率、中奖期望值、期望效用的趋势图进行对比,综合分析,图上标注的红色区域即为中奖概率较大、期望值较高、期望效用较大的综合,且考虑在大概相同指标下投注的金额要少,则8+9、9+11与10+8几种组合投注方式最优。
(2)胆拖投注中奖期望值与期望效用的计算:
用
表10
j | k | l | 期望效用 | 中奖期望值 |
1 | 8 | 2 | -247、33 | 32、671 |
1 | 8 | 3 | -370、99 | 49、007 |
1 | 8 | 4 | -494、65 | 65、342 |
1 | 8 | 5 | -618、31 | 81、678 |
由表格与图可知,中奖组合大致分布在三个区域,所以对于有不同购买能力的彩民在购买彩票时,都能够在图中找到适合自己的投注组合。
5、4问题四的解答
通常我们的投注方式有三种,分布就是单式投注、复式投注与胆拖投注。根据以上问题的分析,一般来说,采用复式加倍投注的中奖几率要高得多,因为复式投注拓宽了中奖面,具有大网捕鱼的效果,而且一旦中奖,便就是大奖小奖一大串,中出的金额十分可观。根据我们统计表格分析,前区号码的选择一般控制在10个以内,采用小金额在两百元以下的投注,非常适合对自己选号非常自信的彩民。胆拖投注一般可以准确定位,同时资金投入量相对较少,可以合理的利用热号、冷号作为胆拖进行多样组合,可以尝试前区3胆4拖、后区1胆7拖,金额控制在百元以内,命中率较高。
另外可以提供几种中奖概率的小技巧,号码重组法:通过连号分析,历次中奖号码中,总有一期1-2各号出现在下期的中奖好中,根据这一点,从前一期中选出1-2号,结合连号因素、冷热搭配、大中小号均匀搭配,会有比较好的收获。胆拖投注法:通常在选号中,瞧中一些心仪的号码,又选出了自己认为下期可能出现的号码,但一注只有7个号,余下号码又不舍得放弃,这就是就可以采用胆拖法。相邻数字选择法:通过开奖会发现同一期中,总会有一组相邻号,所以在购买时可以充分考虑这一点。
六 模型优缺点与建议
在问题一与问题二的解答中,要求思路明了,按部就班的就不难求解,在问题三的模型中,将单式投注、复式投注与胆拖投注分开考虑可能有些欠妥,但就是有效的避免了问题的复杂性,使可操作性增强,最后通过比较来得到最优的购买策略。本模型的优点如下:
(1)算法思想简单,易于理解。
(2)问题分析透彻,可操作性强。
(3)对投入资金不同的购买者,提供最优的投注策略。
缺点:
(1)由于本次竞赛正处放假期间,参赛队员归家心切,在一些问题上的处理可能有些操之过急。
(2)个别模型处理不够完善。
几点建议:
(1)对于彩票购买者来说,应该适当做一些准备工作,对彩票投注的选号或组号技巧要有所了解,且在投注时要运用多种技巧综合考虑决定,例如单张复式投注时既要考虑号码个数的区段,又要考虑号码的奇偶比,还可考虑经常出现的号码。
(2)最后还需要强调一点,彩民购买彩票一定要量力而行,广大彩民应抱着为了支持我国的福利事业与体育事业的心态去购买彩票。
七 参考文献
[1]韩中庚,数学建模竞赛——获奖论文精选与点评,北京:科学出版社,2007、5;
[2]戴明强 李卫军 杨鹏飞,数学建模及其应用,北京:科学出版社,2007,169-186;
[3]李贤平. 概率论基础[M]. 北京: 高等教育出版社,2002: 101 - 102.
[4]Louis Comtet. 高等组合学[M]. 大连: 大连理工出版社,1991: 66 - 67.
[5]于晶贤. 乐透型彩票中奖号码的概率分析[J]. 决策参考,2008,255( 3) : 60 - 62.
附录
附录1:
A;%奇偶性分析A为前区号码
for t=1:954
num=0;
for i=1:5;
if(mod(A(t,i),2)==1)
num=num+1;
end
end
jishu(t)=num;
end
x=zeros(5,1);
t=find(jishu==0);
x(1)=length(t);
t=find(jishu==1);
x(2)=length(t);
t=find(jishu==2);
x(3)=length(t);
t=find(jishu==3);
x(4)=length(t);
t=find(jishu==4);
x(5)=length(t);
t=find(jishu==5);
x(6)=length(t);
xlv=x、/sum(x);
%后区奇偶 B为后区号码;
for t=1:954
num=0;
for i=1:2;
if(mod(B(t,i),2)==1)
num=num+1;
end
end
jishu1(t)=num;
end
y=zeros(3,1);
t=find(jishu1==0);
y(1)=length(t);
t=find(jishu1==1);
y(2)=length(t);
t=find(jishu1==2);
y(3)=length(t);
ylv=y、/sum(x);
附录2:
%A; 前区二连号、三连号
erlianhao=zeros(954,1);
sanlianhao=zeros(954,1);
for t=1:954
num=0;
for i=1:4;
if(A(t,i+1)-A(t,i)==1)
num=1;
end
end
erlianhao(t)=num;
end
erlianhaolv=sum(erlianhao)/954;
for t=1:954
num=0;
for i=1:3;
if(A(t,i+1)-A(t,i)==1&&A(t,i+2)-A(t,i)==2)
num=1;
end
end
sanlianhao(t)=num;
end
sanlianhaolv=sum(sanlianhao)/954;
附录3
%前区极差
kuadu=zeros(34,1);
for k=1:34
for i=1:954
if(A(i,5)-A(i,1)==k)
kuadu(k)=kuadu(k)+1;
end
end
end
kuadulv=kuadu、/954;
本文来源:https://www.2haoxitong.net/k/doc/c6bad41bfbb069dc5022aaea998fcc22bdd143e4.html
文档为doc格式