深圳杯数模比赛A题最新答案

发布时间:2020-06-02 00:02:12   来源:文档文库   
字号:

深圳人口与医疗需求预测

摘要

问题一中,由于深圳市不同于常规一线城市,从结构来看,深圳人口的显著特点是 流动人口远远超过户籍人口,影响人口数量增长的因素较多,人口年龄结构变化大,常 用人口预测模型误差较大,本文通过 Mathematica 二次曲线拟合预测产生未来十年产业 从业人员比例,并建立多元线性回归拟合模型来预测深圳市非常住人口数量,其次用

Markov 链预测未来人口年龄结构比例,利用 Matlab 程序预测未来具有就医需求的总人

口数并得出深圳市床位需求,以及各区床位需求。 问题二中,选取两种疾病,利用灰色 GM (1,1) 模型预测小儿肺炎和老年性白内障未 来十年的入院率,利用 Excel 处理得出对各类医疗机构床位需求权重,得到未来十年的 小儿肺炎的床位需求和老年性白内障对各类医疗机构的床位需求。

关键词: 关键词:二次曲线拟合预测

Markov 链

多元线性回归

灰色 GM (1,1) 预测模型

-1-

一 、问题重述

深圳市我国人口增长最快的地方,从1980年到2010年,深圳每年都以30多万的人口 增幅增长,到2010年深圳市总人口已达到1037万人。从结构来看,深圳人口的显著特点 是流动人口远远超过户籍人口, 且年轻人口占绝对优势。 深圳流动人口主要是从事第二、 三产业的企业一线工人和商业服务业人员。年轻人身体强壮,发病较少,因此深圳目前 人均医疗设施虽然低于全国类似城市平均水平, 但仍能满足现有人口的就医需求。 然而, 随着时间推移和政策的调整,深圳老年人口比例会逐渐增加,产业结构的变化也会影响 外来务工人员的数量。这些都可能导致深圳市未来的医疗需求与现在有较大的差异。就 深圳市的相关情况,建立数学模型分析研究下面的问题: 问题一: 分析深圳近十年常住人口、非常住人口变化特征,预测未来十年深圳市人口数量和 结构的发展趋势,以此为基础预测未来全市和各区医疗床位需求。 问题二: 根据深圳市人口的年龄结构和患病情况及所收集的数据,选择预测几种病(如:肺 癌及其他恶性肿瘤、心肌梗塞、脑血管病、高血压、糖尿病、小儿肺炎、分娩等)在不 同类型的医疗机构就医的床位需求。

二、问题分析

问题一: 近十年常住人口、非常住人口(由给出的数据得知,常住人口包括户籍人口和流动 人口中非户籍人口(居住时间在6个月以上),非常住人口是流动人口中居住时间在六 个月之内)与城市的经济产业发展高度相关。产业结构影响非常住人口数量,非常住人 口数量影响常住人口数量,具有就医需求的人口数量等于常住人口与非常住人口之和。 问题二中,由问题一得出的数据,针对人群对各类医疗机构的选择计算出需求权重,得 出不同类型的医疗机构就医的床位需求。 问题二: 每一种疾病都会有一个高发人群年龄段,例如,老年性白内障,心脏病、高血压等 疾病多发生在老年人中,而小儿肺炎发生在少年儿童中,因此该年龄段人口的比例严重 影响着该种疾病入院率。因此需要预测先预测出来深圳市未来十年的入院率,其次在根 据问题一得出的人口结构数量计算出每年的入院人数,再根据床位数=该病入院人数

× 平均住院日 得出该种病的床位需求。 一年的总天数(365天 )

三、模型假设

1、假设深圳市各区人口体质保持不变,并且在同一年度各区入院率相同。 2、假设每种病每年平均住院日保持不变。 3、假设所预测出来的医院床位每天没有空闲的时候。 4、假设各区相对封闭,本区人口不会跨区就医。

-2-

5、假设儿童0—14岁人群、青年人 中年人15——64岁人群及老年人(65岁以上)人 群同一年的入院率相同。

四、模型建立和求解 模型建立和求解

模型 I 的建立和求解

首先先利用多元线性拟合模型预测出近十年年末非常住人口数 由 2000—2010 年深圳市第一产业从业人员比率、第二产业从业人员比率、第三产 业从业人员比率 3 个影响因子的数据。如表 1: 表 1: 以从业人员为 100 年份 2007 2008 2009 2010 表 2: 年份 年末非常住人口数 y1  (万人)    2007 2008 2009 2010 第一产业 (%)     第二产业 (%)     第三产业 (%)    

以上 3 个因素为自变量,以深圳市年末非常住人口数 y1 作为因变量,建立一个多元 线性回归模型。 由表 2 得到因变量 y1 的数组:

y1 = [    ]

由表 1 得到自变量 x1 , x 2 , x3 的 3 个数组:

x1 = [    0] x 2 = [    ]

x3 = [    ]

-3-

 将 y1 矩阵进行转置得到 y1 =   增添一组常数项 x0 = [0 0 0 0] 将 x = [ x0 x1 x 2 x3 ] 转置得到     ∧ 0 0 0 0 x= × 10 4         由模型,用矩阵微分法得到 X ' X β = X ' Y ,则 β = ( X ' X ) 1 X ' Y 所以通过 MatLab 进行矩阵运算得到  ∧  β1 =   即得到多元拟合线性方程

y1 =  +  x1  x 2 +  x3

根据近十一年的数值(见表 3),通过 Mathematica 作二次曲线数据拟合预测图(图示 1) ,得到 x1 , x 2 , x3 ,3 个变量在 2011 年—2020 年的预测值(见表 4) 。 表 3: 以从业人员为 100

年份 2000 2001 2002 2003 2004 2005 2006

第一产业      

(%)

第二产业 57   57  

(%)

第三产业 (%)      

-4-

2007 2008 2009 2010

 

 

 

由 Mathematica 作二次曲线数据拟合得出 3 个二次函数如下:

f ( x1 ) =  x 2  x +  ,第一产业从业人员比率函数,其中相关系数

r 2 =  ,拟合效果较好。 f ( x2 ) =  x 2 +  x +  ,第二产业从业人员比率函数,其中相关系数 r 2 =  ,拟合效果较好。 f ( x3 ) =  x 2  +  ,第三产业从业人员比率函数,其中相关系数 r 2 =

图示 1:

经过 Mathematica 运算,得到表 4 表 4: 年份 第一产业 (%) 以从业人员为 100 第二产业 (%)

-5-

第三产业

(%)

2011 2012 2013 2014 2015 2016 2017 2018 2019 2020

0 0 0 0 0 0 0 0 0 0

       

       

把所预测出的 x1 , x 2 , x3 3 个变量代入得到的多元拟合线性方程的得到表 5

表 5: 年份 年末非常住人口 (万人) 年份 年末非常住人口 (万人) 2011 2012 2013 2014 2015

2016

2017

2018

2019

2020

其次利用多元线性拟合模型预测出近十年年末常住人口数 由 2000—20010 年深圳市第一产业从业人员比率、第二产业从业人员比率、第三产 业从业人员比率、非常住人口数 4 个影响因子的数据。如表 6. 表 6: 以从业人员为 100 年份 第一产业(%) 第二产业(%) 第三产业(%)             0   非常住人口数(万人)

2006 2007 2008 2009 2010

   

表 7: 年份 2006 2007 2008 2009 2010

-6-

年末常住人口数 (万人)

以上 4 个因素为自变量, 以深圳市年末非常住人口数 y 2 作为因变量, 建立一个多元 线性回归模型。 由表 2 得到因变量 y 2 的数组:

y 2 = [    ]

由表 1 得到自变量 x1 , x 2 , x3 , x 4 的 3 个数组:

x1 = [     0] x 2 = [     ]

x3 = [     ]

x 4 = [    

 将 y 矩阵进行转置得到 y 2 =    

增添一组常数项 x0 = [0 0 0 0 0] 将x =

]

[

x0 x1 x 2 x3 x 4

] 转置得到

0     0     0 ∧  × 10 4  

0 x =    

0  

由模型,用矩阵微分法得到 X ' X β = X ' Y ,则 β = ( X ' X ) 1 X ' Y

所以通过 MatLab 进行矩阵运算得到

 ∧ β 2 =    

-7-

即得到多元拟合线性方程 y 2 =  +  x1  x 2 +  x3 +  x 4 把已经预测来的从 2011 年—2020 年第一产业比率、 第二产业比率、 第三产业比率、 非常住人口数数值带入 y 2 中得到常住人口 2011 年—2020 年的预测人数(见表 8) 。 表 8: 年份 年末常住人口 (万人) 年份 年末常住人口 (万人) 2011  2016  2012  2017  2013  2018  2014  2019  2015  2020

经过以上预测已经得出常住人口和非常住人口从 2011 年—2020 年得人口数根据公 式:有就医需求人数=常住人口数+非常住人口数 可以预测出从 2011 年—2020 年的实 有人口数,见表 9. 表 9: 第一产 第二产 第三产 年末非常住人 业 (%) 业 (%) 业 (%) 口数 (万人) 0 0 0 0 0 0 0 0 0 0  50          50                   年末常住人口 数(万人)           有就医需求人 数(万人)          

年份

2011 2012 2013 2014 2015 2016 2017 2018 2019 2020

模型 II 的建模和求解

利用 Markov 链预测深圳市从 2011 年—2020 年的人口结构,首先把年龄在 0—14 岁划分为儿童,15—54 岁划分为中年人,65 岁以上划分为老年人,根据 2000 年、2005 年、 2010 年三个年龄段的人口数如表十预测出以后十年的三个年龄段所占总人口的比例 表 10: 年份 0-14 岁 15-64 岁 65 岁以上 总人口 2000 595329 6327567

-8-

85935

7008831

2005 2010 表 11: 年份 2000 2005 2010

752518 1023345

7393533 9150558

131414 183851

8277465

0-14 岁 % % %

15-64 岁 % % %

65 岁以上 % % %

由上面的数据可以计算一步转移概率矩阵,设每年 0-14、15-64、65 以上人口所占 比例分别为 1、2、3 每相邻年饭为一步 2000 年、2005 年、2010 年状态转移概率为:

p11 = 1

p 23 =

p12 = 0

p13 = 0

p 21 =

6 903

p 22 =

893 903

4 p31 = 0 p32 = 0 903 所以 2000 年—2005 年的状态转移概率矩阵为:

p33 = 1

p1 =

1 6 903 0

0 893 903 0

0 4 903 1

同理可得出 2005 年—2010 年的状态转移概率矩阵为: p2 = 1 8 893 0 0 884 893 0 0 2 893 1

为了消除样本的随机性影响,更加客观描述状态规律,在此取 p1 、 p 2 的平均作为 转移概率: p

1 ( p1 + p 2 ) ÷ 2 =  0

0  0

0 0 1

根据以上得到的转移概率矩阵预测出深圳市未来十年的人口年龄结构,一步状态转 移矩阵会随着国民经济的发展发生很多变化, 在此假设只要不发生重大事件 (如: 战争、 自然灾害等),这一状态在今后十年基本保持不变,以 2000 年、2005 年、2010 年三年

-9-

各年龄阶段所占比例的平均值作为初始状态,即: λ0 =    ,按目前转 移状态概率基本不变,则可以利用公式: λ n = λ0 p n 可以预测今后十年深圳市的人口年龄结构(以下计算均在  软件下完成)。 2011 年人口年龄结构预测:当 n = 1 时

1 1 λ1 = λ0 p =     0 0  0 0 0 1

1

=

88  表示深圳市在 2011 年,%人口年龄在 0-14 岁之间,88%人口年

龄在 15-64 岁之间,%人口年龄在 65 岁以上,同理,当 n = 1 ~ 10 之间时,可预测出 其余九年的人口年龄结构,如表 12.

表 12: 年份 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 0-14 岁(%)           15-64 岁(%)           65 岁以上(%)          

根据模型 I 求出的有就医需求的人数和表十二的结果就可计算出从 2011 年—2020 年每年不同年龄段的人口数,如表 13. 表 13: 年份 2011 2012 2013 2014 2015 0-14 岁 (万人)      15-64 岁 (万人)      65 岁以上 (万人)      有就医需求人 数(万人)    

- 10 -

2016 2017 2018 2019 2020

   

   

   

   

模型 III 预测深圳市床位需求

深圳市床位的需求来自住院人数的多少。而影响住院人数的因素包括有就医需求总 人数,人口年龄结构等。 表 14: 年份 2006 2007 2008 2009 2010 住院人数 (万 人)      0-14 岁 (万人)      15-64 岁 (万人)      65 岁以上 (万人)      有就医需求 人数(万人)    

为此,我们根据表 14 的数据,设 y = a + bx1 + cx2 + dx3 ,其中 y 为住院人数, a 为常 数项, b, c, d 为相关参数, x1 为 0-14 岁的人口数量, x2 为 15-64 岁人口数量, x3 为 65 岁以上人口数量,运用 Matlab 程序如下: y = [    ]' ; x = [    ]' ; 1 x = [    ]' ; 2 x = [    ]' ; 3 [b, b int, r , r int, stats ] = regress ( y, [ones ( size( y )), x , x , x ]) 1 2 3 解得:

a = , b = , c = , d =

所以,原方程为:

y =  +  x1  x2 +  x3

将表 13 所预测的数据代入方程式,可得出未来十年的住院人数,如表 15。

- 11 -

表 15 年份 住院人数 (万人) 年份 住院人数 (万人) 2011  2016  2012  2017  2013  2018  2014  2019  2015  2020

床位需求=住院人数×年平均住院日/365 其中,年平均住院日为近几年的年平均住院的平均数,如表 15。 表 16 年份 年平均 住院日 2006  2007  2008  2009  2010 8 平均值

结合上方数据和公式,可得出未来十年深圳市床位需求,如表 17 表 17 年份 床位需求 年份 床位需求 2011 18152 2016 28879 2012 19064 2017 33119 2013 20917 2018 35608 2014 23215 2019 38491 2015 25440 2020 40763

深圳市各区人口如表 18: 表 18: 地区 深圳市 罗湖区 福田区 南山区 宝安区 龙岗区 盐田区 光明新区 坪山新区 各区床位需求:

人口数  923470 1317620 1088008 4017805 2011224 208878 481505 309244

所占深圳市比例        

q( n ) = k( n ) × Q( n ) ,其中 q(n ) 为各区床位需求, k(n ) 为各区人口所占深圳市比例, Q 为

深圳市床位需求, n 表示年份。

- 12 -

经计算得如下表 19。 表 19: 年份 深圳 市 罗湖 区 福田 区 南山 区 宝安 区 龙岗 区 盐田 区 光明 新区 坪山 新区 2011 18152 1618 2309 1907 7041 3525 366 844 542 2012 19064 1700 2425 2003 7395 3702 384 886 569 2013 20917 1865 2661 2197 8114 4062 422 972 625 2014 23215 2070 2953 2439 9005 4508 468 1079 693 2015 25440 2268 3236 2672 9868 4940 513 1183 760 2016 28879 2575 3674 3034 11202 5608 582 1343 862 2017 33119 2953 4213 3479 12847 6431 668 1540 989 2018 35608 3175 4530 3740 13812 6914 718 1655 1063 2019 38491 3432 4896 4043 14931 7474 776 1789 1149 2020 40763 3634 5186 4282 15812 7915 822 1895 1217

模型 IV 的建立和求解

预测深圳市某一种疾病在不同类型医疗机构的床位需求就要预测该种疾病总的床 位需求,而决定床位需求的就是该种疾病的患病入院人口,也就是深圳市该种疾病的入 院率。而入院率又和人口结构有着密切的关系,因为每一种疾病都会有一个高发人群年 龄段,例如,老年性白内障,心脏病、高血压等疾病多发生在老年人中,而小儿肺炎发 生在少年儿童中,因此该年龄段人口的比例严重影响着该种疾病入院率。因此,通过分 析深圳市历年该种疾病入院率与人口结构的关系,预测出深圳市该种疾病未来十年的入 院人数, 首先要预测出该种疾病未来近十年的入院率, 进而求出该种疾病的总床位需求。 本文为了简单说明问题,选取了小儿肺炎和老年性白内障两种病分析。

GM (1,1) 预测模型

首先利用 GM (1,1) 模型预测小儿肺炎未来十年的入院率,主要根据深圳市在2005 年—2010年入院率具体数字见下表20。

- 13 -

表20: 年份 2005 2006 2007 2008 2009 2010 建立入院率时间序列: =       ) (1)对修正后的数据 x (0) (k ) 做一次性累加,得到:

( x 1) = {     } ( x 0) = x ( 0 ) (1), x ( 0) (2 ), , x ( 0) (6 )

入院率 (%)      

(

)

(2)构造数据矩阵B及数据向量Y:

1 (1) (1) x (1) + x (2 ) 2 1 (1) (1) 2 x (2 ) + x (3) B= M 1 x (1) (5) + x (1) (6 ) 2

( ( (

) ) )

1 1 M 1

x ( 0 ) (2 ) x ( 0 ) (3) Y = M x ( 0 ) (6 )

带入相关数据得到: 1  1  B =  1 1   1

^

 Y =    

(3)计算 u .

^ 0 .0 6 2 3 u = ( a , b )T = ( B T B ) 1 B T Y = 2 9 .9 3 8

于是得到:a=,b=. (4)建立模型

dx(1) +  (1) =  dt

求解得到:

- 14 -

b b ( ( x 1) k +1) = x(0) (1) eak + =  + 4805457 . . a a

(5)求生成数列值 x

^ (1)

(k + 1) 以及模型还原值 x (k + 1)

^ (1)

^ (0)

令k=1,2,2,3,4,5,6,7,8,9,10由上面的时间响应函数可算得 x ,取其中:

( ( ( x 1)(1) = x 0)(1) = x 0)(1) =  ∧ ∧

由 x ( 0 ) ( k ) = x (1) ( k ) x (1) ( k 1), k = 2, 3, L , 9 ,得 x

∧ (0)

^

^

^

(k ) = {

       }

得出如下表21. 表21: 年份 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 根据表15可得到入院人数,得出表22。 表22: 年份 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 0-14 岁(万人)          

- 15 -

入院率 (%)          

入院率

       

(%)

入院人数 (万人)          

床位数的求法:床位数=小儿肺炎的入院人数 ×

平均住院日 一年的总天数(365天 )

小儿肺炎的平均住院日为天,经过计算可得到表23。 表23: 年份 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 入院率 (%)           入院人数 (万人)           平均住院日 (天)           床位数 775 804 894 989 1075 1094 1257 1331 1384 1445

通过权衡医院规模(主要以深圳市医院数量为准)、床位数、卫生技术人员、执业 医师、执业助理医师、注册护士、管理人员、工勤技能 人员等因素,求出了对综合医 院、专科医院以及街道医院三种医院床位需求权重,如表24。 表24: 医 院 综合医院 专科医院 其他医院 指 标 医院规模 床位数 卫生技术人员 执业医师 执业助理医师 注册护士 管理人员 工勤技能 人员 平均值 54% 55% 54% 50% 58% 57% 56% 55% 55% 42% 40% 43% 46% 40% 41% 43% 42% 42% 4% 5% 3% 4% 2% 2% 1% 3% 3%

综合医院为55%,专科医院为42%,其他医院为3% ,可以得到针对该种病所需要 的床位数,如表25。 : 表25: 年份 综合医院 专科医院 其他医院 2011    2012    2013  

- 16 -

2014 2015 2016 2017 2018 2019 2020

     

     

     

模型的建立和求解

首先利用 GM (1,1) 模型预测老年性白内障未来十年的入院率,主要根据深圳市在 2005年—2010年入院率具体数字见下表26。 : 表26: 年份 2005 2006 2007 2008 2009 2010 建立入院率时间序列:

( x 0) = x ( 0 ) (1), x ( 0) (2 ), , x ( 0) (6 ) =       )

入院率 (%)      

(

)

(1)对修正后的数据 x (0) (k ) 做一次性累加,得到:

( x 1) = {     }

(2)构造数据矩阵B及数据向量Y:

1 (1) (1) x (1) + x (2 ) 2 1 (1) x (2 ) + x (1) (3) B= 2 M 1 x (1) (5) + x (1) (6 ) 2

( ( (

) ) )

1 1 M 1

x ( 0 ) (2 ) x ( 0 ) (3) Y = M x ( 0 ) (6 )

带入相关数据得到:

- 17 -

 B =    

^

1 1 1 1 1

 Y =    

(3)计算 u .  T u = (a, b ) = ( B T B) 1 B T Y =  于是得到:a=,b=. (4)建立模型 dx +  x =  dt 求解得到:

b b ( ( x 1) k +1) = x(0) (1) eak + = 346381  k + 349031 . . a a

(0) (1) (5)求生成数列值 x ( k + 1) 以及模型还原值 x ( k + 1)

^ (1) 令k=1,2,2,3,4,5,6,7,8,9,10由上面的时间响应函数可算得 x ,取其中:

^

^

x

^ ^ ^

∧ (1)

(1) = x (1) = x(0)(1) =

∧ (0)

由 x ( 0 ) ( k ) = x (1) ( k ) x (1) ( k 1), k = 2, 3, L , 9 ,得

( x 0)(k ) = {         }

表27: 年份 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 入院率 (%)          

- 18 -

根据表13可得到入院人数表28。 表28: 年份 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 0-14 岁(万人)           入院率           (%) 入院人数 (万人)          

床位数的求法:床位数=老年性白内障的入院人数 ×

平均住院日 一年的总天数(365天 )

老年性白内障的平均住院日为天,经过计算可得到表29。 表29: 入院人数 平均住院日 年份 入院率 (%) (万人) (天) 2011    2012    2013    2014    2015    2016    2017    2018    2019    2020  

病床数 47 50 54 58 67 78 88 96 106 113

在上面已经求出综合医院为55%,专科医院为42%,其他医院为3% ,可以得到针 对该种病所需要的床位数表30。 表30: 年份 综合医院 专科医院 其他医院 2011    2012    2013    2014    2015  

- 19 -

2016 2017 2018 2019 2020

   

   

   

五、模型的改良与建议

本文主要利用了二次曲线拟合预测, Markov 链,多元线性回归,灰色 GM (1,1) 预测 模型等模型预测了深圳市人口增长量以及床位需求问题,主要利用了 Mathematica 、

Matlab 以及 Excel 等简单的数据处理软件。

二次曲线拟合预测,是根据往年数据所进行拟合的函数,相对来说,考虑的影响因 素不足,在多元线性回归模型中,在考虑的影响参数较少的情况下,我们引进了 Markov 链作为人口结构转移比例的预测模型,利用灰色 GM (1,1) 预测模型考虑多种变量进行床 位需求预测,成为一种组合型预测模型。 当然, 在数据的收集上, 以及资料的整理略有不足, 使得原模型的数据会产生偏差。 为此本文的模型也经过多次的调试,使得模型更加简洁。

- 20 -

参考文献

[1]深圳市卫生与人口计划生育委员会 &id=1&oid=menunews&ntyp=A10B032 [2]深圳市统计年鉴2011  [3]陈述 电子科技大学出版社 《Mathematica 基本教程》

- 21 -

本文来源:https://www.2haoxitong.net/k/doc/61072bd6bfd5b9f3f90f76c66137ee06eff94ea2.html

《深圳杯数模比赛A题最新答案.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式