摘要
深圳作为中国经济发展的重点城市,人口与医疗问题已经成为我们的焦点话题,是一个复杂的系统工程。本文针对深圳地区人口年龄分布情况,外来务工人员的数量,从实际出发,在基于一些合理简化假设的基础上,建立数学模型,并充分利用matlab等软件简化计算,对相关问题进行了有针对性的求解。
在预测未来十年深圳常住人口时,我们运用了matlab一元线性回归对近十年的数据进行了多次拟合,并对这些拟合进行了比较得出深圳常住人口模型公式为:
关键词:matlab、一元线性回归、Leslie、最小二乘法、床位需求
一、问题重述
从深圳的人口的结构来看,显着的特点是流动人口远远超过户籍人口,且年轻人口占主绝对优势。流动人口主要从事第二、三产业的企业一线工人等。年轻人身体好,发病少 ,导致深圳目前人均医疗设施低于全国类似城市平均水平,但仍能满足现有人口的就医需求。然而,政策的调整与世界的推移会使深圳市老年人增加。产业结构的变化也会影流动人口的数量。直接会导致深圳市未来的医疗需求的变化。
现有人口社会发展模型在面对深圳情况时,难以满足人口和医疗预测的要求。为了解决此问题,请根据深圳人口发展变化态势以及全社会医疗卫生资源投入情况(医疗设施、医护人员结构等方面)收集数据、建立针对深圳具体情况的数学模型,预测深圳未来的人口增长和医疗需求,解决下面几个问题:
1.分析深圳近十年常住人口、非常住人口变化特征,预测未来十年深圳市人口数量和结构的发展趋势,以此为基础预测未来全市和各区医疗床位需求;
2.根据深圳市人口的年龄结构和患病情况及所收集的数据,对几种病进行预测,在不同类型的医疗机构就医的床位需求。
二、问题分析
深圳作为我国的经济重镇,深圳经济迅猛发展,带动人口发生了极大变化,大量的人才需求使深圳外来人口大量增加。劳动力的需求使年轻人占据的深圳的主要地位。年轻人身体健壮,发病较少,弥补了深圳医疗稍差的缺陷。然而,由于政府的各项政策(如计划生育等)使得人口结构发生了变化,深圳市统计局12日公布了全市第六次全国人口普查主要数据,显示深圳特区在2000年至2010年的10年中人口增长率近“50%”,人口密度大幅提高。
政府部门需要更详细的人口数量与人口结构的发展趋势,以此为基础来满足深圳市各区几种病的床位需求。近些年来,对人口结构的分析预测仅限于粗线条分析,只能预测年龄与性别的大致分布范围。随着人们对健康要求的提高,床位的需求逐渐受到重视,这就是人口与医疗需求的预测。
2.2 问题的分析
题目中所给的两个问题都属于预测的数学问题。其中问题一需要通过对深圳人口数量极其人口结构进行预测,以此为基础预测未来全市和各区医疗床位需求。为了解决此问题,我们首先要对近十年的常住人口与非常住人口进行分析,其次再对人口数量和结构进行分析,通过对这些已知数据的分析和统计,在预测未来十年深圳常住人口时,我们运用了matlab对近十年的数据进行了多次拟合,并对这些拟合进行了比较得出深圳常住人口模型公式为:
对于问题二,要求预测不同类型的医疗机构就医的床位需求,根据问题一中得到的全市人口年龄结构和患病情况,对高血压,癌症,脑出血三种病症在不同类型的医疗机构就医床位需求.按照规模大小划分深圳市的医院类别,再通过各等级医院的床位需求与某种病的患病人数和同一等级医院的数量,可治疗这种病的医院总个数的关系得出不同医疗机构就医床位需求。
三、模型假设
1、假设题目所给的数据真实可靠。
2、假设在深圳政府政策的稳定前提下,生育和死亡率都比较稳定。
3、不考虑战争,瘟疫,大规模流行病对人口的影响。
4、假设深圳市人口为年末常住人口。
5、假设同一年龄段的人死亡率相同,同一年龄段的育龄女性生育率相同。
6、假设当地人们的生育观念不发生太大变化。
7、假设人们生病时都能支付起医疗费。
8、假设各区域的患病者不相互交换,即各区域是相互独立的。
四、定义符号与说明
见文中标注
五、模型的建立与求解
一、问题一的分析
(一)深圳市常住人口的预测
(1)利用现有数据(表一)分析深圳从1979年到2010年的年末常住人口数变化规律。运用Excel软件画出深圳1979年到2010年的人口数量折线图(图一):
表1:1979—2010年年末常住人口数
图1:1979—2010年年末常住人口数
(2)通过现有的数据及其折线图,可以很明显地观察出深圳常住人口数从1980到1992的人口处于缓慢增长,呈线性增长。但随着深圳高速的发展,优质的社会公共资源对流动人口形成了强大的吸引力,因此外来人口的迁入增多导致从1994年到2010年深圳年末常住人口数的增长率相对以前增大,但也基本保持一次函数的增长。
(3)模型的建立
我们通过运用matlab软件对这一组数据进行多次拟合,其根本思想就是:观测散点走势来确定拟合函数,利用散点但又不拘泥于散点。他的整体思路与我们的数据分析非常相似。并对这些拟合进行了比较得出深圳常住人口模型公式为:
图2:常住人口的拟合结果图
(二)流动人口的预测
从深圳的人口的结构来看,显着的特点是流动人口远远超过户籍人口,因此对深圳流动人口的预测对整个深圳及各区医疗床位需求的预测中起到至关重要的作用。
(1)流动人口定义
流动人口是相对于某地的常住人口而言的, 指离开常住户籍所在地, 跨越一定的行政辖区范围, 在某一地区滞留的人口。其包括:
1、 进入城镇务工、经商、和从事劳动服务的暂住人口;
2、为探亲访友、旅游、求学、治病等而外出的人员;
3、 无职业、无收入、无暂住证的三无人员即盲流人口。
为此我们可得:
其中:
(2)求解进入城镇务工、经商、和从事劳动服务的暂住人口:
显然对于
其中:
对于一个非平稳序列来说,其数字特征,如均值,方差和协方差等是随着时间的变化而变化的。也就是说,非平稳序列在各个时间点上的随机规律是不同的,难以通过序列已知的信息去掌握序列整体上的随机性。而GDP时间序列都是非平稳的,为此我们采用ARIMA模型求解:ARIMA模型使用包括自回归项(AR 项) , 单整项和MA移动平均项三种形式对扰动项进行建模分析, 使模型同时综合考虑了预测变量的过去值, 当前值和误差值, 从而有效地提高了模型的预测精度 。
(1)ARIMA模型的形式:
考虑序列
经
(2)建立ARIMA 模型的一般方法:
1) 检验原序列的平稳性?? 检验的标准方法是单位根检验, 若序列不满足平稳性条件, 则可通过数学方法, 如差分变换或者对数差分变换使其满足平稳性条件;
2) 通过计算能够描述序列特征的一些统计量, 如自相关(ACP)系数和偏自相关(PACP)系数来确定ARIMA
3)估计模型的未知参数[2], 并通过参数的?? 统计量检验其显着性, 以及模型的合理性;
4) 进行诊断分析, 检验模型的拟合值和实际值的残差序列是否为一个白噪声序列。
(3)数据的来源与描述:
从《深圳统计年鉴》各卷统计出1979 至2006 年深圳国内生产总值, 见表5:
并按此数据作图1从中可以粗略地看出
表2:1979 ——2006年深圳国内生产总值统计表(亿元)
图3 图4
(4)序列的平稳性处理:
对
表3:序列A D F 检验结果
由表7可知其不平稳。
为了消除原始数据序列的不平稳性, 使数据更为平稳, 本文采用对深圳国内生产总值序列取对数形式, 记为
对
表4:序列ADF检验结果
由表7可知其平稳,说明GDP序列为2 阶单整序列, 即
模型的识别与建立
由以上对序列
模型中的
由图7和图8可看出, 少In Xt 序列的自相关图与偏自相关图都是拖尾的, 因此可建立:
图5 图6
ARIMA 模型。经反复计算比较, 最终取
即:
由模型(1 ) , 对其进行回归拟合, 模型中的残差序列(Residual) 以及过
从图9可以看出, 模型的拟合值和实际值的变动具有较好的一致性。其次, 模型的残差值较小,消除了线性或者指数趋势, 表现得较为平稳, 说明模型通过了适应性检验, 所以该模型还是比较理想的。为了进一步检验该模型的效果, 记
图8: 自相关(ACP)图 图9:偏自相关(PACP)图
(5)模型的预测:
由
又因为:
可得
因此得序列
用
表5:实际值与ARIMA模型预测值比较衰(亿元)
为此,我们可以求出
由
通过1979年初始可知
通过上面数据求出
由此可得:
则:
可得下表:
表6:
3)求解为探亲访友、旅游、求学、治病等而外出的人员:
对于
其中:
求解
可得:
表7:访友人数表
求解,根据现有的资料,我们查的深圳市南山区2008年统计年签旅行情况可得:如下表:
表8:09年6月旅游者接待情况统计
为此,根据上表我们求解出该区每天平均每天接待人数和同比增长率如下表所示:
表9:每天平均每天接待人数和同比增长率
由上表可知深圳近几年来旅游增长幅度不大,而且旅游是深圳非常住人口的一小部分,为了减少计算难度,我们忽略的这种增长。对于深圳共有7个区,为了简化计算,我们假设旅客到每一区去旅行都是随机的,去每区每年平均每天接待人数为3.425万可得:
根据资料可得:目前深圳有35万左右的义务教育阶段非户籍学生。这数字占了深圳义务阶段学生的一半。同理可以求得:
对于外来求医人数,深圳市公有医院服务水平有很大关系,我们假设与公有医院的等级成正比,与公有医院的总数成正比关系,因此我们可得:
其中:
但是根据题意:此深圳目前人均医疗设施虽然低于全国类似城市平均水平,但仍能满足现有人口的就医需求。可知,对于深圳医疗水平,相对于其它如上海、广州等一些大城市相比,医疗水平很弱,因此为了简化模型,我们将
3)求解三无人口数目
三无人口定义:无职业、无收入、无暂住证的三无人员即盲流人口。由此我们可以得到该三无人口出现的概率非常小,几乎可以忽略不计,为此我们也将他归为其它人口内。
综上所述:
综上所述求解
表10:非常住人口表
(三)深圳市未来十年人口结构的预测
根据2010 年深圳人口总数是1037.2万,按照每五岁为一个年龄组,把0~99 岁划分成20 个年龄组,即0~4 岁为第1 个年龄组,5~9 岁为第2 个年龄组,10~14 岁为第3 个年龄组, ?,95~99 岁组第20 个年龄组,100 岁以上为第21 个年龄组,并设各年龄组人口构成的初始人口列向量为X(0) = [ x1 (0) ,x2 (0) ,x3 (0) ,?,x21 (0) ] T ; 第5t 年各年龄组人口构成的人口列向量为X(t) = [ x1 (t) ,x2 (t) ,x3 (t) , ?,x21 (t) ] T ,称X(t) 为人口状态向量。如果设所有年龄组女性人口占同一组总人口比例的系数向量为C = [c1 ,c2 ,c3 , ?,c21 ] T ,那么在5t 年时,女性人口的列向量应为C·X( t ) = [ c1x1 ( t ) ,c2x2 ( t ) ,c3x3 ( t ) , ?,c21x21 (t) ] T 。各年龄组妇女在五年内的平均生育率向量为B = [ b1 ,b1 ,b2 , ?,b21 ] T ;由于在2000 年以后,随着独生子女群体结婚高峰的到来,按照我国现行计划生育政策,这一群体允许生育第二胎,因此育龄妇女的生育率将会上升,其上升幅度现在很难准确估计,但总和生育率R 应满足不等式:1 < R < 2 , (即平均一对夫妇终生只能生育R 个孩子) 。如果2000 年以后按2000年总和生育率(1 125 ‰) 的a (0. 9 < a < 1. 3) 倍进行估算,那么可取B = a[ b1 ,b1 ,b2 , ?, b21 ] T 。若把t 阶段存活的全部新生儿划分到第t + 1 阶段的第一年龄组,并设各年龄组人口在五年期内的自然存活率向量为S = [ s1 ,s2 ,s3 , ?, s21 ] T 。由于第t 阶段k - 1 年龄组的人存活到第t + 1 阶段就是k 年龄组的人, (k = 2 ,3 ,4 , ?,20) ,且第21 年龄组(即100 岁以上) 的老年人五年后存活下来的仍然属于第21 年龄组。由此可得人口系统状态X( t ) 关于离散时间变量t ( t = 1 ,2 ,3 , ?,n ,?) 的状态转移方程组
x21 ( t + 1) = s20 x20 ( t) + s21 x21 ( t) (1)
引进系数矩阵:
则方程组(1) 可用矩阵形式表示成X(t + 1) = AX(t) t = 0 ,1 ,2 ,3 , ? (2)
矩阵A为Leslie矩阵[2 ] ,以A 为系数矩阵的人口状态向量X(t) 的转移方程(2) ,就是人口增长的动力学模型。
若以2010 年的人口向量为初始向量X(0) ,把X(0) 代入方程(2) 可依次求得2015年、2020 年等以后第5t 年的人口向量X(t) 的预测值。
由于方程(2) 以五年为一个时间单位,故应根据表2 中的数据计算出五年内各年龄组的死亡率与生育率。假设第k组人口年平均死亡率为λk ,则由于单位时间dt 内的死亡人数与人口总数 成正比,即有,解此微分方程可得五年的人口存活率为。但当第k 组育龄妇女的年平均生育率为f k 时,五年的平均生育率就是bk = 5fk (1 ,2 ,3 , ?,21) 。经计算可得以五年为一个单位时间时这两组数据组成的向量分别为
S = [ 0. 970 009 , 0. 997 553 , 0. 997 802 , 0. 996 357 ,0. 994 068 , 0. 993 372 , 0. 992 578 , 0. 991 189 , 0. 987 973 ,0. 982 161 , 0. 971 999 , 0. 955 042 , 0. 924 641 , 0. 872 406 ,0. 774 103 , 0. 672 032 , 0. 505 554 , 0. 396 135 , 0. 275 891 ,0. 313 627 , 0. 301 194 ]T ;
B = [ 0,0,0,0.0034,0.06014,0.09029,0.036,0.0093,0.0018,0.00048,0,0,0,0,0,0,0,0,0,0,0 ] T ;
C=[0.4520,0.4169,0.4162,0.5829,0.5435,0,4727,0.4542,0.4298,0.4270,0.4207,0.4268,0.5065,0.5275,0.4967,0.5107,0.5277,0.5672,0,7708,0.7442,0.9091,1]
经计算得到未来十年的人口人口结构:
表11
2015各年龄段人口数 | 2020各年龄段人口数 | |
0-4岁 | 54.28809474 | 52.852500532 |
5-9岁 | 46.694875417 | 58.137750585 |
10-14岁 | 36.040965146 | 52.817891213 |
15-19岁 | 33.176766028 | 40.762264077 |
20-24岁 | 89.509349076 | 37.535809407 |
25-29岁 | 228.46317419 | 101.26579133 |
30-34岁 | 211.04900857 | 258.44957437 |
35-39岁 | 155.79323252 | 238.69483975 |
40-44岁 | 136.80112721 | 176.05475213 |
45-49岁 | 105.20608279 | 154.34769657 |
50-54岁 | 64.736217831 | 118.0684396 |
55-59岁 | 30.24537674 | 72.510435601 |
60-64岁 | 22.837122785 | 33.692949555 |
65-69岁 | 13.467425688 | 25.11790464 |
70-74岁 | 7.7606335242 | 14.338474689 |
75-80岁 | 5.4529992473 | 7.6754807453 |
80-84岁 | 3.0992900655 | 5.1555362638 |
>84岁 | 1.3231804563 | 2.6299973943 |
由表格,对比2010年的年龄结构,可以看出,深圳市将面临老龄化严重的问题,并且中青年人口也在总人口中的比重降低。
(三)预测深圳未来全市和各区医疗床位需求
假设光明新区和坪山新区是在2010年时新增加的两个区.并设定
设
区床位需求=各区年龄结构
由于所给数据有限,我们只得到了2000年和2010年的各区人数和各区中各个年龄层的人口数量分布,运用matlab最小二乘法拟合散点,得出2000--2010年各区床位需求大致走向是呈正向发展趋势,如图所示:
图10:2000--2010年各区床位需求曲线图
进而得出了各个区的床位需求量与年份的函数关系式:
罗湖区:
福田区:
南山区:
宝安区:
龙岗区:
盐田区:
则全市总床位需求,以此预测出未来十年的各区和全市医疗床位需求。
二、问题二的分析
(一)模型建立
运用matlab最小二乘法散点拟合,得出患高血压,脑出血,癌症的未来发展趋势函数,
高血压:
癌症:
脑出血:
再根据等比例函数,得出各等级医院床位需求,
根据深圳市人口年龄结构和患病情况,我们选择3种具有代表性的疾病进行研究。通过查找《常见慢性病患病率的年龄分布特征及相关性分析》,得出高血压,癌症,脑出血这三种病在不同年龄段的患病几率。
按照规模大小将深圳市的医院分为 :综合医院,专科医院,街道(镇)医院,地方小诊所4种.设综合医院为
表12 :2000年患病人数表
2000年 | 高血压病 | 癌症 | 脑出血 |
青中年 | 878 | 2371 | 0 |
老年 | 385 | 4881 | 848 |
表13:2005年患病人数表
2005年 | 高血压病 | 癌症 | 脑出血 |
青中年 | 1441 | 3837 | 0 |
老年 | 515 | 6967 | 1220 |
表14:2010年患病人数表
2010年 | 高血压病 | 癌症 | 脑出血 |
青中年 | 2944 | 7341 | 0 |
老年 | 785 | 10584 | 1853 |
根据拟合得出:
高血压人口的发展趋势为
癌症人口的发展趋势为:
脑出血人口的发展趋势为:
按照病情的严重性和人群就医的一般规则,癌症和脑出血应在综合医院和专科医院救治,高血压可在综合医院,专科医院,街道(镇)医院进行治疗,癌症与脑出血就只能在综合医院和专科医院治疗.对于各等级医院的床位需求=某种病的患病人数
高血压床位需求:
综合医院所要求的床位:
专科医院所需床位:
街道(镇)医院的床位需求
癌症床位需求:
综合医院:
专科医院:
脑出血床位需求:
综合医院:
专科医院:
(二)模型求解
运用matlab最小二乘法散点拟合,得出患高血压,脑出血,癌症的未来发展趋势函数,
高血压:
癌症:
脑出血:
再根据等比例函数,得出各等级医院床位需求,
六、模型的评价
优点:本文在预测问题一中深圳未来十年年末常住人口时,通过matlab的一元线性回归对已知数据进行多次拟合,由此得出了未来十年年末常住人口的函数模型,通过多次的拟合,得到了较高的拟合度。在预测人口结构时,使用了Leslie矩阵,该模型最大的优点就是即使已知的数据很少,也可以通过建立模型对未来的数据进行预测。通过对深圳常住人口数的预测和人口结构的预测,加上题目提供的各区的人口数据,我们运用matlab最小二乘法拟合散点得出2000到2010年各区床位需求大致走向是呈正向发展趋势,而且在应用最小二乘法拟合数据实可以根据需要进行多次数的拟合,5次的精确率高达95%,所以我们的数据误差较小准确性较高。我们应用了几乎所有数据更能体现出数据的可靠性和真实性,更加准确地预测出未来全市和各区医疗床位需求。
问题二则是根据深圳市人口的年龄结构和患病情况,及所收集的数据,计算预测出高血压、癌症和脑出血在不同类型医疗机构就医的床位需求,具体如下:3种病症的患者人数在未来一段时间内大致接近一次函数发展趋势,并且得出各医疗机构床位需求函数:
由于原题中未给出相应的各等级医院数和各医院床位数,因此,我们无法得出具体结果。
缺点:首先我们计算得出的预测数据是基于较多的假设的基础之上得出的,从客观上讲,较为理想化,有很多客观或主观因素不能全面的考虑进去,只能得到在一定程度上更接近正确的合理性数据;其次由于数据有限,未能充分考虑影响人口增长的因素,因此所建模型不全面,所得的结果与实际有一定的出入。并且由于有限的时间,我们只能将最关键的情况考虑进去。
改进:在第一个问题的解决中我们没有考虑户籍人口和非户籍人口的关系,直接使用了常住人口来拟合数据。虽然有很多地方都出现了问题,但是计算方法和计算的结果绝对具有真实性。该模型在构造时有个很重要的假设,即考虑床位需求和患病人数成正比,但实际情况要复杂的多,要考虑患病高峰期、环境变化、医疗结构和医疗投入等诸多因素的影响,因此我们可以通过修正住院率的值,将住院率(总床位数/总人数)作为变化函数带入到模型中使模型更加准确等等。
七、全文总结
人口预测是一个极其复杂的过程,当中考虑的因素极为复杂,有人口迁移,经济变化,自然灾害等等。深圳是一个高速发展的城市,经济体制,产业体制,政府政策等等都会影响人口预测,对此造成极大的影响。本文人口预测是建立在深圳的产业结构,政府政策等等不发生太大变化,允许存在小范围的变动,运用一元线性及Leslie矩阵,模拟估计。并以此为依据对医疗需求进行了相关的预测。由于作者能力有限,知识水平有限,故模型可能存在问题,希望各位给予指出,进行指导,本人定会对模型进行完善修改。
参考文献:
[1] 刘卫国.MATLAB程序设计与应用(第二版)[M].北京:高等教
育出版社.2002.
[2] 杨启帆.数学建模.[M].北京:高等教育出版社,2004.
[3] 谭永基,蔡志杰,数学模型,上海:复旦大学出版社,2005.2.
[4] 陈强,人口系统模型及人口状况分析,中国优秀硕士论文,2004.9.
[5] 王晓军,蔡正高,死亡率预测模型的新进展[J].统计研究,2008,(25).
本文来源:https://www.2haoxitong.net/k/doc/6b3498485b0102020740be1e650e52ea5418ce33.html
文档为doc格式