答卷编号(参赛学校填写):
答卷编号(竞赛组委会填写):
论文题目:深圳人口与医疗需求预测(A)
组 别:本科生
参赛学校:
报名序号:
参赛队员信息(必填):
答卷编号(竞赛组委会填写):
评阅情况(省赛评阅专家填写):
省赛评阅1:
省赛评阅2:
省赛评阅3:
省赛评阅4:
省赛评阅5:
深圳市人口与医疗需求预测模型
摘要:
人口与医疗问题是关系到国计民生的大问题,能够合理而准确地预测就显得非常重要。但不同城市有不同的人口特点,本文在吸取前人经验的基础上,以深圳的人口为依托提出了一些新的简单而实用方法,希望能为政府决策提供帮助。
针对深圳市人口结构中非户籍人口比重大,流动人口多这一特点,我们采用了灰色GM(1,1)模型,通过matlab对深圳市自2001至2010年的数据进行拟合,发现其人口变化近似呈线性增长,线性相关系数高达0.99,我们就此认定其为线性相关并给出线性方程。同理,针对其非户籍人口,我们进行matlab拟合发现,其为非线性相关,并得出相关函数。
通过模拟出的常住人口与非户籍人口的函数,我们可以很容易的得出深圳市的人口数量变化情况,同时我们以非户籍人口与常住人口的函数之比作为深圳市人口结构的变化,通过作图发现,深圳市非户籍人口正逐年下降,这正与官方以及媒体报道深圳市产业转型相对应。
由于深圳市人口结构中外来人口比例接近76%,而且外来人口中以青壮年居多,可以认为在较短时间内(十年内)外来人口年龄结构近似不变,同时当地户籍人口因为受历史条件影响,人口年龄结构在短期内也不会发生较大变化,所以我们大胆假设深圳市未来十年人口年龄结构近似不变。同时深圳市各区发展水平相同,可以认为其人口发展态势与深圳市总体相同,所以其所在深圳市人口比例不变。
通过查阅资料得知床位需求与各年龄段人数、住院率、平均住院天数以及该地平均年床开放日数有关,在查找资料以及大量演算基础上,利用已求出的常住人口变化函数,我们得出深圳市的床位需求函数,而深圳市各区对应的床位需求则为深圳市总的床位需求乘以本区总人口所占深圳市总人口的比例(已架设各区人口在较短时间内保持不变)。
考虑到问题研究的实用性,我们选取了肺癌与胃癌作为深圳市疾病研究的对象,我们通过查找肺癌与胃癌在深圳市不同年龄段的发病率,这两种病在市级与区级医院的住院天数以及这两种级别的医院的平均年床开放日数,利用已知的病床需求函数,做出了针对深圳市不同级别医疗机构的函数表达式,通过函数表达式我们可以很轻松的看出深圳市不同类型医疗机构的床位需求。
最后以我们的模型为依托去测试深圳市各年的相关数据,都表现出来比较好的吻合性,它充分证明了我们模型的正确性。但是,由于时间仓促,模型仍有不完善地方,而且有其局限性(在较长时间内误差较大),随着时间推移,深圳外来人口比例将更低,老龄化趋势将更加显著,这显然会影响深圳市各级机构床位需求的预测,我们希望可以引入包含年龄结构的函数对其修正,而这将会成为我们以后的一个研究方向。
关键字:灰色GM(1,1)模型 线性相关方程
1、问题重述
深圳市是一个流动人口多,户籍人口少的城市,外来人口多导致深圳市青壮年劳动力多,由于青壮年劳动力身体健康程度要高于其它人群,因此深圳目前人均医疗设施虽然低于全国类似城市平均水平,但仍能满足现有人口的就医需求。然而,随着时间推移和政策的调整,深圳老年人口比例会逐渐增加,产业结构的变化也会影响外来务工人员的数量。这些都可能导致深圳市未来的医疗需求与现在有较大的差异。未来的医疗需求与人口结构、数量和经济发展等因素相关。请根据深圳市人口特点预测未来十年深圳市人口数量和结构的发展趋势,以此为基础预测未来全市和各区医疗床位需求;根据深圳市人口的年龄结构和患病情况及所收集的数据,选择预测几种病在不同类型的医疗机构就医的床位需求。
2、问题分析
深圳市人口特点是流动人口多,非户籍人口多,但户籍人口较少,针对这个情况,我们选取人口结构中的主要矛盾,即常住人口与非常住人口(即非户籍人口)进行研究。我们首先分析了深圳市近十年的人口年龄结构变化,发现其结构变化幅度很小,因此在短期内我们可以认为其年龄结构恒定。由于本题需要处理数据较多,我们采用matlab进行辅助分析,通过拟合结果研究其常住人口已经非户籍人口变化。而对于人口结构,我们可以用非户籍人口与总人口的比例来表示。床位需求主要由各年龄段的人数以及与其相对应的住院率相对应,因此我们可以先分析出深圳市的年龄结构(可以分析2010年),然后查找与其相对应的住院率数据,至此,我们便可完成问题的第一问。而对于第二问,我们可以利用第一问得出的常住人口变化函数与人口年龄结构得出未来某一年深圳市的某一年龄段的人数。考虑到研究的实用性与可行性,我们可以以肺癌与胃癌作为研究对象,通过肺癌与胃癌的住院率与发病率,得出住院人数。同时我们需要考虑到不同类型的医疗机构的住院天数受医院设备、人员水平等因素影响,通过查找资料,我们可以得出不同类型的医疗机构治疗同一种病的住院天数。于是,整个问题便被简化。
3、模型假设
1.在较短时间内深圳市人口年龄结构保持不变;
2.针对研究的问题,每个年龄段发病率住院率保持不变;
3.抽样调查结果具有较高准确性;
4.深圳市各区人口所占深圳市总人口比例保持不变;
5.没有大的自然灾害等急剧影响深圳市人口结构的事件发生;
6.深圳市现行的各种人口政策保持不变;
4、符号说明
1.——个元素的数列;
2.;
3.——的灰导数;
4.——的紧邻均值数列;
5.;
6.——称为发展系数;
7.——称为白化背景值;
8.称为灰作用量;
9.为数据向量;
10.为数据矩阵;
11.为参数向量;
12.——总人口随时间变化的拟合函数;
13——人口结构变化率;
14.——病床总需求;
15.——肺癌患病人数;
16.——胃癌患病人数;
17.——肺癌在市级医院的病床需求;
18.——肺癌在区级医院的病床需求;
19.——胃癌在市级医院的病床需求;
20.——胃癌在区级医院的病床需求;
5、模型建立及求解
问题:深圳市最近十年常住人口、非常住人口变化特征与未来十年发展情况。
首先,我们采用灰色GM(1,1)模型.采用原因:灰色模型适用于小样本、贫信息、内在规律未充分外露的系统,按适当办法处理原始数据后得到规律性较强的生成函数.本题给出的常住人口、非常住人口数据受到难以区分的多重因素影响,且数据量较小,适用于灰色模型.
由于常住人口数量受历史影响较大,不易发生较大变化,且在数据处理中发现了较强的线性关系,我们之后采用了一元线性拟合来简化模型;而非常住人口受各方面因素影响较大,仍保持灰色模型不变。最后我们得出了与常住/非常住人口相关的人口结构变化规律。
(一) 灰色模型部分.
目前使用最广泛的灰色预测模型就是关于数列预测的一个变量、一阶微分的GM(1,1)模型.它是基于随机的原始时间序列,经按时间累加后所形成的新的时间序列呈现的规律可用一阶线性微分方程的解来逼近.经证明,经一阶线性微分方程的解逼近所揭示的原始时间序列呈指数变化规律.因此,当原始时间序列隐含着指数变化规律时,灰色模型GM(1,1)的预测是非常成功的.[1]
GM(1,1)的定义
设为个元素的数列,的AGO生成数列为,其中.则定义的灰导数为
,
令为数列的紧邻均值数列,即
,
则.于是定义GM(1,1)灰微分方程模型为
,
即
(a)
其中称为灰导数,称为发展系数,称为白化背景值,称为灰作用量.
将时刻代入(a)式中有
令,,,称为数据向量,为数据矩阵,为参数向量,则GM(1,1)模型可以表示为矩阵方程.
由最小二乘法可以求得
GM(1,1)的白化型
对于GM(1,1)的灰微分方程(7),如果将的时刻视为连续的变量,则数列就可以视为时间的函数,记为,并让灰导数对应于导数,背景值对应于.于是得到GM(1,1)的灰微分方程对应的白微分方程为
称之为GM(1,1)的白化型.
2. 模型建立
此预测模型是拟合参数模型,通过原始数据累加生成,得到规律性较强的序列,用函数曲线拟合得到预测值.
建立过程如下:
1) 设原始数据序列有n个观察值,,通过累加生成新序列,利用新生成的序列拟合函数曲线.
2) 利用拟合出的函数求出新生序列的预测值序列.
3) 利用累减还原,得到灰色预测值序列(共n+m个,m个未来预测值).将序列分为和,其中反映的确定性增长趋势,反映的平稳周期变化趋势.
4) 对序列的确定增长趋势进行预测.
3 模型求解
整理得深圳市2001年~2010年常住人口数,见下表.
表一:深圳市2001~2010年年末常住人口数
根据上述数据建立含有10个观察值的原始数据序列:
使用Matlab软件对进行一次累加,得到新数列,见表二.
表二:GM(1,1)算法拟合值及误差
拟合函数:
由残差、相对误差、级比偏差可知此模型精度较高,可用于预测.预测值见下表.
表三:2011年~2020年深圳市常住人口预测人数
同理,整理得2001年~2010年非户籍人口数如下表.
表四:2001年~2010年非户籍人口数
表五:GM(1,1)算法拟合值及误差
表六:2011~2020年非户籍人口预测值
拟合函数:
(二) 一元线性拟合部分
由表一作出年份-常住人口数(单位:万人)曲线如下图:
图一
由图可见数据的线性关系很强,且在一段时间内仍保持线性增长趋势。由最小二乘法得拟合函数为,相关系数为。
非常住人口拟合函数为。
设为人口结构变化率,则。使用EXCEL作图如下:
图二
由图可见,深圳市非户籍人口所占比例逐年下降,并在2009年左右达到稳定值,约为76%。
问题二:未来全市和各区医疗床位需求。
模型建立的前提:未来十年深圳市各年龄段比例不变。原因:由上题结果可知,深圳市非户籍人口所占比例逐年下降,并趋近于76%的稳定值,且深圳市非户籍人口以年轻人为主,在较短时间内年龄结构基本不变;而常住人口受历史影响较大,年龄结构在短期内基本不变。因此,可以认为未来十年深圳市各年龄段比例保持不变。
查找资料得病床需求量公式如下:[3]
设病床总需求为Q,为第年(以2011年为第1年)深圳人口总数,为年龄段所占比例(0~4岁为1,5~14岁为2,依此类推,),为年龄段住院率,平均住院天数为,平均年床开放日数为。则
(b)
各年龄段住院率见下图:
图三
由于自然规律,各年龄段发病住院率基本不变,因此可用图中数据计算。
深圳市各年龄段比例见下图:
图四
查找资料得,。
由(b)式结合图三、图四可得预测结果如下表。
模型的进一步处理:医院在实际配置病床时,除考虑需求量外,还需考虑潜在需求量和流动人口对病床的需求量。由文献可知城市病床潜在需求量为实际利用量的20%;根据第一次国家卫生服务调查和流动人口调查结构估算,流动人口医院病床需要数相当于本地居民需要的10%。
考虑上述因素后,医院病床配置的推荐公式为:[4]
设医院病床推荐配置数为,病床潜在需求量为,流动人口病床需要数为。因此
(c)
根据(b)可求出未来十年医院病床推荐配置数如下表。
表七:未来十年医院病床推荐配置数
根据各区人数与全市人口的比例可求出各区病床推荐配置数。
图五
表八:各区推荐床位数(以2020年为例)
问题:不同疾病在不同医疗机构的床位需求——以肺癌和胃癌为例
考虑到模型的实用情况,我们选取了在人群中发病率较高的肺癌和胃癌作为预测对象。
查阅文献可得不同年龄段肺癌和胃癌发病率如下表:
表九:不同年龄段肺癌发病率
表十“不同年龄段胃癌发病率
针对以上数据,由第一问得出深圳未来人口变化情况为,设为肺癌患病人数,为胃癌患病人数。因为某种疾病的患病人数等于该所有年龄段的人数与它们所对应的患病率乘积之和,则由图4的人口年龄结构得每种疾病的患病人数如下:
(单位:万)
(单位:万)
经查阅资料,不同疾病在不同类型的医院的住院天数如表十一所示:
表十一.肺癌和胃癌在不同级别医院住院天数[2]
则由上表可知,肺癌在市级医院平均住院天数为56天,在区级医院平均住院天数为85天;胃癌在市级医院平均住院天数为50天,在区级医院平均住院天数为82天。
设肺癌在市级医院的病床需求为,在区级医院的病床需求为,则由第一问得知,理想的病床需求为:[3]
在本模型中假设得肺癌与胃癌的人都住院,则(注:查阅资料知大城市年床开放日数为317天,区级则为237天,C为深圳市得肺癌的人数),。则, (注:为年份,结果取整)
设胃癌在市级医院的病床需求为,在区级医院的病床需求为,则同理可得,,,则, (注:为年份,结果取整)
6、模型评价与改进方向
1.模型建造中没有考虑到年龄结构的变化,而深圳市年龄结构是趋向老龄化方向的,老年人体质弱,易生病住院,因此实际得出的床位数小于实际需求的床位数。
2.模型没有体现出深圳不同区的人口变化函数,而只是假设其人口总量对深圳总人口量保持不变,实际上每个区的发展不同,人口变化也不同。
3.本模型只适应于预测短期,不适应于长期。
4.本模型还是比较合理的,相比其它同类模型而言,本模型立意新颖,结构简单,易于理解,同时具有很强的操作性,值得政府部门参考。
5.本模型巧妙的忽略了问题的次要矛盾,即年龄结构,各区所占比例,虽然丧失了一些精确度,但是相对于其它繁琐的模型而言,还是利大于弊的
6.从提高准确性与普遍性的角度考虑,还可以引入关于年龄结构的拟合函数以及各区独立的人口发展函数。
7、参考文献
[1]唐丽芳、贾冬青、孟庆鹏,2008.《用MATLAB实现灰色预测GM(1,1)模型》.沧州师范专科学校学报,24:35
[2]上海医科大学陈兴宝、郑恩群、陈洁上海市不同级别医院平均住院天数分析,
[3]饶克勤、陈育德关于制定卫生资源配置标准的几点建议,1999年03期 39页
[4]饶克勤、陈育德关于制定卫生资源配置标准的几点建议,1999年03期 40页
八、附件
GM(1,1)灰色模型
常住人口:
clear
x0=[724.57 746.62 778.27 800.8 827.75 871.1 912.37 954.28 995.01 1037.2]
n=length(x0);
lamda=x0(1:n-1)./x0(2:n)
range=minmax(lamda);
x1=cumsum(x0);
for i=2:n
z(i)=0.5*(x1(i)+x1(i-1));
end
B=[-z(2:n)',ones(n-1,1)];
Y=x0(2:n)';
u=B\Y
x=dsolve('Dx+a*x=b','x(0)=x0');
x=subs(x,{'a','b','x0'},{u(1),u(2),x1(1)});
yuce1=subs(x,'t',[0:n-1]);
digits(6),y=vpa(x)
yuce=[x0(1),diff(yuce1)]
epsilon=(x0-yuce)./x0%求残差
delta=abs(epsilon./x0)%求相对误差
rho=1-(1-0.5*u(1))/(1+0.5*u(1))*lamda%求级比误差
yuce1=subs(x,'t',[0:19]);%共20年预测值
非户籍人口:
x0=[592.53 607.17 627.34 635.67 645.82 674.27 699.99 726.21 753.56 786.17];
n=length(x0);
lamda=x0(1:n-1)./x0(2:n)
range=minmax(lamda);
x1=cumsum(x0);
for i=2:n
z(i)=0.5*(x1(i)+x1(i-1));
end
B=[-z(2:n)',ones(n-1,1)];
Y=x0(2:n)';
u=B\Y
x=dsolve('Dx+a*x=b','x(0)=x0');
x=subs(x,{'a','b','x0'},{u(1),u(2),x1(1)});
yuce1=subs(x,'t',[0:n-1]);
digits(6),y=vpa(x)
yuce=[x0(1),diff(yuce1)]
epsilon=(x0-yuce)./x0%求残差
delta=abs(epsilon./x0)%求相对误差
rho=1-(1-0.5*u(1))/(1+0.5*u(1))*lamda%求级比误差
yuce1=subs(x,'t',[0:19]);%共20年预测值
本文来源:https://www.2haoxitong.net/k/doc/517224da5022aaea998f0fcd.html
文档为doc格式