对各地受较高教育人口比重的回归分析 统计案例分析

发布时间:2017-02-07 12:16:13   来源:文档文库   
字号:

受较高教育人口比重的回归分析——统计学案例分析

摘要

本文采用多元线性回归分析方法,对我国不同省份人群受较高教育人口比重的差异进行了影响因素探究。本文结合现有文献的研究成果,选取地方经济、教育政策、基础设施(城市化程度)、人才需求产业四个方面对我国不同地区人群受较高教育人口比重的差异进行考察。通过变量相关性分析和直接回归分析对变量进行检验,然后逐步回归选取合理科学变量,最后得到我国地区人群受较高教育人口比重差异影响因素的回归模型。结果表明我国地区人群受较高教育人口比重差异主要取决于地方经济因素随着经济发展水平的上升,人均可支配收入每增加1000元,地区受较高教育人口加权比重就会上升0.588%。

1.

不同人群的受教育程度往往不有时两个人群即使属于同一民族,处于同一地带,拥有相同文化背景,其人群受教育程度会有依然不小的差距对此现象国内外学者已做了不少研究与分析,发现这与各个地方经济,教育政策,以及环境和历史文化相关。

胡春光(2003)认为教育是受到政治,经济,文化,教育政策,科学技术,人口等多因素从不同方面,不同层次和方式影响的,教育是一个合力作用的结果。孙萍(2003)应用回归分析方法建立了新疆地区教育与经济发展的指数回归模型 ,证明在新疆地区教育发展与经济发展之间高度相关 ,要发展经济必须首先发展教育。涂冬波(2004)认为影响教育发展的因素主要是经济、文化和科技三个因素,它们三者能解释教育发展变异中的75%王丽(2007)通过对我国2002年31个省份高等教育规模的省际比较,及其与经济发展的回归分析,发现高等教育规模与经济发展,特别是与城市化具有较强的正相关性。燕新,侯贵宝(2011)认为影响我国农村教育发展的主要因素有家庭行业结构、经济发展水平和地区及地势因素。

在借鉴已有研究成果和经验的基础上,本文我国31各省市自治区2013年的国家统计数据作为依据,探究中国地区受教育程度差异的相关因素及其对人群受教育程度影响的具体表现形式本文研究结果或许可为相关研究提供一定的印证,相关政策制定提供一定的参考。

2模型建立

一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际。因此,本文采用多元线性回归的方法对不同地区人群较高受教育程度差异进行探究。

2.1指标选取

因变量选取

本文选取各省高中及以上文化程度人口比重加权数作为各省人群较高教育程度的指标进行衡量,由于九年制义务教育的强制施行,各省在拥有小学和初中教育程度人口比重上差异不大(国家制度较大程度上同一了差异)人群教育程度受地方因素影响的较大差异主要从高中教育开始,且对于是否拥有文化水平的评判,高中及以上教育程度更被人们认可是较高的受教育水平接受大专及以上教育人口比重更能反映地方教育程度的发达水平,因此本文选择该加权指标反映人群受教育程度的差异

人群受较高教育程度指标为word/media/image1.gif,各数据分别为word/media/image2.gif.

人群受较高教育程度指标=高中教育程度人口比重·0.35+大专及以上教育人口比重·0.65

自变量选取

根据已有参考文献的研究成果,本文选取地方经济、教育政策、地方基础设施、产业人才需求四个对人群受教育程度影响较大的因素进行探究。本文分别以人均可支配收入、教育科技财政支出、城市化(城市对教育的影响相当大)、较高受教育程度人才需求产业产出值(工业生产,金融业,科学研究勘探,文化新闻产业等)的数据来显示我国各省地方经济,教育政策,基础设施和产业人才需求方面的具体情况

人均可支配收入为word/media/image3.gif参数估计值word/media/image4.gif

各省数据为word/media/image5.gif.

教育科技财政支出为word/media/image6.gif参数估计值word/media/image7.gif

各省数据为word/media/image8.gif.

城市化率word/media/image9.gif参数估计值word/media/image10.gif

各省数据为word/media/image11.gif.

人才需求产业产出值word/media/image12.gif参数估计值word/media/image13.gif

各省数据为word/media/image14.gif.

常数估计参数值为word/media/image15.gif.

2.2回归方程逐步确立

设多元回归方程为:

word/media/image16.gif

n取决于逐步回归中的各个可决系数和模型检验结果。

假设检验

首先导入各省份数据运用excel对各变量作相关性检验

调用SPSS以上四个变量作多元回归

研究结果发现:在回归分析的word/media/image22.gif检验和变量间相关性检验中,参数估计值word/media/image23.gifword/media/image24.gif未通过word/media/image22.gif检验,且word/media/image25.gifword/media/image26.gif的相关程度过高,word/media/image25.gifword/media/image26.gif极有可能违反了回归自变量无线性相关的假设,因此不宜将word/media/image25.gif纳入回归模型之中。

逐步回归

然后继续使用SPSS进行逐步回归选择合适变量:先分别对word/media/image27.gif进行一元线性回归,分别得到对应的可决系数为:0.8490.5870.183,且除word/media/image24.gif外,其它参数估计全部通过word/media/image22.gif检验。

于是选择word/media/image26.gif作为word/media/image28.gif的首选变量,之后按可决系数的大小顺序逐一加入其他变量进行二元回归分析,分别得到0.7260.754的修正可决系数,只有后者的参数估计值较好地通过word/media/image22.gif检验,因而选取word/media/image29.gif作为影响变量,但存在问题,人才需求产业产出值word/media/image30.gif关于人群受较高教育程度加权比重(或指标)word/media/image28.gif的影响是负的,这显然是不现实的,或许在三元回归时这一情况会转变,于是便进一步进行三元回归分析,然而结果发现修正可决系数并无上升同时在回归参数估计值方面word/media/image31.gifword/media/image32.gif未通过word/media/image22.gif检验。

2.3模型最终确定

依据我国2013年各省份的综合统计数据,最后得出回归函数

word/media/image33.gif

3.结果分析

word/media/image34.gifword/media/image26.gif对应的参数估计值为0.00000588,表明随着经济增长,人均可支配收入每增加1000元,受较高教育人口加权比重就会上升0.588%,常数参数估计值word/media/image26.gif的参数估计量word/media/image35.gifword/media/image22.gif统计量分别2.1088.639,表明参数估计量都较好地通过word/media/image22.gif统计检验,同时word/media/image26.gifword/media/image28.gif的影响程度通过了方差分析的word/media/image36.gif统计量检验,其word/media/image36.gif统计量的值为74.637该一元回归模型的可决系数为0.849即:由各地区人均可支配收入作出解释的地方人群受较高教育程度的差异占总差异的84.9%

4.模型改进

数据标准化处理

本文所做的回归分析并非在对数据进行标准化处理后的回归从而无法消除由于量纲不同、自身变异或者数值相差较大所带来的一些潜在问题,所幸在普通的回归中尚未涉及这些问题,但是如果要更进一步研究,则应该将数据进行标准化处理后再进行回归计算。

影响因素合理性与数据科学性

由于本人对于教育研究认识十分微浅,在选取影响教育变量方面缺乏经验,所以在影响因素选择上还存在很大需要改进之处,在数据精确查找选择上还需要进一步改善。很多变量的选取和数据采用更多的是依据个人生活经验和主观判断,很可能存在严重误判,需要专业知识和实际研究经验来修正,或许应该选择更加合理的因素和更加科学的数据进行研究。

增加检验和修正

由于统计学知识有限,无法进行更深的模型检验和修正,不能进一步提高模型的正确性和可靠性,也无法进一步修正模型。应采用更加合理的检验方法对模型进行进一步的检验和修正,以增强模型的稳健性。

5.参考文献

[1]袁卫,庞皓,贾俊平,杨灿.统计学(第四版)[M].北京:高等教育出版社,2016.

[2]袁卫,庞皓,贾俊平,杨灿.统计学(第四版)习题与案例[M].北京:高等育出版社,2014

[3]国家统计局.2014中国统计年鉴[J].北京:中国统计出版社,2014

[4]李毳毳,张智. 基于SPSS的线性回归分析在教育研究中的应用[J]. 科技创业家,2013,22:153.

[5]涂冬波. 我国教育发展不平衡现状及其影响因素的量化研究[D].江西师范大学,2004.

[6]胡春光. 试论影响我国高等教育发展的因素[J]. 煤炭高等教育,2003,03:37-40.

[7]孙萍. 新疆地区教育与经济发展的指数回归分析[J]. 乌鲁木齐职业大学学报,2003,02:34-38+42.

[8]王丽. 高等教育规模的省际比较及与经济发展的回归分析[J]. 西北农林科技大学学报(社会科学版),2007,02:30-33.

[9]燕新,侯贵宝. 影响我国农村教育发展的因素分析[J]. 教育理论与实践,2011,13:27-29

6附录

REGRESSION

/MISSING LISTWISE

/STATISTICS COEFF OUTS R ANOVA

/CRITERIA=PIN(.05) POUT(.10)

/NOORIGIN

/DEPENDENT Y

/METHOD=ENTER X1 X2 X3 X4.

Regression

[数据集0]

REGRESSION

/MISSING LISTWISE

/STATISTICS COEFF OUTS R ANOVA

/CRITERIA=PIN(.05) POUT(.10)

/NOORIGIN

/DEPENDENT Y

/METHOD=ENTER X1.

Regression

[数据集0]

REGRESSION

/MISSING LISTWISE

/STATISTICS COEFF OUTS R ANOVA

/CRITERIA=PIN(.05) POUT(.10)

/NOORIGIN

/DEPENDENT Y

/METHOD=ENTER X2.

Regression

[数据集0]

REGRESSION

/MISSING LISTWISE

/STATISTICS COEFF OUTS R ANOVA

/CRITERIA=PIN(.05) POUT(.10)

/NOORIGIN

/DEPENDENT Y

/METHOD=ENTER X4.

Regression

[数据集0]

REGRESSION

/MISSING LISTWISE

/STATISTICS COEFF OUTS R ANOVA

/CRITERIA=PIN(.05) POUT(.10)

/NOORIGIN

/DEPENDENT Y

/METHOD=ENTER X1 X2.

Regression

[数据集0]

REGRESSION

/MISSING LISTWISE

/STATISTICS COEFF OUTS R ANOVA

/CRITERIA=PIN(.05) POUT(.10)

/NOORIGIN

/DEPENDENT Y

/METHOD=ENTER X1 X4.

Regression

[数据集0]

REGRESSION

/MISSING LISTWISE

/STATISTICS COEFF OUTS R ANOVA

/CRITERIA=PIN(.05) POUT(.10)

/NOORIGIN

/DEPENDENT Y

/METHOD=ENTER X1 X2 X4.

Regression

[数据集0]

变量间相关性检验

本文来源:https://www.2haoxitong.net/k/doc/168c5bcc88eb172ded630b1c59eef8c75fbf95e3.html

《对各地受较高教育人口比重的回归分析 统计案例分析.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式