本文采用多元线性回归分析方法,对我国不同省份人群受较高教育人口比重的差异进行了影响因素探究。本文结合现有文献的研究成果,选取地方经济、教育政策、基础设施(城市化程度)、人才需求产业四个方面对我国不同地区人群受较高教育人口比重的差异进行考察。通过变量相关性分析和直接回归分析对变量进行检验,然后逐步回归选取合理科学变量,最后得到我国地区人群受较高教育人口比重差异影响因素的回归模型。结果表明:我国地区人群受较高教育人口比重差异主要取决于地方经济因素,随着经济发展水平的上升,人均可支配收入每增加1000元,地区受较高教育人口加权比重就会上升0.588%。
不同人群的受教育程度往往不同,有时两个人群即使属于同一民族,处于同一地带,拥有相同文化背景,其人群受教育程度会有依然不小的差距。对此现象,国内外学者已做了不少的研究与分析,发现这与各个地方的经济,教育政策,以及环境和历史文化相关。
胡春光(2003)认为教育是受到政治,经济,文化,教育政策,科学技术,人口等多因素从不同方面,不同层次和方式影响的,教育是一个合力作用的结果。孙萍(2003)应用回归分析方法建立了新疆地区教育与经济发展的指数回归模型 ,证明在新疆地区教育发展与经济发展之间高度相关 ,要发展经济必须首先发展教育。涂冬波(2004)认为影响教育发展的因素主要是经济、文化和科技三个因素,它们三者能解释教育发展变异中的75%王丽(2007)通过对我国2002年31个省份高等教育规模的省际比较,及其与经济发展的回归分析,发现高等教育规模与经济发展,特别是与城市化具有较强的正相关性。燕新,侯贵宝(2011)认为影响我国农村教育发展的主要因素有家庭行业结构、经济发展水平和地区及地势因素。
在借鉴已有研究成果和经验的基础上,本文以我国31各省市自治区2013年的国家统计数据作为依据,探究中国地区受教育程度差异的相关因素及其对人群受教育程度影响的具体表现形式。本文的研究结果或许可为相关研究提供一定的印证,为相关政策制定提供一定的参考。
一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际。因此,本文采用多元线性回归的方法对不同地区人群较高受教育程度差异进行探究。
● 因变量选取
本文选取各省高中及以上文化程度人口比重加权数作为各省人群受较高教育程度的指标进行衡量,由于九年制义务教育的强制施行,各省在拥有小学和初中教育程度人口比重上的差异不大(国家制度较大程度上同一了差异),人群教育程度受地方因素影响的较大差异主要从高中教育开始,且在对于是否拥有文化水平的评判上,高中及以上教育程度更加被人们认可为是较高的受教育水平,接受大专及以上教育人口比重更加能反映地方教育程度的发达水平,因此本文选择该加权指标来反映人群受教育程度的差异。
设:人群受较高教育程度的指标为word/media/image1.gif,各省数据分别为word/media/image2.gif.
人群受较高教育程度指标=高中教育程度人口比重·0.35+大专及以上教育人口比重·0.65
● 自变量选取
根据已有参考文献的研究成果,本文选取地方经济、教育政策、地方基础设施、产业人才需求四个对人群受教育程度影响较大的因素进行探究。本文分别以人均可支配收入、教育科技财政支出、城市化率(城市对教育的影响相当大)、较高受教育程度人才需求产业的产出值(工业生产,金融业,科学研究勘探,文化新闻产业等)的数据来显示我国各省份地方经济,教育政策,基础设施和产业人才需求方面的具体情况。
设:人均可支配收入为word/media/image3.gif,参数估计值为word/media/image4.gif
各省数据为word/media/image5.gif.
教育科技财政支出为word/media/image6.gif,参数估计值为word/media/image7.gif
各省数据为word/media/image8.gif.
城市化率word/media/image9.gif,参数估计值为word/media/image10.gif
各省数据为word/media/image11.gif.
人才需求产业产出值word/media/image12.gif,参数估计值为word/media/image13.gif
各省数据为word/media/image14.gif.
常数估计参数值为word/media/image15.gif.
设多元回归方程为:
word/media/image16.gif
n取决于逐步回归中的各个可决系数和模型检验结果。
● 假设检验
首先导入各省份数据运用excel对各变量作相关性检验:
再调用SPSS对以上四个变量作多元回归:
研究结果发现:在回归分析的word/media/image22.gif检验和变量间相关性检验中,参数估计值word/media/image23.gif与word/media/image24.gif未通过word/media/image22.gif检验,且word/media/image25.gif与word/media/image26.gif的相关程度过高,word/media/image25.gif与word/media/image26.gif极有可能违反了回归自变量无线性相关的假设,因此不宜将word/media/image25.gif纳入回归模型之中。
● 逐步回归
然后继续使用SPSS进行逐步回归以选择合适变量:先分别对word/media/image27.gif进行一元线性回归,分别得到对应的可决系数为:0.849,0.587,0.183,且除word/media/image24.gif外,其它参数估计全部通过word/media/image22.gif检验。
于是选择word/media/image26.gif作为word/media/image28.gif的首选变量,之后按可决系数的大小顺序逐一加入其他变量进行二元回归分析,分别得到0.726,0.754的修正可决系数,只有后者的参数估计值较好地通过了word/media/image22.gif检验,因而选取word/media/image29.gif作为影响变量,但存在问题,人才需求产业产出值word/media/image30.gif关于人群受较高教育程度加权比重(或指标)word/media/image28.gif的影响是负的,这显然是不现实的,或许在三元回归时这一情况会转变,于是便进一步进行了三元回归分析,然而结果发现修正可决系数并无上升,同时在回归参数估计值方面,word/media/image31.gif和word/media/image32.gif未通过word/media/image22.gif检验。
依据我国2013年各省份的综合统计数据,最后得出的回归函数为:
word/media/image33.gif
word/media/image34.gif,word/media/image26.gif对应的参数估计值为0.00000588,表明随着经济增长,人均可支配收入每增加1000元,受较高教育人口加权比重就会上升0.588%,常数参数估计值和word/media/image26.gif的参数估计量word/media/image35.gif的word/media/image22.gif统计量分别为2.108和8.639,表明参数估计量都较好地通过word/media/image22.gif统计量检验,同时word/media/image26.gif对word/media/image28.gif的影响程度通过了方差分析的word/media/image36.gif统计量检验,其word/media/image36.gif统计量的值为74.637。该一元回归模型的可决系数为0.849,即:由各地区人均可支配收入作出解释的地方人群受较高教育程度的差异占总差异的84.9%。
数据标准化处理
本文所做的回归分析并非在对数据进行标准化处理后的回归,从而无法消除由于量纲不同、自身变异或者数值相差较大所带来的一些潜在问题,所幸在普通的回归中尚未涉及这些问题,但是如果要更进一步研究,则应该将数据进行标准化处理后再进行回归计算。
影响因素合理性与数据科学性
由于本人对于教育研究认识十分微浅,在选取影响教育变量方面缺乏经验,所以在影响因素选择上还存在很大需要改进之处,在数据精确查找选择上还需要进一步改善。很多变量的选取和数据采用更多的是依据个人生活经验和主观判断,很可能存在严重误判,需要专业知识和实际研究经验来修正,或许应该选择更加合理的因素和更加科学的数据进行研究。
增加检验和修正
由于统计学知识有限,无法进行更深的模型检验和修正,不能进一步提高模型的正确性和可靠性,也无法进一步修正模型。应采用更加合理的检验方法对模型进行进一步的检验和修正,以增强模型的稳健性。
[1]袁卫,庞皓,贾俊平,杨灿.统计学(第四版)[M].北京:高等教育出版社,2016.
[2]袁卫,庞皓,贾俊平,杨灿.统计学(第四版)习题与案例[M].北京:高等教育出版社,2014
[3]国家统计局.2014中国统计年鉴[J].北京:中国统计出版社,2014
[4]李毳毳,张智. 基于SPSS的线性回归分析在教育研究中的应用[J]. 科技创业家,2013,22:153.
[5]涂冬波. 我国教育发展不平衡现状及其影响因素的量化研究[D].江西师范大学,2004.
[6]胡春光. 试论影响我国高等教育发展的因素[J]. 煤炭高等教育,2003,03:37-40.
[7]孙萍. 新疆地区教育与经济发展的指数回归分析[J]. 乌鲁木齐职业大学学报,2003,02:34-38+42.
[8]王丽. 高等教育规模的省际比较及与经济发展的回归分析[J]. 西北农林科技大学学报(社会科学版),2007,02:30-33.
[9]燕新,侯贵宝. 影响我国农村教育发展的因素分析[J]. 教育理论与实践,2011,13:27-29
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT Y
/METHOD=ENTER X1 X2 X3 X4.
Regression
[数据集0]
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT Y
/METHOD=ENTER X1.
Regression
[数据集0]
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT Y
/METHOD=ENTER X2.
Regression
[数据集0]
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT Y
/METHOD=ENTER X4.
Regression
[数据集0]
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT Y
/METHOD=ENTER X1 X2.
Regression
[数据集0]
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT Y
/METHOD=ENTER X1 X4.
Regression
[数据集0]
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT Y
/METHOD=ENTER X1 X2 X4.
Regression
[数据集0]
变量间相关性检验
本文来源:https://www.2haoxitong.net/k/doc/168c5bcc88eb172ded630b1c59eef8c75fbf95e3.html
文档为doc格式