多元统计分析我国城镇居民消费性支出

发布时间:2020-05-26 00:50:55   来源:文档文库   
字号:

理学院《应用多元统计分析》课程论文

论文题目: 多元统计分析中国城镇居民人均消费水平

业: 统计学

级: 112

名: 杨晓丹 11480020204

师: 韩明 教授

20131212

摘要

本文通过选取2011年我国31个省市自治区城镇居民在食品、衣着、居住、家庭设备用品及服务、医疗保健、交通和通信、教育文化娱乐服务及其他商品和服务等方面的人均消费性支出,运用聚类分析及主成分分析对各地区进行比较和分析。用聚类分析将各地区进行分类,对分类的地区进行比较,用主成分分析根据所选主要成分将各地区排名。找出各地区城镇居民在消费性支出方面存在的差异,并提出相应缩小差异的建议。除了地区间的比较,将结果同前一年比较,明确地区经济发展变化。

关键字:人均消费性支出 聚类分析 主成分分析



1 绪论

1.1 选题背景和研究现状

近年来,我国国民经济得到了迅速发展,人民生活水平进一步提高,物质文明建设达到了前所未有的水平。但由于我国各地区经济发展水平不均衡,加之各地人口、资源、政策等各方面存在的差异,使各地区居民人均消费水平参差不齐,不同的地区具有不同的特点。在这一背景下,研究我国各地区城镇居民家庭平均每人全年消费性支出情况,比较地区间的差异和差距,通过与前几年结果作对比,进而明确促进和抑制我国城镇居民人均消费性支出发展的影响因素。

1.2研究目的

消费结构可以反映居民的生活质量和经济发展水平。一般来说,经济越发达的地区,其消费结构就越趋向于追求安逸享受的消费结构。在这样的消费结构中,教育文化娱乐服务支出所占的比例就会较大。反之,在经济较不发达的地区中,生活必需品消费支出所占的比例就会较大。随着社会主义市场经济体制的逐步完善,我国的社会生产力不断日益加快发展,经济总量和综合实力迅速上升,城镇居民的生活水平显著提高。相对过去而言,居民食品方面的消费支出比重在逐渐下降,而在交通通讯、文化娱乐等方面的消费支出比重越来越大。消费结构的变化,反映居民需求的变化。研究我国城镇居民消费性支出情况及其影响因素,对建立合理的消费结构,扩大内需,搞活社会主义市场经济,制定产业政策,促进国民经济的发展都有着极其重要的意义。

2 内容

2.1数据收集

1 我国各地区城镇居民家庭平均每人全年消费性支出情况1

地区

食品

衣着

居住

家庭设备

医疗保健

交通和通信

教育文化

其他商品

北京

6905.51

1612.12

1923.71

1562.55

1523.32

3521.20

3306.82

975.37

天津

6663.31

1274.91

1763.44

1174.62

1415.39

2699.53

2116.01

836.82

河北

3927.26

1020.03

1372.25

809.85

955.95

1526.60

1203.99

387.40

山西

3558.04

1094.58

1327.78

832.74

851.30

1487.66

1419.43

415.44

内蒙古

4962.40

1859.84

1418.60

1162.87

1239.36

2003.54

1812.07

765.13

辽宁

5254.96

1295.08

1385.62

929.37

1208.30

1899.06

1614.52

643.15

吉林

4252.85

1272.43

1468.29

839.31

1108.51

1541.37

1468.34

562.48

黑龙江

4348.45

1194.59

1185.96

723.58

1082.96

1363.62

1190.87

476.89

上海

8905.95

1558.24

2225.68

1826.22

1140.82

3808.41

3746.38

1394.86

江苏

6060.91

1338.75

1187.74

1193.81

962.45

2262.19

2695.52

647.06

浙江

7066.22

1658.21

1518.06

1109.42

1248.90

3728.23

2816.12

811.51

安徽

5246.76

954.30

1501.39

690.66

907.58

1365.01

1631.28

467.77

福建

6534.94

1167.05

1661.84

1179.84

773.26

2470.18

1879.02

667.00

江西

4675.16

978.76

1114.49

914.88

641.23

1310.21

1429.30

389.06

山东

4827.61

1463.71

1510.84

1013.82

938.86

2203.99

1538.44

518.27

河南

4212.76

1265.53

1087.08

977.52

919.83

1573.64

1373.94

484.76

湖北

5363.68

1259.76

1172.11

814.81

915.72

1382.20

1489.67

347.68

湖南

4943.89

1123.49

1292.55

940.79

790.76

1975.50

1526.10

434.25

广东

7471.88

1065.71

2005.15

1370.28

948.18

3630.62

2647.94

773.17

广西

5074.49

778.29

1237.91

884.85

779.08

2000.57

1502.65

349.48

海南

5673.65

615.59

1342.29

729.86

783.34

1830.80

1141.81

360.91

重庆

5847.90

1516.13

1205.66

1079.27

1050.62

1718.73

1474.88

540.63

四川

5571.69

1099.76

1226.14

1020.16

735.26

1757.52

1369.47

532.52

贵州

4565.85

853.39

1102.99

857.55

578.33

1395.28

1331.43

311.57

云南

4802.26

1127.95

827.84

570.46

822.41

1905.86

1350.65

381.38

西藏

5184.18

873.83

781.12

428.03

424.10

1278.00

514.44

527.74

陕西

5040.47

1224.95

1193.81

914.26

1100.51

1502.44

1857.60

500.42

甘肃

4182.47

1049.68

1139.85

660.48

874.05

1289.80

1158.30

413.37

青海

4260.27

1026.26

1055.15

723.23

854.25

1293.45

967.90

406.93

宁夏

4483.44

1265.75

1247.14

885.36

978.12

1637.61

1441.18

521.47

新疆

4537.46

1209.04

888.16

791.43

912.99

1377.67

1122.18

493.56

单位:元

——资料来源:2012年《中国统计年鉴》

2.2聚类分析

运用R对表1数据进行Q型聚类分析。

得到聚类图如下

从上图可以看出

a) 如果根据各地区城镇居民人均全年消费状况把31各地区分为2类,结果为:

第一类:上海

第二类:其他地区

这样分类不能突出城市之间的差距,只能说明上海市经济在我国最为发达。

b) 如果根据各地区城镇居民人均全年消费状况把31各地区分为3类,结果为:

第一类:上海

第二类:北京,天津,浙江,广东,江苏,福建、内蒙古

第三类:其他地区

这样分类只显示了经济较为发达地区,而没有对其他地区进行细分。

c) 如果根据各地区城镇居民人均全年消费状况把31各地区分为5类,结果为:

第一类:上海

第二类:西藏

第三类:其他地区

第四类:内蒙古

第五类:北京,天津,浙江,广东,江苏,福建。

上海是国际大都市,经济最为发达。西藏有其特殊的政治背景和特殊的地理位置。内蒙古位于我国北部边疆,地理位置较为特殊,故独自归为一类。北京,天津,浙江,广东,江苏,福建这些城市经济都比较发达,人均消费性支出高。这样分类较为合理。

2.3主成分分析

1)计算相关矩阵:

x1

x2

x3

x4

x5

x6

x7

x8

x1

1

0.359

0.735

0.784

0.383

0.874

0.827

0.826

x2

0.359

1

0.39

0.603

0.734

0.489

0.578

0.648

x3

0.735

0.39

1

0.829

0.583

0.807

0.802

0.784

x4

0.784

0.603

0.829

1

0.57

0.83

0.904

0.854

x5

0.383

0.734

0.583

0.57

1

0.537

0.623

0.623

x6

0.874

0.489

0.807

0.83

0.537

1

0.892

0.828

x7

0.827

0.578

0.802

0.904

0.623

0.892

1

0.853

x8

0.826

0.648

0.784

0.854

0.623

0.828

0.853

1

2)求相关矩阵的特征值

Comp.1

Comp.2

Comp.3

Comp.4

Comp.5

Comp.6

Comp.7

Comp.8

主成分的标准差

2.441

1.006

0.616

0.477

0.414

0.343

0.283

0.236

特征值

5.957

1.012

0.379

0.227

0.1715

0.118

0.0803

0.0555

方差贡献率

0.745

0.126

0.047

0.028

0.021

0.015

0.01

0.007

方差累计贡献率

0.745

0.871

0.918

0.947

0.968

0.983

0.993

1

3确定主成分

由所得结果可以看出前两个特征值的累计贡献率已达到87.1%,这说明前两个主成分已基本包含了全部指标具有的信息。因此,我们提取2个特征值。

碎石图

碎石图表现出从第三个主成分开始折线变得平坦,这与提取两个主成分相符。

4主成分得分

Comp.1

Comp.2

Comp.3

Comp.4

Comp.5

Comp.6

Comp.7

Comp.8

北京

-5.579

-0.765

-0.549

-0.1299

-0.4656

0.24

-0.172

-0.1896

天津

-2.971

-0.323

-1.033

-0.7241

0.51763

0.2143

0.2199

-0.3201

河北

1.5422

-0.243

-0.983

0.32017

-0.0597

-0.195

-0.149

-0.0974

山西

1.577

-0.292

-0.564

0.72531

-0.2152

-0.219

-0.512

0.0942

内蒙古

-1.792

-2.344

0.5618

0.53254

0.3647

-0.311

0.0813

-0.0086

辽宁

-0.516

-0.909

-0.461

-0.3777

0.35779

0.1466

0.0191

-0.1164

吉林

0.3748

-1.036

-0.794

0.23416

0.37148

-0.122

-0.238

0.1923

黑龙江

1.3295

-1.031

-0.461

-0.289

0.27707

0.0952

-0.053

-0.0066

上海

-7.463

1.3955

0.635

0.5405

0.77912

0.4265

-0.365

0.12029

江苏

-1.44

0.0623

0.9172

0.01831

-0.8051

0.7406

-0.182

0.19461

浙江

-3.792

-0.493

0.6792

-1.1665

-0.622

-0.687

-0.174

0.19153

安徽

0.99

0.5372

-0.872

-0.1703

0.35798

0.2013

0.0227

0.79671

福建

-1.346

1.3583

0.2285

0.45752

0.26466

-0.355

0.335

0.06211

江西

1.8816

0.7425

0.3598

0.63732

-0.2401

0.3163

-5E-04

0.0459

山东

-0.367

-0.619

0.0538

0.58858

-0.0965

-0.904

0.1602

0.09452

河南

1.0431

-0.751

0.3036

0.45981

-0.2018

0.1002

-0.134

-0.3724

湖北

1.1009

-0.376

0.232

-0.1313

-0.2301

0.1236

0.6762

0.4797

湖南

0.7544

0.4164

0.1027

0.30695

-0.337

-0.302

0.0373

-0.0402

广东

-3.6

2.1676

-0.515

-0.0052

-0.2854

-0.506

0.1066

-0.1029

广西

1.3763

1.2983

-0.459

-0.1326

-0.5897

0.0813

-0.007

-0.2868

海南

1.7265

1.8193

-0.89

-0.6272

0.08951

0.0594

0.3031

-0.1601

重庆

-0.383

-0.998

0.7091

0.04148

0.11765

0.0935

0.8738

-0.0986

四川

0.653

0.7267

0.5472

0.3385

0.18549

0.0782

0.2829

-0.2344

贵州

2.3654

1.1632

0.1849

0.54352

-0.4274

0.1686

-0.021

-0.0056

云南

2.0057

-0.133

0.7184

-0.9759

-0.4657

-0.219

-0.297

0.05263

西藏

3.4519

1.2807

1.352

-0.6567

1.08497

-0.217

-0.351

-0.0085

陕西

0.3037

-0.742

-0.174

-0.1923

-0.2396

0.6449

0.0633

0.17984

甘肃

2.103

-0.273

-0.277

-0.0813

0.14483

0.0103

-0.231

0.13856

青海

2.2551

-0.195

-0.096

-0.0546

0.16702

0.0739

-0.07

-0.2163

宁夏

0.6999

-0.709

-0.054

0.19828

0.06385

-0.056

-0.14

-0.036

新疆

1.7164

-0.737

0.5964

-0.2284

0.13717

0.279

-0.084

-0.3426

5)计算综合得分和各地区排名

根据加权法计算出的综合得分,其计算公式如下:

得出各地区主成分得分及排名如下:

Comp.1

Comp.2

C

排名

北京

-5.57946

-0.76519

-4.88048

2

天津

-2.97113

-0.32325

-0.58668

8

河北

1.54222

-0.24295

1.283032

21

山西

1.576995

-0.29221

1.305605

22

内蒙古

-1.79205

-2.34353

-1.87212

5

辽宁

-0.51622

-0.90853

-0.57318

13

吉林

0.374841

-1.03615

0.169978

9

黑龙江

1.329501

-1.03087

0.986799

20

上海

-7.46273

1.39549

-6.1766

1

江苏

-1.44028

0.06235

-1.22211

6

浙江

-3.7915

-0.49283

-3.31257

3

安徽

0.990036

0.537194

0.924288

19

福建

-1.34641

1.358265

-0.95372

7

江西

1.881636

0.742454

1.716238

26

山东

-0.36729

-0.61897

-0.40383

11

河南

1.043103

-0.75061

0.782675

17

湖北

1.100941

-0.376

0.886504

18

湖南

0.754378

0.41636

0.705301

16

广东

-3.59994

2.16758

-2.76255

4

广西

1.376258

1.298305

1.36494

24

海南

1.726491

1.819287

-0.47273

27

重庆

-0.38348

-0.99818

1.739964

10

四川

0.652956

0.726721

0.663666

15

贵州

2.365351

1.163187

2.190809

30

云南

2.005742

-0.13302

1.695215

25

西藏

3.451924

1.280706

3.136685

31

陕西

0.303669

-0.7417

0.151892

12

甘肃

2.102971

-0.27298

1.758007

28

青海

2.255122

-0.19533

1.899341

29

宁夏

0.699938

-0.70867

0.495422

14

新疆

1.716422

-0.73694

1.360218

23

由所得排名可以看出排名第一的是上海,第二是北京,第三是浙江。排名后三位的是青海,贵州,西藏

上海、北京、浙江等地区城镇居民消费性支出较高,这应该与这些地区的经济水平较为发达相关。

青海、贵州、西藏等地区城镇居民消费性支出偏低,这应该与这些地区经济水平较为落后相关,而经济水平落后则与当地的地理位置,人口密集度等相关。

其他消费性支出较为靠前的地区集中于我国东南部沿海地区,而我国中西部地区消费性支出中游偏下。

2.4结果对比

2010年通过主成分分析得到排名结果如下【2】

省市

Z

排名

省市

Z

排名

省市

Z

排名

上海

32.445

1

吉林

0.277

12

山西

-6.387

23

北京

22.165

2

宁夏

-1.778

13

新疆

-6.542

24

广东

14.099

3

陕西

-2.14

14

甘肃

-7.241

25

天津

11.732

4

四川

-2.675

15

江西

-7.325

26

浙江

11.623

5

湖南

-2.689

16

云南

-8.852

27

内蒙古

7.628

6

河南

-3.256

17

海南

-9.088

28

江苏

3.832

7

安徽

-3.634

18

贵州

-9.214

29

辽宁

3.122

8

河北

-4.394

19

青海

-9.292

30

福建

2.647

9

湖北

-4.765

20

西藏

-12.407

31

重庆

1.289

10

黑龙江

-5.027

21

 

 

 

山东

1.07

11

广西

-5.225

22

 

 

 

2011年排名结果如下

 

Comp.1

Comp.2

C

排名

上海

-7.46273

1.39549

-6.1766

1

北京

-5.57946

-0.76519

-4.88048

2

浙江

-3.7915

-0.49283

-3.31257

3

广东

-3.59994

2.16758

-2.76255

4

内蒙古

-1.79205

-2.34353

-1.87212

5

江苏

-1.44028

0.06235

-1.22211

6

福建

-1.34641

1.358265

-0.95372

7

天津

-2.97113

-0.32325

-0.58668

8

吉林

0.374841

-1.03615

0.169978

9

重庆

-0.38348

-0.99818

1.739964

10

山东

-0.36729

-0.61897

-0.40383

11

陕西

0.303669

-0.7417

0.151892

12

辽宁

-0.51622

-0.90853

-0.57318

13

宁夏

0.699938

-0.70867

0.495422

14

四川

0.652956

0.726721

0.663666

15

湖南

0.754378

0.41636

0.705301

16

河南

1.043103

-0.75061

0.782675

17

湖北

1.100941

-0.376

0.886504

18

安徽

0.990036

0.537194

0.924288

19

黑龙江

1.329501

-1.03087

0.986799

20

河北

1.54222

-0.24295

1.283032

21

山西

1.576995

-0.29221

1.305605

22

新疆

1.716422

-0.73694

1.360218

23

广西

1.376258

1.298305

1.36494

24

云南

2.005742

-0.13302

1.695215

25

江西

1.881636

0.742454

1.716238

26

海南

1.726491

1.819287

-0.47273

27

甘肃

2.102971

-0.27298

1.758007

28

青海

2.255122

-0.19533

1.899341

29

贵州

2.365351

1.163187

2.190809

30

西藏

3.451924

1.280706

3.136685

31

同样以衣着和食品为两个主要成分排名,比较2010年与2011年的结果,2011年浙江省名次跃居第三,内蒙古,江苏,福建的排名也有所上升,而排名靠后的地区大致没有变化。说明经济发达的地区,经济速度飞快,在不断发展,且地区之间的竞争激烈。而经济相对较落后的地区发展速度缓慢。我国应该注重这些相对较落后地区,通过相应政策刺激这些地区的消费,进而拉动经济。

3 总结

从聚类分析,主成分分析的分析结果看,尽管不同的分析方法所得的结果不同,但是上海、北京、天津、浙江、广东的城镇居民人均消费性支出都处于较高位置,而青海、甘肃、西藏的人均消费性支出处于低位。对比前一年的排名结果可知,我国各地区的人均消费性支出排名总体没有太大差异,北京、上海、浙江、广东依旧名列前茅,而青海、西藏、贵州等地依旧落后于其他地区。城镇居民的人均消费性支出直接反应地区的经济发展水平。消费拉动经济,促进消费,改善消费结构的关键在于提高居民的收入。其中教育文化消费在消费中占据很大的比例,要鼓励居民学习,引导居民正确的消费观,构建学习型社会,创造财富,拉动消费。我国应该采取相应政策,刺激消费,缩小地区间差距。

参考文献

[1] 2012年中国统计年鉴

[2]

附录

聚类分析

> one<-read.csv("E://11.csv")

> x1<-one[,2]

> x1

[1] 6905.51 6663.31 3927.26 3558.04 4962.40 5254.96 4252.85

[8] 4348.45 8905.95 6060.91 7066.22 5246.76 6534.94 4675.16

[15] 4827.61 4212.76 5363.68 4943.89 7471.88 5074.49 5673.65

[22] 5847.90 5571.69 4565.85 4802.26 5184.18 5040.47 4182.47

[29] 4260.27 4483.44 4537.46

> x2<-one[,3]

> x3<-one[,4]

> x4<-one[,5]

> x5<-one[,6]

> x6<-one[,7]

> x7<-one[,8]

> x8<-one[,9]

> X<-data.frame(x1,x2,x3,x4,x5,x6,x7,x8)

> d<-dist(scale(X))

> hc1<-hclust(d,'average')

> opar<-par(mfrow=c(2,1),mar=c(5.2,4,0,0))

> plclust(hc1,hang=-1);re1<-rect.hclust(hc1,k=5,border='red')

> par(opar)

主成分分析

> one<-read.csv("E://11.csv")

> x1<-one[,2]

> x1

[1] 6905.51 6663.31 3927.26 3558.04 4962.40 5254.96 4252.85 4348.45 8905.95 6060.91 7066.22 5246.76

[13] 6534.94 4675.16 4827.61 4212.76 5363.68 4943.89 7471.88 5074.49 5673.65 5847.90 5571.69 4565.85

[25] 4802.26 5184.18 5040.47 4182.47 4260.27 4483.44 4537.46

> x2<-one[,3]

> x3<-one[,4]

> x4<-one[,5]

> x5<-one[,6]

> x6<-one[,7]

> x7<-one[,8]

> x8<-one[,9]

> X<-data.frame(x1,x2,x3,x4,x5,x6,x7,x8)

计算相关矩阵:

> cor(X)

)求相关矩阵的特征值和主成分负荷

> PCA=princomp(X,cor=T)

> PCA

> PCA$loadings

确定主成分

> X.pr<-princomp(X,cor=T)

> summary(X.pr,loadings=T)

画碎石图

> screeplot(PCA,type='lines')

主成分得分

> PCA$scores

本文来源:https://www.2haoxitong.net/k/doc/51e7dc4416791711cc7931b765ce050877327516.html

《多元统计分析我国城镇居民消费性支出.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式