河南大学
数学与信息科学学院
2012~2013学年第二学期
统计软件与模型
实验论文
题目 | 关于信用卡消费的调查分析 | ||
姓名 | 林松 | 学号 | 1022310157 |
年级 | 2010级 | 专业 | 金融信息 |
成绩 | 合分人 | ||
关于信用卡消费的调查分析
摘要:本文通过对消费者信用卡支付额和家庭人口、年收入数据利用统计学软件spss提供的散点图、相关系数分析、回归分析对数据进行了深入的分析然后把分析结果进行预测最后根据分析结果来进行控制调整。
关键词:信用卡、消费、年收入、人口和spss分析
引言
消费是我们生活的必须环节也是社会生产的重要环节是社会经济发展的出发点和归宿消费结构的状况反映了一个社会经济发展的水平如今随着我国经济、计算机和信息技术的蓬勃发展商业领域也越来越活跃消费者除了用现金和个人支票支付信用卡支付方式正越来越被广泛的采用。
1抽样调查
研究人员采用分层抽样的方法随机从收集的资料中抽取50位消费者的年收入、家庭人口和每年信用卡支付的金额数据用来作统计分析数据。我们可以通过消费者的消费特征来预测用户使用信用卡的支付金额的消费特征。
信用卡消费调查数据见下表
2 SPSS中的统计分析
SPSS是一个理论严谨内容丰富具有数据管理、统计分析、趋势研究、制表绘图、文字处理等功能的统计分析工具。其统计分析方法全面。本文主要利用其中的散点图、相关系数分析、回归分析对相关数据进行统计分析。
2.1散点图
散点图用于描绘测量数据的原始分布状态可以将两个过两个以上变量对应的值在坐标系中用点表示出来根据点的分布规律或离散程度判断这些变量之间的相关性及其规律。
2.2相关系数分析
(1)相关分析
相关分析是研究对象之间是否存在某种依存关系并对依存关系的现象探讨其相关方向以及相关程度是研究随机变量之间的相关关系的一种统计方法。
相关图形可以直观的判断现象之间大致呈何种关系的形式相关图是相关分析的重要方法。
相关系数是测量变量之间线性相关程度和方向的代表性指标参与分析的两个变量是对等的相关系数只有一个。
(2)偏相关分析
在实际的生活问题中,事物之间的联系比较复杂,一个结果往往是受多种因素影响的。偏相关分析是指在对其他变量影响进行控制的条件下,分析多个变量中两个变量的线性关系。
2.3线性回归分析
回归分析就是根据已得的试验结果,以及以往的经验来建立统计模型,并研究变量之间的相关关系,建立起变量之间关系的近似表达式,并由此对相应的变量进行预测和控制等。
回归分析按照经验公式可以分为线性回归和非线性回归,根据自变量的个数可以分为一元线性回归和多元线性回归。
3 应用SPSS对信用卡消费调查数据进行分析
原始数据:
年收入 | 家庭人口 | 3160.00 | 年收入 | 家庭人口 | 消费金额 |
30000.00 | 2.00 | 4016.00 | 42000.00 | 6.00 | 4412.00 |
52000.00 | 3.00 | 5100.00 | 62000.00 | 3.00 | 4705.00 |
32000.00 | 4.00 | 1862.00 | 64000.00 | 2.00 | 4156.00 |
31000.00 | 2.00 | 4743.00 | 22000.00 | 3.00 | 3578.00 |
50000.00 | 5.00 | 4071.00 | 29000.00 | 4.00 | 3891.00 |
55000.00 | 2.00 | 2732.00 | 39000.00 | 2.00 | 2973.00 |
37000.00 | 1.00 | 3350.00 | 54000.00 | 3.00 | 3720.00 |
40000.00 | 2.00 | 5573.00 | 27000.00 | 2.00 | 2920.00 |
54000.00 | 6.00 | 4763.00 | 26000.00 | 7.00 | 4603.00 |
66000.00 | 4.00 | 3862.00 | 61000.00 | 2.00 | 4273.00 |
48000.00 | 2.00 | 2582.00 | 30000.00 | 2.00 | 3068.00 |
30000.00 | 1.00 | 3587.00 | 22000.00 | 4.00 | 3075.00 |
34000.00 | 5.00 | 3606.00 | 46000.00 | 5.00 | 4821.00 |
50000.00 | 2.00 | 5038.00 | 66000.00 | 4.00 | 5148.00 |
67000.00 | 4.00 | 4826.00 | 67000.00 | 5.00 | 5346.00 |
41000.00 | 7.00 | 4127.00 | 55000.00 | 6.00 | 5371.00 |
23000.00 | 6.00 | 4111.00 | 52000.00 | 2.00 | 3891.00 |
51000.00 | 3.00 | 4208.00 | 21000.00 | 2.00 | 2449.00 |
25000.00 | 3.00 | 4220.00 | 44000.00 | 1.00 | 2996.00 |
48000.00 | 4.00 | 2478.00 | 37000.00 | 5.00 | 4172.00 |
27000.00 | 1.00 | 2515.00 | 62000.00 | 6.00 | 5678.00 |
33000.00 | 2.00 | 4215.00 | 21000.00 | 3.00 | 3622.00 |
65000.00 | 3.00 | 4964.00 | 55000.00 | 7.00 | 5302.00 |
63000.00 | 4.00 | 4220.00 | 42000.00 | 2.00 | 3020.00 |
25000.00 | 3.00 | 3160.00 | 35000.00 | 1.00 | 3121.00 |
石油信用卡每年支付额调查数据,来源中国数据网
3.1创建SPSS数据文件
将信用卡消费数据保存在xykxf.sav中,该数据文件的变量、类型及其标签图如图1所示:
图1
3.2绘制散点图
启动spss软件,读入数据后:
选择菜单“图形 →旧对话框→散点图”,选中变量,将变量“年收入”、“家庭人口”、“消费额”移到选项栏中,然后单击确定即可得到对应的散点图,如图二所示。
图二
从图中,可以明显的看出,家庭人口、年收入与信用卡消费金额成比较明显的线性关系。
3.3相关系数分析
通过变量之间的相关性分析,初步了解销售额与哪些因素有关。
通过选择菜单“分析→相关→偏相关”弹出如图所示对话框。
单击确定得到如图3所示的分析结果:
图3
从图中可以看出50位消费者的平均年消费额为3964.8元,家庭平均人口3人,年平均收入为43160元。
从图中可以看出年收入和消费金额的零阶相关系数为0.617,其检验结果为0.000远小于0.001,变量年收入和消费金额的一阶相关系数为0.742,其P值为0.000远远小于0.001,同理可分析得消费金额与家庭人口和年收入较为显著。
3.4回归分析,建立回归模型
建立回归模型,更深一步研究信用卡消费金额与年收入和家庭人口的关系,并利用预测结果来安排信用卡的营销策略。
选择菜单“分析→回归→线性”,则弹出如下图4所示的对话框:
图4
得到如下分析结果:
图5
图6
图7
图8
图9
根据3.3相关分析结果可知信用卡消费金额与年收入和家庭人口显著性很高,对模型拟合度进行检验,拟合度为0.795,可见模型的拟合度比较高。对模型进行方差分析,得sig值为0,说明该模型具有显著的统计意义。根据模型的回归分析结果和共线性检验结果可知,未标准化的拟合结果为:
Y=1395.332+0.032X1+355.135X2
常数项和自变量的sig值都为0,所以模型中不存在共线问题。由于检验结果是显著的,模型的拟合度很高,故模型可以用来预测。
4 结果分析
本文利用多种分析方法,最终建立模型得到经验公式,根据50名消费者的数据分析的结果我们得到经验公式Y=1395.332+0.032X1+355.135X2,根据公式我们很容易可以得到收入每增加1000元,信用卡消费金额增加32元,而人口每增加一人消费金额增加355.135元,由此可见家庭人口对信用卡支付金额影响比较大,故作为促销信用卡的一方,我们在推销信用卡时应向家庭人口比较多的人推荐。
参考文献:
(1) 谢龙汉,尚涛.2012.SPSS统计分析与数据挖掘 北京:电子工业出版社
(2) 邓吉贤,杨维权,等.2009.概率论及数理统计 北京:高等教育出版社
(3) 张晓峒.2007.计量经济学基础 天津:南开大学出版社
本文来源:https://www.2haoxitong.net/k/doc/c09ec290240c844768eaee3a.html
文档为doc格式