某店销售额与广告费的回归分析

发布时间:2016-06-01 22:49:45   来源:文档文库   
字号:

成绩评定表word/media/image1.gif

摘要

数理统计是具有广泛应用的数学分支而区间估计和假设检验问题在其中占有很重要的地位。对于正态总体期望和方差的区间估计和假设检验问题已有完备的结论;对于非正态总体期望和方差的区间估计和假设检验问题,在大样本的情况下,可利用中心极限定理转化为正态总体来解决。但实际问题中常常碰到非正态总体而且是小样本的情况,因此对它的区间估计和假设检验是一个值得研究的问题本文利用概率论与数理统计基本原理对小样本常用分布参数置信区间和假设检验问题 ,进行了深入研究提出了小样本常用分布参数的置信区间与假设检验的解决方法。

本文利用Excel中工具栏,做出拟合线,方差,残差,并利用所得数值对数据进行总体分析。

关键词:Excel方差;拟合曲线残差

某店销售额与广告费回归分析

一、 设计目的

为了更好的了解概率论与数理统计的知识,熟练掌握概率论与数理统计在实际问题上的应用,并将所学的知识结合Excel对数据的处理解决实际问题。本设计是利用一元线性回归理论对建立数学模型,并用Excel分析工具库中的回归分析软件进行解算。

二、 设计问题

各商店运行过程中,广告费都是不可避免。下面是在一个工商网站中获得某店《销售额与广告费收入支出分布》表,并着重对该店法人单位销售额与广告费建立模型,研究各店销售额与广告费之间的关系。

某店销售与广告费数据

三、 设计原理

本题是一道确定销售额与广告费关系的问题,首先做出改组数据的散点图,由图分析该数据属于线性回归问题,可以利用Excel解决这种类型的问题。数据的处理时通过使用“最小二乘法”做直线拟合,然后再进行一元线性回归。在整个过程中直接使用Excel进行数据处理,得出结论,然后对所得数据进行显著性分析.

四、 设计程序

为了研究这些数据中所蕴含的规律,将销售额看做因变量X,画出散点图(图一),可见这些点分布在一条直线附近,做出拟合直线(图),下面用Excel“分析工具库”中的“回归”工具,进行残差分析,接下来用matlab对其显著性进行检验。

1, 设计步骤

1.1画出散点图(图一)。

1.2单击图形显示拟合直线,单击“类型”,选定直线类型(图二)。单击“选项”,选定“显示公式”。“显示R平方值”(图)得到(图)。

1.3在【工具】菜单中选中【数据分析】,则会弹出【数据分析】对话框,然后在“分析工具”中选择“回归”选项,如图二所示。单击【确定】后,则弹出【回归】对话框,如图五。

1.4填写【回归】对话框。如图六所示,该对话框的内容较多,可以根据需要,选择相关项目。

在“Y值输入区域”内输入队因变量数据区域的引用,该区域必须有单列数据组成,如本题中广告费;在“X只输入区域”输入对自变量数据区域的引用,如本题中销售额额。“标志” :如果输入区域的第一行中包含标志项,则选中此复选框,本题中的输入区域包含标志项;如果在输入区域中没有标志项,则应清楚此复选框,Excel将在输出表中生成合适的数据标志。“置信度” :如果需要在汇总输出表中包含附件的置信度信息,则选中此复选框,然后在右侧的编辑框中,输入所要使用的置信度。Excel默认的置信度为95%,相当于显著性水平a=0.05。 “输出选项” :选择“输出区域”,在此输出对输出表左上角单元格的引用。“残差” :如果需要以残差输出表形式查看残差,则选中此复选框。“标准残差” :如果需要在残差输出表中包含标准残差,则选中此复选框。“残差图” :如果需要生成一张图表,绘制每个自变量及其残差,则选中此复选框。“线性拟合图” :如果需要为预测值和观察值生成和观测值生成一个图表,则选中此复选框。“正态概率图” :如果需要绘制正态概率图,则选中此复选框。填好【回归】对话框后,点击“确定” ,即可得到回归分析的结果,如图六所示。

1.5使用MATLAB软件做出点预测如图所示

2、 设计结果(图)

图一

图二

图三

图四

图五

图六

图七

图八

图九

x=[1231.3 786 60 137.7 114.3 0.71 1331.6 374.7 405.1 140.7 1403.1 277.7 163.8 156.7 95.9 824.7 104.6 76 596.7 1511 389.8 155 420.7 270.1 1272.1 1074.5 518.7 412.8]

y=[776.8 289 30 65.8 58.4 0.26 774.8 205 233 66.7 840.8 161.4 95 78 49.4 516.6 62 43 358.4 837 271.1 87 265.2 145.6 702.4 718.4 248.6 223.3]

polytool(x,y,1,0.05)

图十

3.结果分析

由图可知,该回归方程的截距是-7.4584,斜率为0.588,其回归方程表达式为y=0.588x-7.4584;根据回归统计结果,知决定系数word/media/image13.gif=0.9758,即相关系数r=0.987367,说明自变量与因变量之间有较高的相关性;根据方差分析的结果,F=970.7515,Significance F=1.59E-21<0.01,所以建立的回归方程非常显著。

在图四的第三个表中,除了列出了回归系数,还有标准误差等项目。其中“标准误差”表示的事对应回归系数的标准误差,其中偏回归系数的标准误差。“t Stat”就是t检验时的统计量t;如果多元线性回归,则可直接根据“t Stat”的大小,判断因素的主次顺序。“P-value”表示t检验偏回归系数不显著的概率,如果P-value<0.01,则可认为该系数对应的变量对试验结果影响非常显著(* *),如果0.01< P-value <0.05,则可认为该系数对应的变量对试验结果影响显著(*);对于常数项,P-value则表示常数项为零的几率。

五、 设计总结

通过对概率论与数理统计的这道实际问题的解决,不仅使我更加深刻的理解了概率论与数理统计的基础知识,而且使我对这些知识在实际中的应用产生了浓厚的兴趣,同时对我学习好概率论与数理统计这门课有很大帮助。在实现这道题的过程中我应用了Excel软件,学会了该软件的一些新的应用,更加熟练的操作在该软件进行一些数据上的处理。

参考文献

[1] 沈恒范.概率论与数理统计教程[M].第四版.北京:高等教育出版社,2003.4。(P218---P286)

[2] 王勇 田波平.概率论与数理统计.第二版.北京:科学出版社,2005(P186P194)

论文是张玉春老师指导下完成的。她严肃的科学态度,严谨的治学精神,精益求精的工作作风,深深地感染和激励着我。在此,我向张老师致以诚挚的谢意和崇高的敬意。

同时我还要感谢我的同学们,在论文设计中,他们给了我很多的建议和帮助。我还要感谢我的论文中被我引用或参考的文献的作者。

本文来源:https://www.2haoxitong.net/k/doc/84ba22e310661ed9ac51f36f.html

《某店销售额与广告费的回归分析.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式