统计学
费宇 石磊(主编)
第2章 练习题参考答案
2.1解:(1)首先将顾客态度分别用代码1、2、3表示,然后在数据文件的Varible View窗口Values栏定义变量值标签: 1代表“喜欢并愿意购买”;2代表“不喜欢”,3代表“喜欢并愿意购买”。操作步骤:
依次点击File→点击open→点击Data→打开数据文件ex2.1→点击Analyze→点击Descriptive Statistics→点击Frequencies→将“态度”选入Variable框→点击OK。输出结果如表2.1所示:
表2.1 30名顾客对某种产品满意程度的频数分布表
| Frequency | Percent | Valid Percent | Cumulative Percent | |
Valid | 1 喜欢并愿意购买 | 14 | 46.7 | 46.7 | 46.7 |
2 不喜欢 | 5 | 16.7 | 16.7 | 63.3 | |
3 喜欢但不愿意购买 | 11 | 36.7 | 36.7 | 100.0 | |
Total | 30 | 100.0 | 100.0 |
| |
(2)根据表2.1频数分布表资料建立的数据文件为
绘制条形图操作步骤:依次点击File→点击open→点击Data→打开数据文件,选中Summaries for groups of cases→单击Define→选中Other Summary function→将“人数”选入Variable(纵轴),将“态度分类”选入Category Axis(横轴)→点击OK。输出结果如图2.1所示:
图2.1 30名顾客满意程度分布条形图
绘制饼图操作步骤:依次点击File→点击open→点击Data→打开数据文件 of individual cases→点击Define→将“人数”选入 Slices Represent栏,将“态度分类”选入Variable栏→点击OK。输出结果如图2.2所示:
图2.2 30名顾客满意程度分布饼图
2.2解:首先列计算表如表2.2所示:
表2.2 120名学生英语成绩的均值、中位数、众数、偏态系数、峰度系数计算表
按成绩分组(分) | 组中值(分) | 学生数(个) | ||||
60以下 | 55 | 19 | 1045 | 5932.35 | -104824.61 | 1852250.83 |
60~70 | 65 | 30 | 1950 | 1764.87 | -13536.53 | 103825.18 |
70~80 | 75 | 42 | 3150 | 228.01 | 531.27 | 1237.86 |
80~90 | 85 | 18 | 1530 | 2736.52 | 33741.29 | 416030.16 |
90以上 | 95 | 11 | 1045 | 5484.92 | 122478.22 | 2734938.58 |
合 计 | — | 120 | 8720 | 16146.67 | 38389.64 | 5108282.61 |
(1)均值
表2.2中,分布次数最多的组是“40~50”组,这就是众数所在组; =60,中位数大约在第60位,可确定中位数也在“40~50”组。
众数
中位数
(2)首先计算标准差:
由计算结果可看出,偏态系数为正值,但与零的差距不大,说明120名大学生英语成绩为轻微右偏分布,成绩较低的同学占有一定的比例,但偏斜程度不大。
由计算结果可看出,峰度系数为负值,说明120名大学生英语成绩为平峰分布,成绩较低的同学占一定比例,但低成绩区域的集中程度并不很高。
2.3解(1)整理的组距数列如表
表2.3.1 连续60天计算机销售量频数分布表
按销售量分组(台) | 天数(天) | 比重(%) |
10~20 20~30 30~40 40~50 | 2 6 23 29 | 3.33 10.00 38.33 48.34 |
合 计 | 60 | 100.00 |
(2) 下面使用SPSS16.0绘制图形:
绘制直方图操作步骤:点击File→点击open→点击Data→读取数据文件ex2.3→点击Graphs→点击Histogram→将“销售量”选入Variable栏→点击OK。若选中 Display normal curve 选项,则在生成的直方图上还显示正态曲线。输出结果如图
图2.3.1 连续60天计算机销售量直方图
从图,连续60天中,销售量为40~50台的天数较多。
绘制简单箱线图操作步骤:点击File→点击open→点击Data→读取数据文件ex2.3→点击Graphs→点击Boxplot→选中simple,选中summaries of separate Variables→点击Define→将“销售量”选入Boxes Represent栏→点击Ok。输出结果如图
图2.3.2 连续60天计算机销售量箱线图
从图,下横线之外有两个点,它们分别是第59和第60个观测值,原始数据中可查到,这两天的销售量分别为19台和18台,它们是离总体观测数据较远的离群点。
绘制茎叶图操作步骤:点击File→点击open→点击Data→读取数据文件ex2.3→点击Analyze→点击Descriptive Statistics-Explore→将“销售量”选入“Dependent List”栏→点击Ok。输出结果如图
销售量(台) Stem-and-Leaf Plot
Frequency Stem & Leaf
2.00 Extremes (=<19)
1.00 2 . 2
5.00 2 . 56899
8.00 3 . 00223344
15.00 3 . 7788899
19.00 4 . 000
10.00 4 . 89
Stem width: 10
Each leaf: 1 case(s)
图2.3.3 连续60天计算机销售量茎叶图
(3)描述统计分析操作步骤:点击File→点击open→点击Data→读取数据文件ex2.3→点击Analyze→点击Descriptive Statistics→Descriptives→将“销售量”选入Variable栏→点击Options,选中 Mean(均值)、Std.(标准差)、Minimum(最小值)、Maximum(最大值)、Kurtosis(峰态系数)、Skwness(偏态系数),选中Variable list(变量顺序排列显示输出结果)→点击Continue→点击Ok。输出结果如表
表2.3.2 连续60天计算机销售量的描述统计量
Descriptive Statistics
N | Minimum | Maximum | Mean | Std. | Skewness | Kurtosis | |||
Statistic | Statistic | Statistic | Statistic | Statistic | Statistic | Std.Error | Statistic | Std.Error | |
XSHL 销售量(台) | 60 | 18 | 49 | 37.88 | 7.140 | -.879 | .309 | .422 | .608 |
Valid N (listwise) | 60 |
|
|
|
|
|
|
|
|
表,连续60天中计算机销售量的最小值为18台,最大值为49台,平均销售量为37.88台,标准差为7.14台;偏态系数为-0.879,表明计算机销售量为左偏分布,在连续60天中,销售量较高的天数占一定比例,具有一定的偏斜度;峰态系数为0.608,表明计算机销售量为尖峰分布,销售量较高的天数具有一定的集中度。
第3章 练习题参考答案
3.1 解:
操作步骤:
Analyze→Descriptive Statistics→Explore,将x选入Dependent List,在Statistics中选中Descriptives
输出结果
表3-1 Descriptives | ||||
Statistic | Std. Error | |||
x | Mean | 180.0500 | 11.68331 | |
95% Confidence Interval for Mean | Lower Bound | 156.8678 | ||
Upper Bound | 203.2322 | |||
5% Trimmed Mean | 172.3556 | |||
Median | 156.0000 | |||
Variance | 13649.967 | |||
Std. Deviation | 116.83307 | |||
Minimum | 24.00 | |||
Maximum | 510.00 | |||
Range | 486.00 | |||
Interquartile Range | 130.25 | |||
Skewness | 1.112 | .241 | ||
Kurtosis | .572 | .478 | ||
结果分析:
由表3-1可知,该超市每位顾客的平均花费金额的点估计180.0500,可信度为95%的区间估计为(156.8678,203.2322)(保留两位小数)。
3.2 解:
(1)先估计每位顾客平时的平均花费金额和周末的平均花费金额的置信区间
操作步骤:
Analyze→Descriptive Statistics→Explore,将x选入Dependent List,将顾客总体选入Factor List,在Statistics中选中Descriptives;
输出结果:
表3-2-1 Descriptives | |||||
顾客总体 | Statistic | Std. Error | |||
x | 总体一 | Mean | 159.8000 | 17.52340 | |
95% Confidence Interval for Mean | Lower Bound | 124.5854 | |||
Upper Bound | 195.0146 | ||||
5% Trimmed Mean | 150.3778 | ||||
Median | 116.0000 | ||||
Variance | 15353.469 | ||||
Std. Deviation | 123.90912 | ||||
Minimum | 24.00 | ||||
Maximum | 480.00 | ||||
Range | 456.00 | ||||
Interquartile Range | 139.75 | ||||
Skewness | 1.264 | .337 | |||
Kurtosis | .713 | .662 | |||
总体二 | Mean | 200.3000 | 15.09183 | ||
95% Confidence Interval for Mean | Lower Bound | 169.9718 | |||
Upper Bound | 230.6282 | ||||
5% Trimmed Mean | 192.8222 | ||||
Median | 177.5000 | ||||
Variance | 11388.173 | ||||
Std. Deviation | 106.71539 | ||||
Minimum | 55.00 | ||||
Maximum | 510.00 | ||||
Range | 455.00 | ||||
Interquartile Range | 109.25 | ||||
Skewness | 1.237 | .337 | |||
Kurtosis | 1.059 | .662 | |||
(2)再估计二者的差的置信区间
操作步骤:
Analyze→Compare means→Independent—Samples T test,将x选入Test Variable(s),将顾客总体选入Grouping Variable(s),在Define Groups中分别定义总体一和总体二。
输出结果:
表3-2-2 Independent Samples Test | ||||||||||
Levene's Test for Equality of Variances | t-test for Equality of Means | |||||||||
F | Sig. | t | df | Sig. (2-tailed) | Mean Difference | Std. Error Difference | 95% Confidence Interval of the Difference | |||
Lower | Upper | |||||||||
x | Equal variances assumed | 1.312 | .255 | -1.751 | 98 | .083 | -40.50000 | 23.12645 | -86.39369 | 5.39369 |
Equal variances not assumed | -1.751 | 95.892 | .083 | -40.50000 | 23.12645 | -86.40631 | 5.40631 | |||
结果分析:
表3-2-1是探索性分析的结果,可知每位顾客平时的平均花费金额的置信区间为(124.5854,195.0146),周末的平均花费金额的置信区间为(169.9718,230.6282)。表3-2-2是独立样本t检验的结果,Levene's Test for Equality of Variances为方差检验的结果,F=1.312,其P值为0.255<0.05,拒绝方差相等的原假设,认为两总体的方差不等,因此两总体的差的置信区间为(-86.40631,5.40631)
3.3 解:
操作步骤:
Analyze→Descriptive Statistics→Explore,将x选入Dependent List,在Statistics中选中Descriptives;
输出结果:
表3-3 Descriptives | ||||
Statistic | Std. Error | |||
x | Mean | 68.1875 | 1.75171 | |
95% Confidence Interval for Mean | Lower Bound | 64.4538 | ||
Upper Bound | 71.9212 | |||
5% Trimmed Mean | 68.1528 | |||
Median | 67.5000 | |||
Variance | 49.096 | |||
Std. Deviation | 7.00684 | |||
Minimum | 55.00 | |||
Maximum | 82.00 | |||
Range | 27.00 | |||
Interquartile Range | 6.50 | |||
Skewness | .290 | .564 | ||
Kurtosis | .482 | 1.091 | ||
结果分析:
表3-3是探索性分析的结果,由分析结果可知,该市成年男子体重置信度为95%的区间估计为(64.4538,71.9212)。
3.4 解:
由中心极限定理可知:近似的服从分布,于是有
(3.4)
该市所有家庭中安装了宽带上网的家庭的百分比为是分布的参数,,,,,代入式(3.4)求得的置信水平为95%的置信区间为(0.92,0.98)
第4章 练习题参考答案
4.1 解:
操作步骤:
进行单样本T检验,Analyze→Compare means→One—Samples T test,将x选入Test Variable(s),在Test Value中输入0.618。
输出结果:
表4-1 One-Sample Test | ||||||
Test Value = 0.618 | ||||||
t | df | Sig. (2-tailed) | Mean Difference | 95% Confidence Interval of the Difference | ||
Lower | Upper | |||||
x | 2.884 | 15 | .011 | .072813 | .01901 | .12662 |
结果分析:
根据表4-1中单样本T检验的结果,,按显著性水平无法拒绝的原假设,认为该厂生产的工艺品框架宽与长的比值符合黄金比率。
4.2 解:
H0:p>=50%
H1:p<50%
p=160/360=44.44%
Z===-2.11
这是一个单侧检验,-=-1.645
拒绝原假设,这个专家的论断不成立。
4.3 解:
:,即该厂家广告可信
:,即该厂家广告不可信
操作步骤:
进行单样本T检验,Analyze→Compare means→One—Samples T test,将x选入Test Variable(s),在Test Value中输入0.618。
输出结果:
表4-3-1 One-Sample Statistics | ||||
N | Mean | Std. Deviation | Std. Error Mean | |
x | 12 | 30905.8333 | 1888.37332 | 545.12642 |
表4-3-2 One-Sample Test | ||||||
Test Value = 30000 | ||||||
t | df | Sig. (2-tailed) | Mean Difference | 95% Confidence Interval of the Difference | ||
Lower | Upper | |||||
x | 1.662 | 11 | .125 | 905.83333 | -293.9818 | 2105.6485 |
结果分析:
由表4-3-1可知,样本均值为30905.8333,表4-3-2是单样本双侧T检验的结果,可知平均寿命95%的置信区间为(-293.9818,2105.6485),根据平均寿命大于0以及双侧检验和单侧检验的关系,95%的单侧置信区间应为(0,2105.6485),该置信区间与显著性水平0.05的本题的左边检验问题相对应,而X0=30000并不在置信区间(0,2105.6485)内,因此拒绝H0,认为该厂家的广告不可信。
4.4 解:
操作步骤:
进行独立样本T检验,Analyze→Compare means→Independent—Samples T test,将x选入Test Variable(s),将顾客总体选入Grouping Variable(s),在Define Groups中分别定义总体一和总体二。
输出结果:
表4-4 Independent Samples Test | ||||||||||
Levene's Test for Equality of Variances | t-test for Equality of Means | |||||||||
F | Sig. | t | df | Sig. (2-tailed) | Mean Difference | Std. Error Difference | 95% Confidence Interval of the Difference | |||
Lower | Upper | |||||||||
x | Equal variances assumed | 1.312 | .255 | -1.751 | 98 | .083 | -40.50000 | 23.12645 | -86.39369 | 5.39369 |
Equal variances not assumed | -1.751 | 95.892 | .083 | -40.50000 | 23.12645 | -86.40631 | 5.40631 | |||
结果分析:
表4-4是单样本T检验的结果。首先根据该表方差齐性检验的结果,,,即,无法拒绝方差齐性的原假设,认为两个总体的方差相等。在方差齐性的假设下,独立样本t检验结果为:,,,无法拒绝两个总体的平均花费金额相同的原假设,认为该超市每位顾客平时(周一至周五)的平均花费金额与周末(周六和周日)的平均花费金额是相同的。
4.5 解:
操作步骤:
进行配对样本T检验,Analyze→Compare means→Paired—Samples T test,将X1选入Test Variable1,将X2选入Variable2。
输出结果:
表4-5-1 Paired Samples Statistics | |||||
Mean | N | Std. Deviation | Std. Error Mean | ||
Pair 1 | 促销前销售量 | 34.9000 | 10 | 4.81779 | 1.52352 |
促销后销售量 | 38.6000 | 10 | 4.94862 | 1.56489 | |
表4-5-2 Paired Samples Correlations | ||||
N | Correlation | Sig. | ||
Pair 1 | 促销前销售量 & 促销后销售量 | 10 | .954 | .000 |
表4-5-3 Paired Samples Test | |||||||||
Paired Differences | t | df | Sig. (2-tailed) | ||||||
Mean | Std. Deviation | Std. Error Mean | 95% Confidence Interval of the Difference | ||||||
Lower | Upper | ||||||||
Pair 1 | 促销前销售量 - 促销后销售量 | -3.70000 | 1.49443 | .47258 | -4.76905 | -2.63095 | -7.829 | 9 | .000 |
结果分析:
由表4-5-1可知,促销前的平均销售量为34.9000,促销后的平均销售量为38.6000。由表4-5-2可知促销前后的相关系数为0.954,P=0.000<0.05,两者相关性显著。根据表4-5-3中配对样本t检验的结果,得到,,,在水平下,拒绝原假设,认为促销后销售量有明显的提高。
第8章 练习题参考答案
8.1解:(1)
(2)
8.2(数据文件为ex8.2)
解:(1)(小时)
(2)(小时)
(小时)
8.3解:
当置信度为90%时
当置信度为95%时
8.4解:(人)
8.5解:
第9章练习题参考答案
9.1解:(1)三种商品的销售量个体指数分别为:
A:;B:;C、
三种商品的销售价格个体指数分别为:
A:;B:;C、
(2)三种商品的销售量总指数为:
或
三种商品的销售价格总指数为:
;或
比较:由于拉氏指数与帕氏指数的同度量因素固定时期不同,因而对同一指数的计算结果也就不同。本题中,拉氏指数的计算结果大于帕氏指数。
9.2解:销售额指数
销售额变动绝对额:
销售量指数
销售量变动对销售额的影响额:
销售价格指数
销售价格变动对销售额的影响额:
以上三个指数之间的关系为:
相对数方面:139.71%=120.59%×115.85%
绝对数方面:27(万元)=14(万元)+13(万元)
计算结果表明:报告期与基期相比,由于三种商品的销售量增长20.59%,使销售额增加了14万元;又由于三种商品的销售价格上涨15.85%,使销售额增加了13万元。两个因素共同作用的结果,使销售额最终增长39.71%,共增加了27万元。
第3章 案例分析
1.两个社区的家庭月平均收入和购物月平均支出基本服从正态分布。设家庭月平均收入,购物月平均支出。
当未知时,的置信水平为的置信区间
而的置信水平为的置信区间为
查表知,,,
(1) 对于社区A,家庭月平均收入95%的置信区间:
用SPSS打开数据case-study 3,选择Analyze→Descriptive Statistics→Explore,将社区A家庭月平均收入(x1)选入Dependent List,在左下角Display 中点击Both,然后在中下方Statistics中选Descriptives和置信度(默认值为95%),最后点击Continue→OK,可以输出如下表3.5,
表3.5 社区A家庭月平均收入95%的置信区间
Descriptives | ||||
Statistic | Std. Error | |||
社区A家庭月平均收入 | Mean | 5360.0000 | 211.91065 | |
95% Confidence Interval for Mean | Lower Bound | 4934.1496 | ||
Upper Bound | 5785.8504 | |||
5% Trimmed Mean | 5377.7778 | |||
Median | 5500.0000 | |||
Variance | 2245306.122 | |||
Std. Deviation | 1498.43456 | |||
Minimum | 1500.00 | |||
Maximum | 8500.00 | |||
Range | 7000.00 | |||
Interquartile Range | 2000.00 | |||
Skewness | -.206 | .337 | ||
Kurtosis | .137 | .662 | ||
所以,家庭月平均收入期望值的置信水平为95%的置信区间 [4934.15,5785.85],
而经过计算可得,标准差95%的置信区间为。
同理,购物月平均支出使用SPSS软件操作如上,只是将社区A家庭购物月平均支出(y1)选入Dependent List,输出以下表3.6,
表3.6 社区A家庭月平均支出95%的置信区间
Descriptives | ||||
Statistic | Std. Error | |||
社区A家庭购物月平均支出 | Mean | 1176.0000 | 40.66388 | |
95% Confidence Interval for Mean | Lower Bound | 1094.2829 | ||
Upper Bound | 1257.7171 | |||
5% Trimmed Mean | 1177.7778 | |||
Median | 1200.0000 | |||
Variance | 82677.551 | |||
Std. Deviation | 287.53704 | |||
Minimum | 600.00 | |||
Maximum | 1800.00 | |||
Range | 1200.00 | |||
Interquartile Range | 400.00 | |||
Skewness | .090 | .337 | ||
Kurtosis | -.648 | .662 | ||
所以,购物月平均支出期望值的置信水平为95%的置信区间 [1094.28,1257.72],而经过计算可得,标准差95%的置信区间为。
(2) 对于社区B,家庭月平均收入95%的置信区间:
用SPSS打开数据case-study 3,选择Analyze→Descriptive Statistics→Explore,将社区B家庭月平均收入(x2)选入Dependent List,在左下角Display 中点击Both,然后在中下方Statistics中选Descriptives和置信度(默认值为95%),最后点击Continue→OK,可以输出如下表3.7,
表3.7 社区B家庭月平均收入95%的置信区间
Descriptives | ||||
Statistic | Std. Error | |||
社区B家庭月平均收入 | Mean | 5320.0000 | 217.01124 | |
95% Confidence Interval for Mean | Lower Bound | 4883.8996 | ||
Upper Bound | 5756.1004 | |||
5% Trimmed Mean | 5300.0000 | |||
Median | 5500.0000 | |||
Variance | 2354693.878 | |||
Std. Deviation | 1534.50118 | |||
Minimum | 2500.00 | |||
Maximum | 8500.00 | |||
Range | 6000.00 | |||
Interquartile Range | 2000.00 | |||
Skewness | .174 | .337 | ||
Kurtosis | -.414 | .662 | ||
所以,家庭月平均收入期望值的置信水平为95%的置信区间 [4883.90,5756.10],而经过计算可得,标准差95%的置信区间为。
同理,购物月平均支出用SPSS软件操作如上,只是将社区B家庭购物月平均支出(y2)选入Dependent List,可以输出如下表3.8,
表3.8 社区B家庭月平均支出95%的置信区间
Descriptives | ||||
Statistic | Std. Error | |||
社区B家庭购物月平均支出 | Mean | 1192.0000 | 45.70000 | |
95% Confidence Interval for Mean | Lower Bound | 1100.1624 | ||
Upper Bound | 1283.8376 | |||
5% Trimmed Mean | 1193.3333 | |||
Median | 1200.0000 | |||
Variance | 104424.490 | |||
Std. Deviation | 323.14778 | |||
Minimum | 400.00 | |||
Maximum | 1800.00 | |||
Range | 1400.00 | |||
Interquartile Range | 400.00 | |||
Skewness | .158 | .337 | ||
Kurtosis | -.269 | .662 | ||
所以,购物月平均支出期望值的置信水平为95%的置信区间 [1100.16,1283.84],而经过计算可得,标准差95%的置信区间为。
2.大样本条件下,总体比例的置信度近似为的置信区间为
由于,,查表知,。
(1)对于社区A,购物月平均支出占月平均收入的比例
所以,置信度为95%的置信区间为。
(2)对于社区B,购物月平均支出占月平均收入的比例
所以,置信度为95%的置信区间为.
3.大样本条件下,总体比例之差的置信度近似为的置信区间为
所以,两个社区购物月平均支出占月平均收入的比例之差置信度为95%的置信区间为。
4.综上,两个社区家庭的月平均收入和用于购物的月平均支出都比较接近,而且购物占收入的比例基本上在20%左右,比较稳定,说明可以考虑在两个社区附近建立一个方便人们日常生活的小规模购物中心。如果经过一段时间重新进行调查,发现社区居民购物占收入的比例持续上升,则可以考虑扩大购物中心的规模,增加销售商品的种类。
本文来源:https://www.2haoxitong.net/k/doc/13d2520600f69e3143323968011ca300a7c3f61c.html
文档为doc格式