多元统计分析课程设计题目

发布时间:2020-06-29 01:44:57   来源:文档文库   
字号:

课程设计题目

1. 下表给出了1991年我国30个省、区、市城镇居民的月平均消费数据,所考

察的八个指标如下(单位均为 /人)

X1 :人均粮食支出; X2 :人均副食支出;

X3 :人均烟酒茶支出; X4 :人均其他副食支出;

X5 :人均衣着商品支出; X6 :人均日用品支出;

X7 :人均燃料支出; X8 :人均非商品支出;

问题:

1)求样品相关系数矩阵R;

2)从R 出发做主成分分析,求各主成分的贡献率,及前两个主成分的累积贡献率;

3)求出前两个主成分并解释其意义.按第一主成分将30个省、区、市排序,结果如何?

表一 1991年我国30个省、区、市城镇居民的月平均消费数据

2. 下表是49位女性在空腹情况下三个不同时刻的血糖含量(用X1 ,X2 ,X3表示

和摄入等量食糖一小时后的三个时刻的血糖含量(用X4 ,X5 ,X6表示)的观测值(单位:mg/100ml.

问题:分别从样本协方差阵S和样本相关系数矩阵R出发做主成分分析,求主成分的贡献率和各个主成分. 在两种情况下,你认为应保留几个主成分?其意义如何解释?就此而言,你认为基于SR的分析那个结果更为合理?

表二 49位女性在空腹和摄入食糖后三个不同时刻的血糖含量

3. 考察1985年至2000年全国如下各价格指数:

X1 :商品零售价格指数;

X2 :居民消费价格指数;

X3 :城市居民消费价格指数;

X4 :农村居民消费价格指数;

X5 :农产品收购价格指数;

X6 :农村工业品零售价格指数;

观测数据见下表.

问题:

按年份用下列方法进行系统聚类分析,画出谱系聚类图,并给出聚为3

的结果.

a)最短距离法;(b)最长距离法;(c)类平均距离法;

表三 全国各年度各种价格指数

4. 考察1985年至2000年全国如下各价格指数:

X1 :商品零售价格指数;

X2 :居民消费价格指数;

X3 :城市居民消费价格指数;

X4 :农村居民消费价格指数;

X5 :农产品收购价格指数;

X6 :农村工业品零售价格指数;

观测数据见下表.

问题:

将数据标准化,再按年份用下列方法进行系统聚类分析,画出谱系聚类图,并给出聚为3类的结果.

a)最短距离法;(b)最长距离法;(c)重心距离法.

表四 全国各年度各种价格指数

5. 研究货运总量y(万吨)与工业总产值x1(亿元)、农业总产值x2(亿元)。居民非商品支出x3(亿元)的关系。数据见表。

1)计算出yx1x2x3的相关系数矩阵;

2)求y关于x1 x2x3的三元线性回归方程;

3)对回归方程作显著性检验;

4)对每一个回归系数作显著性检验;

5)如果有的回归系数没通过显著性检验,将其剔除,重新建立回归方程,再作回归方程的显著性检验和回归系数的显著性检验;

6)当x1 x2 x3的值为:68, 43, 2.5时,试对货运总量作出预测。

6. 某科学基金会的管理人员欲了解从事研究工作的数学家的年工资额y与他们的研究成果(论文、著作等)的质量指标x1、从事研究工作的时间x2,以及能成功获得资助的指标x3之间的关系。为此,按一定的设计方案调查了24位此类型的数学家,得数据见下表。

1)计算出yx1x2x3的相关系数矩阵;

2)求y关于x1 x2x3的三元线性回归方程;

3)对回归方程作显著性检验;

4)对每一个回归系数作显著性检验;

5)如果有的回归系数没通过显著性检验,将其剔除,重新建立回归方程,再作回归方程的显著性检验和回归系数的显著性检验;

6)假设某位数学家的关于x1 x2 x3的值为:5.1, 20, 7.2,试预测他得年工资额。

7. 在某地区抽取了14块岩石标本,其中7块含矿,7块不含矿。每块岩石测定了CuAgBi三种化学成分,数据如下:

1)生成SAS数据集;

2)用DISCRIM序进行判别分析(假定先验概率相等,两类样本协差阵相等);

3)在显著性水平02e31c4c2854d83481d16aae91514046.png下讨论已知类型的两组企业特征是否有显著差异;

4)写出距离判别的线性判别函数;

5)现在取一块岩石标本测得CuAgBi分别为:2.952.151.54,试判别这块岩石标本是含矿还是不含矿,并统计已知类别样品的错判概率。

8. 为了研究中小企业的破产模型,选定4个经济指标:X1总负债率(现金收益/总负债)、X2收益性指标(纯收入/总财产)、X3短期支付能力(流动资产/动负债)、X4生产效率性指标(流动资产/纯销售额)。

17个破产企业(1类)和21个正常运行企业(2类)进行了调查,调查资料下表,试对这些指标作判别分析。

1)生成SAS数据集;

2)用DISCRIM程序进行判别分析(假定先验概率相等,两类样本协差阵相等);

3)在显著性水平6393b58e6e0647308aef0f7e8ccd4a68.png讨论已知类型的两组企业特征是否有显著差异;

4)写出距离判别的线性判别函数;

5)利用后验概率对8个待判企业(*)进行判别归类,并统计已知类别样品的错判概率。

注:将下列图片数据转换成表格数据)

91中的1995年到2007年我国国民经济数据(数据来自于中国统计年鉴)通过典型相关分析来来找出邮电业和国民经济之间相互影响的内在规律,根据这个规律,给决策者提供一个当前如何发展邮电业的参考。采用如下指标来衡量我国各年份的邮电业

f9a3b8e9e501458e8face47cae8826de.png函件(亿件)

8f43fce8dbdf3c4f8d0ac91f0de1d43d.png快递(万件)

a4f66ba447cf765d4612169b07207e8d.png移动电话年末用户(万户)

aa51775bcd244abf06e709f0cd80e614.png固定电话年末用户(万户)

采用面的指标衡量我国各年份的经济(单位都是万亿)

f7b4a9a272539da17df482a540896746.png第一产业

89f771207ffb39300acb88dff8bae241.png工业

2b7f391586ea5d79f91c14d62c55faf9.png建筑业

63841b814ad3c04a4683ead814a2d483.png第三产业

1)生成SAS数据集;

2数据预处理;

3)在显著性水平6393b58e6e0647308aef0f7e8ccd4a68.png讨论已知类型的两组特征数据是否有显著差异;

4给出典型相关变量;

5出典型相关系数

6给决策者提供一个当前如何发展邮电业的参考


10.自199012月上海证券交易所和深圳证券交易所先后挂牌交易以来,中国证券市场走过了近十七个年头,证券市场已经成为中国经济生活的重要组成部分,是中国经济发展的重要推动力量。1搜集金融上市公司所公布的各年份的利润及资产负债数据试用因子分析对金融上市公司在一定时期经营绩效的优劣程度进行系统分析

1)生成SAS数据集;

2数据预处理;

3计算原始变量相关系数阵以及提取因子特征值、特征向量、各个因子的贡献率及累计贡献率;

4对结果进行分析根据各因子得分以及他们的排名,来评价一下这些上市公司的经营状况,给决策者提供一个当前企业运营状况的参考

word/media/image13.emf

word/media/image14.emf

(注:将下列图片数据转换成表格数据)

本文来源:https://www.2haoxitong.net/k/doc/26d5d87f0129bd64783e0912a216147917117eb5.html

《多元统计分析课程设计题目.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式