线性回归方程
一、解答题
1.为了适应高考改革,某中学推行“创新课堂”教学.高一平行甲班采用“传统教学”的教学方式授课,高一平行乙班采用“创新课堂”的教学方式授课,为了比较教学效果,期中考试后,分别从两个班中各随机抽取20名学生的成绩进行统计分析,结果如下表:(记成绩不低于120分者为“成绩优秀”)
1.由以上统计数据填写下面的列联表,并判断是否有以上的把握认为“成绩优秀与教学方式有关”?
2.现从上述样本“成绩不优秀”的学生中,抽取人进行考核,记“成绩不优秀”的乙班人数为,求的分布列和期望.
参考公式:,其中.
临界值表:
2.某学校为了了解学生使用手机的情况,分别在高一和高二两个年级各随机抽取了名学生进行调查.下面是根据调查结果绘制的学生日均使用手机时间的频数分布表和频率分布直方图,将使用手机时间不低于分钟的学生称为“手机迷”。
高一学生日均使用手机时间的频数分布表:
附:随机变量(其中为样本总量).
1.将频率视为概率,估计哪个年级的学生是“手机迷”的概率大?请说明理由.
2.在高二的抽查中,已知随机抽到的女生共有名,其中名为“手机迷”.根据已知条件完成下面的列联表,并据此资料你有多大的把握认为“手机迷”与性别有关?
3.某中学为了解中学生的课外阅读时间,决定在该中学的名男生和名女生中按分层抽样的方法抽取名学生,对他们的课外阅读时间进行问卷调查。现在按课外阅读时间的情况将学生分成三类:类(不参加课外阅读),类(参加课外阅读,但平均每周参加课外阅读的时间不超过小时),类(参加课外阅读,且平均每周参加课外阅读的时间超过小时)。调查结果如下表:
1.求出表中的值;
2.根据表中的统计数据,完成下面的列联表,并判断是否有的把握认为“参加课外阅读与否”与性别有关;
3.从抽出的女生中再随机抽取人进一步了解情况,记为抽取的这名女生中类人数和类人数差的绝对值,求的数学期望。
附:
4.2020年开始,国家逐步推行全新的高考制度.新高考不再分文理科,采用3+3模式,其中语文、数学、外语三科为必考科目,满分各150分,另外考生还要依据想考取的高校及专业的要求,结合自己的兴趣爱好等因素,在思想政治、历史、地理、物理、化学、生物6门科目中自选3门参加考试(6选3),每科目满分100分.为了应对新高考,某高中从高一年级1500名学生(其中男生900人,女生600 人)中,采用分层抽样的方法从中抽取名学生进行调查.
1.已知抽取的名学生中含女生20人,求的值及抽取到的男生人数;
2.学校计划在高一上学期开设选修中的“物理”和“地理”两个科目,为了了解学生对这两个科目的选课情况,对在1的条件下抽取到的名学生进行问卷调查(假定每名学生在这两个科目中必须选择一个科目且只能选择一个科目),下表是根据调查结果得到的列联表. 请将列联表补充完整,并判断是否有的把握认为选择科目与性别有关?说明你的理由;
3.在2抽取的选择“地理”的学生中按分层抽样再抽取5名,再从这5名学生中抽取2人了解学生对“地理”的选课意向情况,求2人中至少有1名男生的概率.
附:参考公式及数据
5.某部门随机调查89名工作人员的休闲方式是读书还是健身,得如下数据:
1.若随机抽查上面2名工作人员,那么抽到2男性且休闲方式都是读书的概率是多少?2.根据此数据,能否有99%的把握认为性别与休闲方式有关系.
,其中.
6.某市春节期间7家超市的广告费支出 (万元)和销售额(万元)数据如下:
1.若用线性回归模型拟合与的关系,求关于的线性回归方程;
2.用对数回归模型拟合与的关系,可得回归方程:,经计算得出线性回归模型和对数模型的分别约为和,请用说明选择哪个回归模型更合适,并用此模型预测超市广告费支出为万元时的销售额.参数数据及公式:
7.一只药用昆虫的产卵数与一定范围内的温度有关, 现收集了该种药用昆虫的组观测数据如下表:
经计算得:, , , ,线性回归模型的残差平方和, ,
其中分别为观测数据中的温度和产卵数,
1.若用线性回归模型,求关于的回归方程(精确到);
2.若用非线性回归模型求得关于的回归方程为,且相关指数
①试与中的回归模型相比,用说明哪种模型的拟合效果更好.
②用拟合效果好的模型预测温度为时该种药用昆虫的产卵数(结果取整数). 附:一组数据其回归直线的斜率和截距的最小二乘估计为,;相关指数.
8.《中华人民共和国道路交通安全法》第条的相关规定:机动车行经人行横道时,应当减速慢行;遇行人正在通过人行横道,应当停车让行,俗称“礼让斑马线”,《中华人民共和国道路交通安全法》第条规定:对不礼让行人的驾驶员处以扣分,罚款元的处罚.下表是某市一主干路口监控设备所抓拍的个月内驾驶员不“礼让斑马线”行为统计数据:
1.请利用所给数据求违章人数与月份之间的回归直线方程
2.预测该路口月份的不“礼让斑马线”违章驾驶员人数
3.交警从这个月内通过该路口的驾驶员中随机抽查了人,调查驾驶员不“礼让斑马线”行为与驾龄的关系,得到如下列联表:
能否据此判断有的把握认为“礼让斑马线”行为与驾龄有关?
参考公式:,
(其中)
9.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费(单位:千元)对年销售量(单位:)和年利润(单位:千元)的影响.对近年的年宣传费和年销售量数据作了初步处理,得到下面的散点图及一些统计量的值.
表中,.1.根据散点图判断,与哪一个适宜作为年销售量关于年宣传费的回归方程类型?(给出判断即可,不必说明理由)2.根据的判断结果及表中数据,建立关于的回归方程.3.已知这种产品的年利润与,的关系为.根据的结果回答下列问题:①年宣传费时,年销售量及年利润的预报值是多少?②年宣传费为何值时,年利润的预报值最大?附:对于一组数据, ,…,其回归直线的斜率和截距的最小二乘估计分别为,.
10.如今,中国的“双十一”已经从一个节日变成了全民狂欢的“电商购物日”.某淘宝电商分析近8年“双十一”期间的宣传费用(单位:万元)和利润(单位:十万元)之间的关系,得到下列数据:
请回答:
1.请用相关系数说明与之间是否存在线性相关关系(当时,说明与之间具有线性相关关系);
2.根据1的判断结果,建立与之间的回归方程,并预测当时,对应的利润为多少(精确到).
附参考公式:回归方程中中和最小二乘估计分别为, ,
相关系数.
参考数据:.
11.为了监控某种零件的一条生产线的生产过程,检验员每隔从该生产线上随机抽取一个零件,并测量其尺寸(单位:).下面是检验员在一天内依次抽取的个零件的尺寸
经计算得, ,
其中为抽取的第个零件的尺寸,。
1.求的相关系数,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小)
2.一天内抽检零件中,如果出现了尺寸在之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?
(ⅱ)在之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到)
附:样本的相关系数.
12.某网络营销部门为了统计某市网友2016年12月12日的网购情况,从该市当天参与网购的顾客中随机抽查了男女各30人,统计其网购金额,得到如下频率分布直方图:
若网购金额超过2千元的顾客称为“网购达人”,网购金额不超过2千元的顾客称为“非网购达人”
1.抽取的“网购达人”中女性占人,请根据条件完成上面的列联表,并判断是否有的把握认为“网购达人”与性别有关?
2.该营销部门为了进一步了解这名网友的购物体验,从“非网购达人”、“网购达人”中用分层抽样的方法确定人,若需从这人中随机选取人进行问卷调查.设为选取的人中“网购达人”的人数,求的分布列和数学期望
(参考公式:,其中)
13.经观测,某昆虫的产卵数与温度有关,现将收集到的温度和产卵数的组观测数据作了初步处理,得到如图的散点图及一些统计量表
表中,
1.根据散点图判断, ,与 哪一个适宜作为与之间的回归方程模型?(给出判断即可,不必说明理由)
2.根据的判断结果及表中数据.
①试求关于回归方程;
②已知用人工培养该昆虫的成本与温度和产卵数的关系为,当温度(取整数)为何值时,培养成本的预报值最小?
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为
14.下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图。
1.求与的相关系数
2.求关于的回归方程(系数精确到),并预测2018年我国生活垃圾无害化处理量。
参考数据:
参考公式:相关系数 回归方程 中斜率和截距的最小二乘估计公式分别为:
参考答案
一、解答题
1.答案:1. 补充的列联表如下表:
根据列联表中的数据,得的观测值为,
所以有以上的把握认为“成绩优秀与教学方式有关”2.的可能取值为, , , ,
,
,
,
,
所以的分布列为
解析:
2.答案:1.由频数分布表可知,高一学生是“手机迷”的概率为
由频率分布直方图可知,高二学生是“手机迷”的概率为
因为,所以高一年级的学生是“手机迷”的概率大.2.由频率分布直方图可知,在抽取的100人中,“手机迷”
有(人),
非手机迷有(人)
从而2×2列联表如下:
将列联表中的数据代入公式计算,得
因为,所以有90%的把握认为“手机迷”与性别有关.
解析:
3.答案:1.设抽取的人中,男、女生人数分别为,
则,
所以,
.2.列联表如下:
的观测值,
所以没有的把握认为“参加阅读与否”与性别有关.3.的可能取值为,
则,
,
,
,
∴.
解析:
4.答案:1.由题意得:,解得,男生人数为:人2.列联表为:
所以有的把握认为选择科目与性别有关.3.从25个选择地理的学生中分层抽样抽5名,所以这5名学生中有2名男生,3名女生,
男生编号为1,2,女生编号为a,b,c, 5名学生中再选抽2个,
则所有可能的结果为
至少一名男生的结果为
所以2人中至少一名男生的概率为
解析:
5.答案:1.
2.由列联表中的数据,得的观测值为,
因此,没有的把握认为性别与休闲方式有关系.
解析:
6.答案:1. 解:,
所以,关于的线性回归方程是2.∵对数回归模型更合适.当万元时,预测A超市销售额为万元.
解析:
7.答案:1.关于的线性回归方程为2.①由所给数据求得的线性回归方程为,相关指数为
因为,
所以回归方程比线性回归方程拟合效果更好.
②由①得当温度时,
又∵
∴(个).
即当温度时,该种药用昆虫的产卵数估计为个.
解析:由题意得,
∴
∴关于的线性回归方程为
8.答案:1.由表中数据知,
,
∴所求回归直线方程为2.由知,令,则人3.由表中数据得,
根据统计有的把握认为“礼让斑马线”行为与驾龄关
解析:
9.答案:1.由散点图可以判断,适宜作为年销售量关于年宣传费的回归方程类型.2.令,先建立关于的线性回归方程.由于,所以关于的线性回归方程为,因此关于的回归方程为.3.①由2知,当时,年销售量的预报值,年利润的预报值. ②根据2的结果知,年利润的预报值.所以当,即时,取得最大值.故年宣传费为千元时,年利润的预报值最大.
解析:
10.答案:1.由题意得.
又,
所以,
所以与之间具有线性相关关系.
因为2.因为,
所以回归直线方程为,
当时, ,即利润约为万元.
解析:
11.答案:1.由样本数据得的相关系数为.
由于,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小2.(i)由于,由样本数据可以看出抽取的第个零件的尺寸在以外,因此需对当天的生产过程进行检查.
(ii)剔除离群值,即第个数据,剩下数据的平均数为,这条生产线当天生产的零件尺寸的均值的估计值.,剔除第个数据,剩下数据的样本方差
,
这条生产线当天生产的零件尺寸的标准差的估计值为.
解析:
12.答案:1.
,
所以有的把握认为“网购达人”与性别有关2.由题可知的可能取值为:;
,
,
,
所以的分布列为:
的期望
解析:
13.答案:1.根据散点图判断,看出样本点分布在一条指数函数的周围,所以适宜作为与之间的回归方程模型2.①令,则,
,
,
②
时,培养成本的预报值最小
解析:
14.答案:1.由折线图中数据和附注中参考数据得, , , ,. 因为与的相关系数近似为,说明与的线性相关程度相当高,从而可以用线性回归模型拟合与的关系. 2.由及1得,.所以,关于的回归方程为:.将2018年对应的代入回归方程得:.所以预测2018年我国生活垃圾无害化处理量将约亿吨.
解析:
本文来源:https://www.2haoxitong.net/k/doc/f25b75f849d7c1c708a1284ac850ad02de80078f.html
文档为doc格式