第四节 变量间的相关关系与统计案例
课时作业
A组——基础对点练
1.(2018·长春市模拟)下面四个残差图中可以反映出回归模型拟合精度较高的为( )
A.图1 B.图2
C.图3 D.图4
解析:根据残差图显示的分布情况即可看出,图1显示的残差点比较均匀地落在水平的带状区域中,且带状区域的宽度最窄,所以拟合精度较高,故选A.
答案:A
2.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
①y与x负相关且=2.347x-6.423;②y与x负相关且=-3.476x+5.648;③y与x正相关且=5.437x+8.493;④y与x正相关且=-4.326x-4.578.
其中一定不正确的结论的序号是( )
A.①② B.②③ C.③④ D.①④
解析:=x+,当b>0时,为正相关,b<0为负相关,故①④错误.
答案:D
3.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( )
A.-1 B.0 C. D.1
解析:所有点均在直线上,则样本相关系数最大即为1,故选D.
答案:D
4.已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是( )
A.=0.4x+2.3 B.=2x-2.4
C.=-2x+9.5 D.=-0.3x+4.4
解析:依题意知,相应的回归直线的斜率应为正,排除C、D.且直线必过点(3,3.5),代入A、B得A正确.
答案:A
5.经调查某地若干户家庭的年收入x(万元)和年饮食支出y(万元)具有线性相关关系,并得到y关于x的回归直线方程:=0.245x+0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
解析:x变为x+1,=0.245(x+1)+0.321=0.245x+0.321+0.245,因此家庭年收入每增加1万元,年饮食支出平均增加0.245万元.
答案:0.245
6.某工厂为了调查工人文化程度与月收入之间的关系,随机调查了部分工人,得到如下表所示的2×2列联表(单位:人):
由2×2列联表计算可知,我们有________以上的把握认为“文化程度与月收入有关系”.
附:K2=
解析:由表中的数据可得K2=≈6.109,由于6.109>5.024,所以我们有97.5%以上的把握认为“文化程度与月收入有关系”.
答案:97.5%
7.某炼钢厂废品率x(%)与成本y(元/吨)的线性回归方程为=105.492+42.569x.当成本控制在176.5元/吨时,可以预计生产的1 000吨钢中,约有________吨钢是废品(结果保留两位小数).
解析:因为176.5=105.492+42.569x,解得x≈1.668,即当成本控制在176.5元/吨时,废品率约为1.668%,所以生产的1 000吨钢中,约有1 000×1.668%=16.68吨是废品.
答案:16.68
8.(2018·合肥模拟)某品牌手机厂商推出新款的旗舰机型,并在某地区跟踪调查得到这款手机上市时间(x个月)和市场占有率(y%)的几组相关对应数据:
(1)根据上表中的数据,用最小二乘法求出y关于x的线性回归方程;
(2)根据上述回归方程,分析该款旗舰机型市场占有率的变化趋势,并预测自上市起经过多少个月,该款旗舰机型市场占有率能超过0.5%(精确到月).
附:=,=-.
解析:(1)由题意知=3,=0.1, iyi=1.92, =55,所以===0.042,=-=0.1-0.042×3=-0.026,
所以线性回归方程为=0.042x-0.026.
(2)由(1)中的回归方程可知,上市时间与市场占有率正相关,即上市时间每增加1个月,市场占有率约增加0.042个百分点.
由=0.042x-0.026>0.5,解得x≥13,故预计上市13个月时,该款旗舰机型市场占有率能超过0.5%.
B组——能力提升练
1.(2018·长沙市模拟)为了解某社区居民购买水果和牛奶的年支出费用与购买食品的年支出费用的关系,随机调查了该社区5户家庭,得到如下统计数据表:
根据上表可得回归直线方程=x+,其中=0.59,=-,据此估计,该社区一户购买食品的年支出费用为3.00万元的家庭购买水果和牛奶的年支出费用约为( )
A.1.795万元 B.2.555万元
C.1.915万元 D.1.945万元
解析:==2.50(万元),==1.50(万元),其中=0.59,=-=0.025,=0.59x+0.025,故年支出费用为3.00万元的家庭购买水果和牛奶的年支出费用约为=0.59×3.00+0.025=1.795万元.
答案:A
2.(2018·南昌模拟)设某中学的高中女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据样本数据(xi,yi)(i=1,2,3,…,n),用最小二乘法近似得到回归直线方程为=0.85x-85.71,则下列结论中不正确的是( )
A.y与x具有正线性相关关系
B.回归直线过样本点的中心(,)
C.若该中学某高中女生身高增加1 cm,则其体重约增加0.85 kg
D.若该中学某高中女生身高为160 cm,则可断定其体重必为50.29 kg
解析:因为回归直线方程=0.85x-85.71中x的系数为0.85>0,因此y与x具有正线性相关关系,所以选项A正确;由最小二乘法及回归直线方程的求解可知回归直线过样本点的中心(,),所以选项B正确;由于用最小二乘法得到的回归直线方程是估计值,而不是具体值,若该中学某高中女生身高增加1 cm,则其体重约增加0.85 kg,所以选项C正确,选项D不正确.
答案:D
3.已知数组(x1,y1),(x2,y2),…,(x10,y10)满足线性回归方程=x+,则“(x0,y0)满足线性回归方程=x+”是“x0=,y0=”的( )
A.充分不必要条件 B.必要不充分条件
C.充要条件 D.既不充分也不必要条件
解析:x0,y0为这10组数据的平均值,根据公式计算线性回归方程=x+的以后,再根据=- (,为样本平均值)求得.
因此(,)一定满足线性回归方程,但满足线性回归方程的除了(,)外,可能还有其他样本点.
答案:B
4.(2018·上饶模拟)有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如表所示的列联表:
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )
A.列联表中c的值为30,b的值为35
B.别联表中c的值为15,b的值为50
C.根据列联表中的数据,在犯错误的概率不超过0.05的前提下,能认为“成绩与班级有关系”
D.根据列联表中的数据,在犯错误的概率不超过0.05的前提下,不能认为“成绩与班级有关系”
解析:由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c=20,b=45,选项A,B错误.根据列联表中的数据,得到K2的观测值k=≈6.109>3.841,因此在犯错误的概率不超过0.05的前提下认为“成绩与班级有关系”.
答案:C
5.(2018·岳阳模拟)某考察团对全国10个城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程=0.66x+1.562.若某城市居民人均消费水平为7.675(千元),估计该城市人均消费占人均工资收入的百分比约为________.
解析:由=0.66x+1.562知,当y=7.675时,x=,故所求百分比为=≈83%.
答案:83%
6.为了研究男羽毛球运动员的身高x(单位:cm)与体重y(单位:kg)的关系,通过随机抽样的方法,抽取5名运动员测得他们的身高与体重关系如下表:
(1)从这5个人中随机地抽取2个人,求这2个人体重之差的绝对值不小于2 kg的概率;
(2)求回归直线方程=x+.
解析:(1)从这5个人中随机地抽取2个人的体重的基本事件有(74,73),(74,76),(74,75),(74,77),(73,76),(73,75),(73,77),(76,75),(76,77),(75,77).
满足条件的有(74,76),(74,77),(73,76),(73,75),(73,77),(75,77)6种情况,故2个人体重之差的绝对值不小于2 kg的概率为=.
(2)=176,=75,
=
==0.4,
=-=4.6,∴=0.4x+4.6.
本文来源:https://www.2haoxitong.net/k/doc/1280438cb207e87101f69e3143323968001cf43a.html
文档为doc格式