。
。
内部文件,版权追溯
内部文件,版权追溯
第54讲 随机抽样
1.简单随机抽样
(1)定义:设一个总体含有N个个体,从中__逐个不放回地__抽取n个个体作为样本(n≤N),如果每次抽取时总体内的每个个体被抽到的机会都__相等__,就把这种抽样方法叫做简单随机抽样.
(2)最常用的简单随机抽样的方法:__抽签法__和__随机数法__.
2.系统抽样
(1)定义:在抽样时,将总体分成__均衡__的几个部分,然后按照__事先确定__的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样(也称为机械抽样).
(2)适用范围:适用于__元素个数__很多且__均衡的__总体抽样.
3.分层抽样
(1)定义:在抽样时,将总体__分成互不交叉__的层,然后按照__一定的比例__,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
(2)分层抽样的适用范围:当总体是由__差异明显的__几个部分组成时,往往选用分层抽样.
1.思维辨析(在括号内打“√”或“”).
(1)从100件玩具中随机拿出一件,放回后再拿出一件,连续拿5次,是简单随机抽样.( × )
(2)系统抽样适用于元素个数很多且均衡的总体.( √ )
(3)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.( × )
(4)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( × )
(5)某校即将召开学生代表大会,现从高一、高二、高三共抽取60名代表,则可用分层抽样方法抽取.( √ )
2.在抽样过程中,每次抽取的个体不再放回总体的为不放回抽样,在分层抽样、系统抽样、简单随机抽样三种抽样中,不放回抽样的个数为( D )
A.0 B.1
C.2 D.3
解析 三种抽样都是不放回抽样.
3.假设要考察某公司生产的500克袋装牛奶的三聚氰胺是否超标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,先将800袋牛奶按000,001,…,799进行编号,如果从随机数表第7行第8列的数开始向右读,则得到的第4个样本个体的编号是__068__(下面摘取了随机数表第7行至第9行).
87 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54
解析 由随机数表,可以看出前4个样本个体的编号是331,572,455,068,所以第4个样本个体的编号为068.
4.某工厂平均每天生产某种机器零件大约10 000件,要求产品检验员每天抽取50件零件,检查其质量状况,采用系统抽样方法抽取,若抽取的第一组中的号码为0010,则第三组抽取的号码为__0410__.
解析 根据系统抽样方法的特点,从10 000件零件中抽取50件零件,组距=200,当第一组中抽到的号码是0010时,第三组中抽到的号码是0010+(3-1)×200=0410.
5.某校高中生有900名,其中高一有400名,高二有300名,高三有200名,打算抽取容量为45的一个样本,则高三学生应抽取__10__名.
解析 抽取比例为=,所以200×=10(名),故高三学生应抽取10名.
一 简单随机抽样
简单随机抽样的注意点
(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否容易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.
(2)在使用随机数表时,如遇到三位数或四位数时,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字要舍去.
【例1】 (1)以下抽样方法是简单随机抽样的是( D )
A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2 709的为三等奖
B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格
C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见
D.用抽签方法从10件产品中选取3件进行质量检验
(2)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( D )
A.08 B.07
C.02 D.01
解析 (1)A,B项不是简单随机抽样,因为抽取的个体间的间隔是固定的;C项不是简单随机抽样,因为总体的个体有明显的层次;D项是简单随机抽样.
(2)由题意知前5个个体的编号为08,02,14,07,01.
二 系统抽样
解决系统抽样问题的两个关键步骤
(1)分组的方法应依据抽取比例而定,即根据定义每组抽取一个样本.
(2)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定了.
【例2】 (1)为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( C )
A.50 B.40
C.25 D.20
(2)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( B )
A.11 B.12
C.13 D.14
解析 (1)由=25,可得分段间隔为25.
(2)由系统抽样定义可知,所分组距为=20,每组抽取一个,因为包含整数个组,所以抽取个体在区间[481,720]的数目为(720-480)÷20=12.
三 分层抽样
进行分层抽样时应注意的几点
(1)分层抽样中分多少层,如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠.
(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同.
(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.
(4)抽样比==.
【例3】 (1)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( C )
A.90 B.100
C.180 D.300
(2)某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n的样本,其中甲种产品有18件,则样本容量n=( B )
A.54 B.90
C.45 D.126
解析 (1)设该样本中的老年教师人数为x,由题意及分层抽样的特点可得=,故x=180.
(2)依题意得×n=18,解得n=90,即样本容量为90.
1.某校数学教研组为了解学生学习数学的情况,采用分层抽样的方法从高一600人、高二780人、高三n人中,抽取35人进行问卷调查.已知高二被抽取的人数为13,则n=( B )
A.660 B.720
C.780 D.800
解析 由已知条件可知抽样比为=,从而=,解得n=720.故选B.
2.对于一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同的方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则( A )
A.p1=p2=p3 B.p1=p2<p3
C.p2=p3<p1 D.p1=p3<p2
解析 无论是采用简单随机抽样、系统抽样,还是分层抽样,保持的原则是每个个体被抽到的可能性是均等的.故选A.
3.做一次关于“手机垃圾短信”的调查,在A,B,C,D四个单位回收的问卷份数依次成等差数列,再从回收的问卷份数中按单位分层抽取容量为100的样本.若在B单位抽取20份问卷,则在D单位抽取的问卷份数是( C )
A.30 B.35
C.40 D.65
解析 由条件可设从A,B,C,D四个单位抽取的问卷份数依次为20-d,20,20+d,20+2d,则(20-d)+20+(20+d)+(20+2d)=100,∴d=10.∴在D单位抽取的问卷份数为20+2d=40.
4.月底某商场想通过抽取发票的10%来估计该月的销售总额.先将该月的全部销售发票存根进行编号:1,2,3,…,然后拟采用系统抽样的方法获取一个样本.若从编号为1,2,…,10的前10张发票存根中随机抽取一张,然后再按系统抽样的方法依编号顺序逐次产生第二张、第三张、第四张、……,则抽样中产生的第二张已编号的发票存根,其编号不可能是( D )
A.13 B.17
C.19 D.23
解析 根据系统抽样的特点可知,若第一组的编号为1,2,3,4,5,6,7,8,9,10,则第二组的编号为11,12,13,…,20,所以抽样中产生的第二张已编号的发票存根的编号不可能是23.
错因分析:当题目中出现需要被剔除的个体时,误认为被剔除的个体入选的概率与未被剔除的个体入选的概率不是相等的.
【例1】 从1 008名学生中抽取20人参加义务劳动,规定采用下列方法选取:先用简单随机抽样从1 008人中剔除8人,剩下1 000人再按系统抽样的方法抽取,那么在1 008人中每个人入选的概率( )
A.都相等且等于 B.都相等且等于
C.不全相等 D.均不相等
解析 在用简单随机抽样的方法抽取时,每个人不被剔除的概率是,再按系统抽样的方法每个人被抽取到的概率为,所以入选的概率是×=.
答案 B
【跟踪训练1】 (2018·河北衡水安平中学月考)李明所在的高二(5)班有51名学生,学校要从该班抽出5人开座谈会,若采用系统抽样法,需先剔除一人,再将留下的50人平均分成5个组,每组各抽一人,则李明参加座谈会的机会为( C )
A. B.
C. D.
解析 由题意知共有51名学生,学校要从该班抽出5人开座谈会,故每个人被抽到的概率是,故李明参加座谈会的概率为.故选C.
课时达标 第54讲
[解密考纲]了解简单随机抽样、分层抽样、系统抽样这三种抽样方法,单独考查时,一般是以选择题或填空题的形式进行考查.
一、选择题
1.某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是( D )
A.抽签法 B.随机数法
C.系统抽样法 D.分层抽样法
解析 由于男生、女生的差异比较明显,属于不同群体,所以采用分层抽样法.
2.现要完成下列3项抽样调查:
①从10盒酸奶中抽取3盒进行食品卫生检查;
②科技报告厅有32排,每排有40个座位,有一次报告会恰好坐满了听众,报告会结束后,为了听取意见,需要请32名听众进行座谈;
③高新中学共有160名教职工,其中一般教师120名,行政人员16名,后勤人员24名,为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.
较为合理的抽样方法是 ( A )
A.①简单随机抽样,②系统抽样,③分层抽样
B.①简单随机抽样,②分层抽样,③系统抽样
C.①系统抽样,②简单随机抽样,③分层抽样
D.①分层抽样,②系统抽样,③简单随机抽样
解析 对于①,个体没有差异且总数不多可用随机抽样法,是简单随机抽样;对于②,将总体分成均衡的若干部分指的是将总体分段,在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整数倍即为抽样编号,是系统抽样;对于③,个体有明显的差异,所以选用分层抽样.故选A.
3.为了调查观众对电影《捉妖记》的认识,一个网站在登录网站的所有网民中,收回有效帖子共10.4万份,其中持各种态度的人数统计在下表中.
为了了解网民具体的想法和意见,此网站打算采用分层抽样从中选出1 300份,则在很喜欢此电影的网贴中应抽取的份数为( A )
A.500 B.400
C.300 D.100
解析 应该首先确定抽样的比例,然后再根据各层人数确定各层要抽取的人数,因为40 000∶32 000∶24 000∶8 000=5∶4∶3∶1,所以×1 300=500,故抽取500份.
4.某中学采用系统抽样方法,从该校高一年级全体800名学生中抽50名学生做牙齿健康检查.现将800名学生从1到800进行编号.已知从33~48这16个数中取的数是39,则在第1小组1~16中随机抽到的数是( B )
A.5 B.7
C.11 D.13
解析 间隔数k==16,即每16人抽取一个人.
由于39=2×16+7,所以第1小组中抽取的数值为7.
5.将参加夏令营的600名学生编号为001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为 ( B )
A.26,16,8 B.25,17,8
C.25,16,9 D.24,17,9
解析 由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k(k∈N*)组抽中的号码是3+12(k-1).令3+12(k-1)≤300,得k≤,因此第Ⅰ营区被抽中的人数是25;令300<3+12(k-1)≤495,得<k≤42,因此第Ⅱ营区被抽中的人数是42-25=17.结合各选项知B项正确.
6.某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案.使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段.如果抽得的号码有如下四种情况:
①7,34,61,88,115,142,169,196,223,250;
②5,9,100,107,111,121,180,195,200,265;
③11,38,65,92,119,146,173,200,227,254;
④30,57,84,111,138,165,192,219,246,270.
关于上述样本的下列结论中,正确的是( D )
A.②③都不能为系统抽样
B.②④都不能为分层抽样
C.①④都可能为系统抽样
D.①③都可能为分层抽样
解析 ①②③符合分层抽样的比例,①③等距离抽样为系统抽样.
二、填空题
7.(2017·江苏卷)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取__18__件.
解析 应从丙种型号的产品中抽取
60×=18(件).
8.某报社做了一次关于“什么是新时代的雷锋精神”的调查,在A,B,C,D四个单位回收的问卷数依次成等差数列,且共回收1 000份,因报道需要,再从回收的问卷中按单位分层抽取容量为150的样本,若在B单位抽取30份,则在D单位抽取的问卷是__60__份.
解析 由题意依次设在A,B,C,D四个单位回收的问卷数分别为a1,a2,a3,a4,在D单位抽取的问卷数为n,
则有=,解得a2=200.
又a1+a2+a3+a4=1 000,且a1,a2,a3,a4成等差数列,
所以3a2+a4=1 000,
∴a4=400,∴=,解得n=60.
9.某企业三月中旬生产A,B,C三种产品共3 000件,根据分层抽样的结果,该企业统计员制作了如下的统计表格.
由于不小心,表格中A,C产品的有关数据已被污染看不清楚,统计员记得A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C产品的数量是__800__件.
解析 设C产品的数量为x,则A产品的数量为1 700-x,C产品的样本容量为a,则A产品的样本容量为10+a,由分层抽样的定义,可知==,∴x=800.
三、解答题
10.某初级中学共有学生2 000名,各年级男、女生人数如下表(单位:名).
已知在全校学生中随机抽取1名,抽到初二年级女生的概率是0.19.
(1)求x的值;
(2)现用分层抽样的方法在全校抽取48名学生,问应在初三年级抽取多少名?
解析 (1)∵=0.19,∴x=380.
(2)初三年级人数为y+z=2 000-(373+377+380+370)=500,现用分层抽样的方法在全校抽取48名学生,应在初三年级抽取的人数为×500=12.
11.一个城市有210家百货商店,其中大型商店有20家,中型商店有40家,小型商店有150家.为了掌握各商店的营业情况,要从中抽取一个容量为21的样本,按分层抽样方法抽取样本时,各类百货商店要分别抽取多少家?写出抽样过程.
解析 ∵21∶210=1∶10,
∴=2,=4,=15.
∴应从大型商店中抽取2家,从中型商店中抽取4家,从小型商店中抽取15家.抽样过程:
(1)计算抽样比=;
(2)计算各类百货商店抽取的个数:
=2,=4,=15;
(3)用简单随机抽样方法依次从大、中、小型商店中抽取2家、4家、15家;
(4)将抽取的个体合在一起,就构成所要抽取的一个样本.
12.某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果(人数分布)如下表(单位:人).
(1)用分层抽样的方法在35~50岁年龄段的专业技术人员中抽取一个容量为5的样本,将该样本看成一个总体,从中任取2人,求至少有1人的学历为研究生的概率;
(2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N个人,其中35岁以下48人,50岁以上10人,再从这N个人中随机抽取出1人,此人的年龄为50岁以上的概率为,求x,y的值.
解析 (1)用分层抽样的方法在35~50岁中抽取一个容量为5的样本,设抽取学历为本科的人数为m,
所以=,解得m=3,
所以抽取了学历为研究生的2人,学历为本科的3人,分别记作S1,S2;B1,B2,B3.
从中任取2人的所有基本事件共有10个:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2,B3),(S1,S2),(B1,B2),(B2,B3),(B1,B3),
其中至少有1人的学历为研究生的基本事件有7个:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2,B3),(S1,S2).
所以从中任取2人,至少有1人为研究生的概率为.
(2)依题意得=,解得N=78,所以35~50岁中被抽取的人数为78-48-10=20,所以==,解得x=40,y=5.所以x=40,y=5.
本文来源:https://www.2haoxitong.net/k/doc/cf7318cf5bcfa1c7aa00b52acfc789eb172d9ebf.html
文档为doc格式