2.1.2& 2.1.3 系统抽样 分层抽样
(1)系统抽样适用于怎样的总体?
(2)分层抽样有何特点?
(3)分层抽样的步骤是什么?
(4)分层抽样中,每个个体被抽到的可能性是否相同?
1.系统抽样的概念
要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先规定的规则,从每一部分抽取一个个体,得到所需要的样本的抽样方法.
2.系统抽样的特点
(1)系统抽样适用于总体容量较大,且分布均衡(即个体间无明显的差异)的情况;
(2)系统抽样的本质是“等距抽样”,要取多少个样本就把总体分成多少组,每组中取一个;
(3)系统抽样是等可能抽样,每个个体被抽到的可能性都是.
[点睛] 系统抽样需注意的问题
(1)如果总体中个体数N正好被样本容量n整除,则每个个体被入样的可能性是,若N不能被n整除,需要随机剔除m个个体,m=N-n·(这里表示不超过的最大整数),此时每个个体入样的可能性仍是,而不是.
(2)剔除个体后需要对剩余的个体重新进行编号.
(3)剔除个体及第一段抽样都用简单随机抽样.
3.分层抽样的概念
在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
4.分层抽样的适用条件
分层抽样尽量利用事先所掌握的各种信息,并充分考虑保持样本结构与总体结构的一致性,这对提高样本的代表性非常重要.当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.
5.简单随机抽样、系统抽样、分层抽样的联系和区别
1.在10 000个有机会中奖的号码(编号为0 000~9 999)中,有关部门按照随机抽样的方式确定后两位数字是68的号码为中奖号码.这是运用哪种抽样方法来确定中奖号码的( )
A.抽签法 B.系统抽样法
C.随机数表法 D.其他抽样方法
解析:选B 由题意,中奖号码分别为0 068,0 168,0 268,…,9 968.显然这是将10 000个中奖号码平均分成100组,从第一组号码中抽取出0 068号,其余号码是在此基础上加上100的整数倍得到的,可见,这是用的系统抽样法.
2.某地区为了了解居民家庭生活状况,先把居民按所在行业分为几类,然后每个行业抽的居民家庭进行调查,这种抽样是( )
A.简单随机抽样 B.系统抽样
C.分层抽样 D.分类抽样
解析:选C 由于居民按行业可分为不同的几类,符合分层抽样的特点.
3.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人,为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本,则从上述各层中依次抽取的人数分别是( )
A.12,24,15,9 B.9,12,12,7
C.8,15,12,5 D.8,16,10,6
解析:选D 抽样比例为=,故各层中依次抽取的人数为160×=8(人),320×=16(人),200×=10(人),120×=6(人).故选D.
4.某单位有职工160人,其中业务员104人,管理人员32人,后勤服务人员24人,现用分层抽样法从中抽取一容量为20的样本,则抽取管理人员有( )
A.3人 B.4人
C.7人 D.12人
解析:选B 由=,设管理人员x人,则=,得x=4.
[典例] (1)某商场欲通过检查部分发票及销售记录来快速估计每月的销售金额,采用如下方法:从某本发票的存根中随机抽一张,如15号,然后按顺序将65号,115号,165号,…,发票上的销售金额组成一个调查样本.这种抽取样本的方法是( )
A.抽签法 B.随机数法
C.系统抽样法 D.以上都不对
(2)为了解1 200名学生对学校某项教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔k=________.
[解析] (1)上述抽样方法是将发票平均分成若干组,每组50张,从第一组抽出了15号,以后各组抽15+50n(n∈N*)号,符合系统抽样的特点.
(2)根据样本容量为30,将1 200名学生分为30段,每段人数即间隔k==40.
[答案] (1)C (2)40
系统抽样的判断方法
(1)首先看是否在抽样前知道总体是由什么组成,多少个个体.
(2)再看是否将总体分成几个均衡的部分,并在每一个部分中进行简单随机抽样.
(3)最后看是否等距抽样.
[活学活用]
某影院有40排座位,每排有46个座位,一个报告会上坐满了听众,会后留下座号为20的所有听众进行座谈,这是运用了( )
A.抽签法 B.随机数表法
C.系统抽样法 D.放回抽样法
解析:选C 此抽样方法将座位分成40组,每组46个个体,会后留下座号为20的相当于第一组抽20号,以后各组抽取20+46n,符合系统抽样特点.
[典例] (1)某初级中学领导采用系统抽样方法,从该校预备年级全体800名学生中抽50名学生做牙齿健康检查.现将800名学生从1到800进行编号,求得间隔数k==16,即每16人抽取一人.在1~16中随机抽取一个数,如果抽到的是7,则从33~48这16个数中应取的数是________.
(2)某装订厂平均每小时大约装订图书360册,要求检验员每小时抽取40册图书,检验其质量状况,请你设计一个抽样方案.
[解析] (1)因为采用系统抽样方法,每16人抽取一人,1~16中随机抽取一个数抽到的是7,所以在第k组抽到的是7+16(k-1),所以从33~48这16个数中应取的数是7+16×2=39.
答案:39
(2)解:第一步:把这些图书分成40个组,由于=9,所以每个小组有9册书;
第二步:对这些图书进行编号,编号分别为0,1,…,359;
第三步:从第一组(编号为0,1,…,8)的书中用简单随机抽样的方法,抽取1册书.比如说,其编号为k;
第四步:按顺序抽取编号分别为下面的数字的图书:k,k+9,k+18,k+27,…,k+39×9.这样总共就抽取了40个样本.
系统抽样的4个步骤
(1)编号(在保证编号的随机性的前提下,可以直接利用个体所带有的号码).
(2)分段(确定分段间隔k,注意剔除部分个体时要保证剔除的随机性和客观性).
(3)确定起始个体编号l(在第1段采用简单随机抽样来确定).
(4)按照事先确定的规则抽取样本(通常是将l加上k,得到第2个个体编号l+k,再将l+k加上k,得到第3个个体编号l+2k,这样继续下去,直到获取整个样本).
[活学活用]
某校高中二年级有253名学生,为了了解他们的视力情况,准备按1∶5的比例抽取一个样本,试用系统抽样方法进行抽取,并写出过程.
解:(1)先把这253名学生编号000,001,…,252;
(2)用随机数表法任取出3个号,从总体中剔除与这3个号对应的学生;
(3)把余下的250名学生重新编号1,2,3,…,250;
(4)分段.取分段间隔k=5,将总体均分成50段,每段含5名学生;
(5)以第一段即1~5号中随机抽取一个号作为起始号,如l.
(6)从后面各段中依次取出l+5,l+10,l+15,…,l+245这49个号.
这样就按1∶5的比例抽取了一个样本容量为50的样本.
[典例] (1)某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列哪种方法最合适( )
A.系统抽样法 B.简单随机抽样法
C.分层抽样法 D.随机数法
(2)分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层抽样为保证每个个体等可能抽样,必须进行( )
A.每层等可能抽样
B.每层可以不等可能抽样
C.所有层按同一抽样比等可能抽样
D.所有层抽个体数量相同
[解析] (1)总体由差异明显的三部分构成,应选用分层抽样.
(2)保证每个个体等可能的被抽取是三种基本抽样方式的共同特征,为了保证这一点,分层抽样时必须在所有层都按同一抽样比等可能抽取.
[答案] (1)C (2)C
1.使用分层抽样的前提
分层抽样的适用前提条件是总体可以分层、层与层之间有明显区别,而层内个体间差异较小.
2.使用分层抽样应遵循的原则
(1)将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;
(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.
[活学活用]
下列问题中,最适合用分层抽样抽取样本的是( )
A.从10名同学中抽取3人参加座谈会
B.某社区有500个家庭,其中高收入的家庭125个,中等收入的家庭280个,低收入的家庭95个,为了了解生活购买力的某项指标,要从中抽取一个容量为100的样本
C.从1 000名工人中,抽取100名调查上班途中所用时间
D.从生产流水线上,抽取样本检查产品质量
解析:选B A中总体个体无明显差异且个数较少,适合用简单随机抽样;C和D中总体个体无明显差异且个数较多,适合用系统抽样;B中总体个体差异明显,适合用分层抽样.
[典例] 某网站针对“2016年法定节假日调体安排”提出的A,B,C三种放假方案进行了问卷调查,调查结果如下:
(1)从所有参与调查的人中,用分层抽样的方法抽取n人,已知从支持A方案的人中抽取了6人,求n的值;
(2)从支持B方案的人中,用分层抽样的方法抽取5人,这5人中在35岁以上(含35岁)的人数是多少?35岁以下的人数是多少?
[解] (1)由题意得
=,
解得n=40.
(2)35岁以下的人数为×400=4,
35岁以上(含35岁)的人数为5-4=1.
分层抽样的步骤
(1)计算样本容量与总体的个体数之比.
(2)将总体分成互不交叉的层,按比例确定各层要抽取的个体数.
(3)用简单随机抽样或系统抽样在各层中抽取相应数量的个体.
(4)将各层抽取的个体合在一起,就得到所取样本.
[活学活用]
一个地区共有5个乡镇,人口3万人,其人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.
解:因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法.
具体过程如下:
(1)将3万人分为5层,其中一个乡镇为一层.
(2)按照样本容量的比例求得各乡镇应抽取的人数分别为60人、40人、100人、40人、60人.
(3)按照各层抽取的人数随机抽取各乡镇应抽取的样本.
(4)将300人合到一起,即得到一个样本.
[层级一 学业水平达标]
1.某机构为了了解参加某次公务员考试的12 612名考生的成绩,决定采用系统抽样的方法抽取一个容量为200的样本,那么从总体中随机剔除个体的数目是( )
A.2 B.12
C.612 D.2 612
解析:选B 因为12 612=200×63+12,系统抽样时分为200组,每组63名,所以从总体中随机剔除个体的数目是12.
2.下列抽样不是系统抽样的是( )
A.体育老师让同学们随机站好,然后按1~5报数,并规定报2的同学向前一步走
B.为了调查“地沟油事件”,质检人员从传送带上每隔五分钟抽一桶油进行检验
C.五一期间麦当劳的工作人员在门口发放50份优惠券
D.《唐山大地震》试映会上,影院经理通知每排(每排人数相等)28号观众留下来座谈
解析:选C C中,因为事先不知道总体,抽样方法不能保证每个个体按事先规定的规则入样,所以不是系统抽样.
3.某单位有职工100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上(包括50岁)的人,用分层抽样的方法从中抽20人,各年龄段分别抽取的人数为( )
A.7,5,8 B.9,5,6
C.7,5,9 D.8,5,7
解析:选B 由于样本容量与总体个体数之比为=,故各年龄段抽取的人数依次为45×=9(人),25×=5(人),20-9-5=6(人).
4.在抽样过程中,每次抽取的个体不再放回总体的为不放回抽样,那么分层抽样、系统抽样、简单随机抽样三种抽样中,为不放回抽样的有________个.
解析:这三种抽样都是不放回抽样.
答案:3
[层级二 应试能力达标]
1.下列抽样试验中,最适宜用系统抽样法的是( )
A.某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样
B.从某厂生产的2 000个电子元件中随机抽取5个入样
C.从某厂生产的2 000个电子元件中随机抽取200个入样
D.从某厂生产的20个电子元件中随机抽取5个入样
解析:选C A总体有明显层次,不适宜用系统抽样法;B样本容量很小,适宜用随机数法;D总体容量很小,适宜用抽签法.
2.为了调查某产品的销售情况,销售部门从下属的92家销售连锁店中抽取30家了解情况,若用系统抽样方法,则抽样间隔和随机剔除的个数分别为( )
A.3,2 B.2,3
C.2,30 D.30,2
解析:选A ∵92=30×3+2,
∴剔除2个个体,间隔为3.
3.某校做了一次关于“感恩父母”的问卷调查,从8~10岁,11~12岁,13~14岁,15~16岁四个年龄段回收的问卷依次为:120份,180份,240份,x份.因调查需要,从回收的问卷中按年龄段分层抽取容量为300的样本,其中在11~12岁学生问卷中抽取60份,则在15~16岁学生中抽取的问卷份数为( )
A.60 B.80
C.120 D.180
解析:选C 11~12岁回收180份,其中在11~12岁学生问卷中抽取60份,则抽样比为.
∵从回收的问卷中按年龄段分层抽取容量为300的样本,
∴从四个年龄段回收的问卷总数为=900(份),则15~16岁回收问卷份数为:x=900-120-180-240=360(份).
∴在15~16岁学生中抽取的问卷份数为360×=120(份),故选C.
4.交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为( )
A.101 B.808
C.1 212 D.2 012
解析:选B 甲社区驾驶员的抽样比例为=,四个社区驾驶员总人数的抽样比例为=,由=,得N=808.
5.一个总体中有100个个体,随机编号0,1,2,…,99.依编号顺序平均分成10个组,组号依次为1,2,3,…,10,现用系统抽样方法抽取一个容量为10的样本,规定如果在第一组随机抽取的号码为t,则在第k组中抽取的号码个位数字与t+k的个位数字相同,若t=7,则在第8组中抽取的号码应该是________.
解析:∵k=8,t=7,t+k=15,
∴在第8组中抽取的号码是75.
答案:75
6.已知标有1~20号的小球20个,若我们的目的是估计总体号码的平均值,即20个小球号码的平均数.试验者从中抽取4个小球,以这4个小球号码的平均数估计总体号码的平均值,按下面方法抽样(按小号到大号排序):
(1)以编号2为起点,系统抽样抽取4个球,则这4个球的编号的平均值为________;
(2)以编号3为起点,系统抽样抽取4个球,则这4个球的编号的平均值为________.
解析:20个小球分4组,每组5个.
(1)若以2号为起点,则另外三个球的编号依次为7,12,17,4球编号平均值为=9.5.
(2)若以3号为起点,则另外三个球的编号依次为8,13,18,4球编号平均值为=10.5.
答案:(1)9.5 (2)10.5
7.某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n的样本,如果采用系统抽样和分层抽样方法抽取,不用剔除个体;如果样本容量增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求得样本容量为________.
解析:总体容量N=36.
当样本容量为n时,系统抽样间隔为∈N*,所以n是36的约数;
分层抽样的抽样比为,求得工程师、技术员、技工的抽样人数分别为,,,所以n应是6的倍数,所以n=6或12或18或36.
当样本容量为n+1时,总体中先剔除1人时还有35人,系统抽样间隔为∈N*,所以n只能是6.
答案:6
8.某高级中学共有学生3 000名,各年级男、女生人数如下表:
已知在全校学生中随机抽取1名,抽到高二年级女生的概率是0.18.
(1)问高二年级有多少名女生?
(2)现对各年级用分层抽样的方法在全校抽取300名学生,问应在高三年级抽取多少名学生?
解:(1)由=0.18,得x=540,
所以高二年级有540名女生.
(2)高三年级人数为:
y+z=3 000-(487+513+540+560)=900.
∴×300=90,故应在高三年级抽取90名学生.
9.某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%,登山组的职工占参加活动总人数的,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同的年龄层的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取容量为200的样本.试求:
(1)游泳组中,青年人、中年人、老年人分别所占的比例;
(2)游泳组中,青年人、中年人、老年人分别应抽取的人数.
解:(1)设登山组人数为x,游泳组中,青年人、中年人、老年人各占比例分别为a,b,c,
则有=47.5%,=10%.
解得b=50%,c=10%.
故a=1-50%-10%=40%.即游泳组中,青年人、中年人、老年人各占比例分别为40%,50%,10%.
(2)游泳组中,抽取的青年人人数为200××40%=60;
抽取的中年人人数为200××50%=75;
抽取的老年人人数为200××10%=15.
本文来源:https://www.2haoxitong.net/k/doc/c9926f14bdd126fff705cc1755270722192e5902.html
文档为doc格式