正在进行安全检测...

发布时间:2024-01-14 14:06:50   来源:文档文库   
字号:
抽样的基本目的:用抽样指标来推算总体指标
抽样的原因1构成总体的元素之间有存在的差异2受到时间,人力,财力等客观条件的限制3进行数据测量时具有破坏性概率抽样:遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本
概率抽样与非概率抽样的区别:1概率抽样是根据概率的基本按照随机原则所进行的抽样,它能保证样本的代表性,可以进行推断统计。概率抽样主要分为等类型。2非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则。而是根据研究目的对数据的要求,采取某种方式从总体中抽出部分单位对其实施调查。非概率抽样主要分为方便抽样,判断抽样,自愿抽样,滚雪球抽样,配额抽样等类型。概率抽样的主要类型:简单随机抽样,分层抽样,整体抽样,系统抽样,多阶段抽样
分层抽样总体按其某种特征划分若干层次,各层采用简单随机或系统抽样的方法抽取元素组成样本适用不同子群之间差异很大,每个子群内部差异不大整群抽样:将总体中若干个单位合并为组,这样的组称为群。抽样时直接抽取群,然后对中选群中的所有单位全部实施调查适用不同子群差异不大,而每个子群内部异质性程度较大
自填问卷法:在没有调查员协助的情况下由被调查者自己填写,完成调查问卷。优点:1调查组织者管理容易2成本低,可进行大规模调查3对被调查者,可选择方便时间答卷,减少回答敏感问题压力。缺点:1返回率低2不适合结构复杂的问卷,调查内容有限3调查周期长4在数据搜集过程中遇见问题不能及时调整。
结构访问法:现场调查中预备调查者面对面,调查员提问,被调查者回答优点:1回答率高2数据质量高3在调查过程中遇见问题可以及时调整。缺点:1成本比较高2搜集数据的方式对调查过程的质量控制有一定难度3对于敏感问题,被访者会有压力。
条形图与直方图区别:1条形图使用图形的长度表示各类别频数的多少,其宽度固定,直方图用面积表示各组频数,矩形的高度表示每一组的频数或频率,宽度表示组距,2直方图各矩形连续排列,条形图分开排列,3条形图主要展示分类数据,直方图主要展示数值型数据。
设计统计表应注意哪些问题:1合理安排统计表的结构,如行标题列标题等位置应安排合理。统计表的横竖长度比例要适当,避免出现过高或过宽的表格形式。2表头一般应包括表号总标题和表中数据的单位等内容。总标题应简明确切的概括出统计表的内容,若表中的全部数据都是用同样的计量单位,可在表的右上角标明。若各变量的计量单位不同,则应放在每个变量后或单列出一一表明。3表中的上下两条横线一般用粗线,中间的其他线要用细线。统计表的左右两边不封口,列标题之间在必要时可用竖线分开,而行标题之间通常不用横线隔开,表中尽量少用横竖线。表中的数据一般右对齐,有小数点时以小数点对齐,而且小数点的位数应统一。对于没有数据的表格单元,一般用—表示,一张填好的统计表不应出现空白单元格。4使用统计表时,必要时可在表的下方加上注释,特别要注意数据的来源。
茎叶图:反映原始数据分布的图形特点:由茎和叶两部分构成,其图形是由数字组成,可以看出数据的分布形状及数据的离散程度
箱图一组数据的MAXMIN,中位数,两个四分位数这五个特征值绘制成特点主要用于反映原始数据分不到特征,还可以进行多组数据分布特征的比较测度集中趋势的主要指标:1众数是一组数据中出现次数最多的变量值。适用:分类数据。特点:数据量较大才有意义,不受极端值影响,有可能不存在。2中位数:一组数据排序后处于中间位置上的变量值。适合顺序数据。特点:不受极端值的影响。3四分位数是一组数据排序后处于25%75%位置上的值。适用:顺序数据。4平均数一组数据相加后除以数据的个数得到的结果。适用:数值型数据特点:易受极端值的影响
测度离散程度的主要指标,各自概念以及衡量何种指标的代表性:1异众比率,是指非众数的频数占总频数的比例。众数。2四分位差,上四分位数于下四方位数之差。中位数。3方差,各变量值与其平均数离差平方的平均数。平均数。
测度数据分布形状的指标:偏度=0对称分布,>0右偏分布,<0左偏分布。峰态=0正态分布,<尖峰分布。<0扁平分布点估计用样本统计量的某个取值直接作为总体参数估计值
区间估计:在点估计的基础上,给总体参数估计的一个区间范围,该区间通常由样本统计量加减估计的误差得到。置信水平:置信区间中包含总体参数真值次数所占的比例
影响置信区间宽度的因素:1样本量给定时,置信区间的宽度随置信系数的增大而增大2置信水平固定时,置信区间的宽度随样本量的增大而减小。
简述中心极限定理:1由林德伯格勒维证明2设从均值为μ、方差为σ^2;(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ^2/n的正态分布3阐明在大样本(n大于等于30)条件下,不论总体的分布如何,样本均值总是近似服从正态分布,只要总体方差有限。
95%的置信区间:用某种方法构造的所有区间中有95%的区间包含总体参数的真值。假设检验:对总体提出一假设,利用样本信息对该假设进行检验并做出决策
假设检验依据的基本原理:小概率原理。发生概率很小的随机事件再一次实验中是几乎不可能发生的(显著性水平a通常取0.050.01)一旦发生,我们就有理由拒绝原假设
举例说明假设检验的流程:例如新生儿童体重1提出原假设和备择假设H0u=3000H1u30002选择适当统计量检验,进行检验(用t3利用p值作出决策
列联表的基本作用:可以比较清晰地了解所收集的资料是按照哪些标志进行分类的,以便于在输出研究结果时,进行合理正确的分析。列联分析:利用列联表来研究两个分类变量的关系。方差分析的概念和基本思想通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。方差分析的基本思想是根据研究目的和设计类型,将总变异中的离均差平方和SS及其自由度分别分解成相应的若干部分,然后求各相应部分的变异;再用各部分的变异与组内(或误差)变异进行比较,得出统计量F值;最后根据F值的大小确定P值,作出统计推断。
SSASSESST的具体含义:SSA组间平方和是各组均值与总均值的误差平方和。SSE组内平方和是每个水平或组的各样本数据与其组均值的误差平方和。SST总平方和是全部观测值与总均值的误差平方和。
R^2R进行解释分析:R^2=SSA/SSTR^2=联合效应/总效应=SSR+SSC/SST散点图:由坐标及其散点形成的二维数据图作用:直观的看出变量之间的关系形态及关系强度线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。其表达形式为y=w'x+ee为误差服从均值为0的正态分布。

卡方检验的原假设是什么:根据检验结果写一段分析报告:如何识别箱图和茎叶图:


本文来源:https://www.2haoxitong.net/k/doc/61b4daf514791711cd79178c.html

《正在进行安全检测....doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式