04. 选择个案与分割文件
在对数据做统计分析之前,需要对原始数据文件做一些初步处理和转换。例如,反向题的反向计分,各层面的加总,将某一连续变量分隔成不同区段组别,选择符合特定条件的个案,数据检核与缺失值处理等。
(一)选择个案
一、 选择满足条件的个案
有数据文件:
班级是分类变量,1代表1班,2代表2班;性别是分类变量,1代表男生,2代表女生。
若想选择甲班的学生操作,步骤如下:
1.【数据】——【选择个案】,
2. 选【如果条件满足】,点【如果】将左侧框中变量【班级】选入右边方框,并编辑选择条件【班级=1】
根据需要,这里的函数和运算符都可以使用。例如,
选择乙班男生:【班级=2 & 性别=1】;
选择数学或英文分数在90分以上的个案:
【数学 >= 90 | 英文 >= 90】
3. 点【继续】,回到“选择个案”窗口,勾选【过滤掉未选定的个案】,点【确定】,
未选定的个案的序号被加上斜线,同时多了变量“filter_$”,用来标记选定(=1)和未选定(=0)。
若要取消上述选择(全部数据纳入选择),【数据】——【选择个案】,勾选【全部个案】,【确定】。
二、 随机选择一定比例的个案样本
1.【数据】——【选择个案】,勾选【选择随机个案样本】,点【样本】,
2.【大约】后面填写10%,表示从全部个案中随机抽取10%的个案;【精确】,后面填写100和300,表示从前300个个案中随机抽取100个个案。
三、 根据序号范围选择个案
1. 【数据】——【选择个案】,勾选【基于时间或个案全距】,点【范围】,
2.输入100和200,表示选取序号从第100到第200个案。
(二)分割文件,分组描述统计
若想根据分类变量的不同水平值,将数据文件分成不同的子文件,并分别进行统计分析,就需要分割文件操作。
打开数据文件:
要实现“不同班级不同性别”分组描述数据,操作步骤:
1.【数据】——【拆分文件】,
2.选择【比较组】或【按组组织输出】,二者只是输出结果报表的呈现形式不同,前者是放在一个大表方便比较,后者是每组单放一个报表;
勾选【按分组变量排序文件】,若文件已经排好序,可勾选【文件已排序】。
分组方式框中,将左侧分类变量“班级、性别”,放入分组方式框中,
由于“班级=1,2”“性别=1,2”,故数据将分成2×2=4组:
班级=1,性别=1;
班级=1,性别=2;
班级=2,性别=1;
班级=2,性别=2.
更多分类变量和水平值,也是类似的。
3. 点【确定】,完成数据分割。再执行数据统计分析,将按分组分别进行;
若要取消上述分组,需要【数据】——【拆分文件】,勾选【分析所有个案,不创建组】,点【确定】。
4.【分析】——【描述统计】——【描述】,将要统计分析的定量变量“数学”、“英文”,从左侧框移入变量框,
根据需要可勾选【将标准化得分另存为变量】,【选项】可设置要描述统计的统计量,
5.点【确定】,注意此时是按【按组组织输出】做的分割,运行结果得到每组一个表格:
班级 = 甲班, 性别 = 男生
描述统计量a | |||||
N | 极小值 | 极大值 | 均值 | 标准差 | |
数学 | 13 | 42 | 97 | 67.77 | 14.635 |
英文 | 13 | 51 | 100 | 71.85 | 16.802 |
有效的 N (列表状态) | 13 | ||||
a. 班级 = 甲班, 性别 = 男生 | |||||
班级 = 甲班, 性别 = 女生
描述统计量a | |||||
N | 极小值 | 极大值 | 均值 | 标准差 | |
数学 | 11 | 57 | 94 | 77.64 | 11.784 |
英文 | 11 | 41 | 95 | 84.36 | 15.622 |
有效的 N (列表状态) | 11 | ||||
a. 班级 = 甲班, 性别 = 女生 | |||||
班级 = 乙班, 性别 = 男生
描述统计量a | |||||
N | 极小值 | 极大值 | 均值 | 标准差 | |
数学 | 15 | 71 | 100 | 86.47 | 9.523 |
英文 | 15 | 60 | 99 | 88.93 | 10.333 |
有效的 N (列表状态) | 15 | ||||
a. 班级 = 乙班, 性别 = 男生 | |||||
班级 = 乙班, 性别 = 女生
描述统计量a | |||||
N | 极小值 | 极大值 | 均值 | 标准差 | |
数学 | 11 | 55 | 87 | 68.82 | 10.962 |
英文 | 11 | 38 | 88 | 70.00 | 14.374 |
有效的 N (列表状态) | 11 | ||||
a. 班级 = 乙班, 性别 = 女生 | |||||
若前面分割数据时,改用【比较组】方式,得到的分组描述统计结果为:
描述统计量 | |||||||
班级 | 性别 | N | 极小值 | 极大值 | 均值 | 标准差 | |
甲班 | 男生 | 数学 | 13 | 42 | 97 | 67.77 | 14.635 |
英文 | 13 | 51 | 100 | 71.85 | 16.802 | ||
有效的 N (列表状态) | 13 | ||||||
女生 | 数学 | 11 | 57 | 94 | 77.64 | 11.784 | |
英文 | 11 | 41 | 95 | 84.36 | 15.622 | ||
有效的 N (列表状态) | 11 | ||||||
乙班 | 男生 | 数学 | 15 | 71 | 100 | 86.47 | 9.523 |
英文 | 15 | 60 | 99 | 88.93 | 10.333 | ||
有效的 N (列表状态) | 15 | ||||||
女生 | 数学 | 11 | 55 | 87 | 68.82 | 10.962 | |
英文 | 11 | 38 | 88 | 70.00 | 14.374 | ||
有效的 N (列表状态) | 11 | ||||||
本文来源:https://www.2haoxitong.net/k/doc/b0ff25a67e1cfad6195f312b3169a4517723e539.html
文档为doc格式