基于项目反应理论的试题参数估计方法(精)

发布时间:2018-09-27 17:52:19   来源:文档文库   
字号:

5   1 贵阳学院学报 (自然科学版   (季刊  

Vol . 5  No . 1JOURNAL OF G U I Y ANG COLLEGE

2010 3 Natural Sciences (Quarterly

Mar . 2010

基于项目反应理论的试题参数估计方法

薛宝山

(山东胜利职业学院 , 山东   东营   257097

  :探讨了几种常用的基于项目反应理论 (I RT 的试题参数估计方法 , 并分析了每一种估计方法的优 缺点及各自的适用领域 , 为构建基于 I RT 的试题库系统提供理论参考 关键词 :项目反应理论 ; 试题库 ; 参数估计 ; 遗传算法

中图分类号 :TP3111131   文献标识码 :A    文章编号 :1673-6125(2010 01-03

I RT 2ba sed Param eter Eva on s

(Shandong 257097, China

Abstract:The p l ores several common I RT -based evaluati on methods of test questi ons and analyses ad 2vantages and of each method and its suitable app licati on range, which p r ovides the theoretical reference t o constructing I RT -based test questi on bank syste m.

Key words:I RT; test questi on bank; para meter evaluati on; genetic algorith m;

1  引言

在互联网技术迅速发展的今天 , 基于网络技术 的考试系统得到了广泛的应用 , 网络考试系统拓展

了考试的灵活性 , 显著降低了教育成本 作为网络 考试系统中的重要环节 , 试题库及其理论的研究和 应用也越来越广泛

试题库是严格遵循教育测量理论 , 在计算机系 统中实现的某个学科题目的集合 , 是在精确的数学 模型基础上建立起来的教育测量工具 。试题库系 统是进行计算机辅助教学的一种有利工具 , 是计算 机科学 教育测量理论相结合的产物 , 是未来计算 机辅助教学系统的一个重要的发展方向

2  理论基础

211  项目反应理论 (I RT

   项目反应理论是一种以试题参数为前提的理 , 它以被试个体潜能通过试题作答反应的可测 , 被试个体潜能与其试题上可见反应函数关系的 基本一致性 , 以及试题参数线性变换下的不变性为 理论假设 , 进而建立种种以被试个体在既定试题上 的作答反应参数来推断其潜在特性的数学模型 , 一定的数学模型来确定被试个体试题反应概率与 其潜在能力之间的函数关系

项目反应理论的质量指标即项目参数的估计 值与样本选择无关 , 对被试者能力水平的估计值与 测试试题无关 , 是一种建立于一套假定之上的能力 测量理论 考生的能力估计值除了测量误差外 , 会受所使用的测试种类的影响 , 它是试题独立 (I 2te m -independent 的能力估计值 , 其次 , 从不同群 体的考生估计得到的试题参数估计值 , 不受参与测 试的考生群体的影响 , 也就是说它是样本独立

87— 3收稿日期 :2009-12-30

作者简介 :薛宝山 (19  - , , 山东胜利职业学院 , 讲师 , 本科 , 研究方向 :软件工程。

(Sa mp le -independent 的试题参数估计值 。项目 反应理论还提供其测量的估计标准差 ((Standard err ors 和试题的信息函数 (Ite m inf or mati on func 2 ti on , 它可以用来作为评价能力估计值之精确度的 指标 , 优于经典测试理论中的信度 ” (Reliability 212  试题参数的估计

任何项目反应模型都可以统一描述成 P j

(Q =F (Q, a, b, c 的形式 。公式中中包含两类参数 , 一类是被试者的能力参数 , Q 来表示 , 只与被试 者有关 , 与题目参数无关 ; 另一类是项目的质量参 , a b c 标识 , 分别称为区分度参数 难度参数 和猜测参数 , 这些参数值都不能由直接测量得到 , 而必须通过被试者的反应数据进行估计来求出 在项目反应理论模型的研究过程中 , 人们提出 了多种理论模型 , 可以分为两大类 :静态模型与动 态模型 静态模型描述被测试者某一时刻的素质 能力水平不随时间变化 ; 动态模型则用来描述被试 者的内在素质 能力水平随时间变化的情况 比较成熟的是静态模型 ,

,

,

状分为正态卵型和逻辑斯蒂型等多种

213  逻辑斯蒂克模型 (Logistic Model

目前应用较广的是逻辑斯蒂克模型 (Logistic Model 在逻辑斯蒂克模型中 , 根据参数的不同 , 征函数可分为单参数、 双参数和三参数三种模式 :

单参数模式 :p (θ

1+e -D (θ-b

双参数模式 :p (θ

1+e -D a (θ-b

三参数模式 :p (θ =c +(1-c

1+e -D d (θ-b 其中 , D =11702为量表因子常数 ; θ为受测者 能力值 P (θ 表示能力为 θ的人答对此题目的概 ; a 为题目的区分度 , 即特征曲线的斜率 , 它的值 越大说明题目对受测者的区分程度越高 ; b 表示题 目的难度 , 即特征曲线在横坐标上的投影 ; c 表示 题目的猜测系数 , 即特征曲线的截距 , c 的值越大 , 说明不论受测者能力高低 , 都容易猜对本道题目 c =0为双参数模式 , c =0 a =1时为 单参数模式 通常 θ a b c 都是未知的 , 要根据被 试对项目的作答反应对 θ a b c 进行估计 , 一般采 用双参数 Logistic 0-1评分模型进行比较 。根 据具体问题 , 可出现几种情况 :第一是各项目参数 已知 , 估计被试能力 ; 第二是被试能力已知 , 估计项 目参数 ; 第三是同时估计被试能力和项目参数

3  试题参数的估计方法

311  极大似然估计法

在测试过程中 , 对测试样本进行如下统计 : 设第 j 道试题的区分度为 a (j , 难度系数为 b (j , 猜测系数为 c (j , 应试者在该试题的反应函数 :U j ={1:答对情况 ; 0:答错情况 }。该应试者参与了 n 道测试后 , 其能力计算的极大似然方程为 : L (θ =L (U │ θ, a, b, c =Π

n

j =1

exp (u

j 3 1n p j 3exp (1-u j 31n (1-p j

其中 θ为应试者的能力值 , Pj 为该应试者对第 j 题目的三参数 Logistic , Pj 为在该应试者能

L θ 两边求对数有 : =Π

n

j =1

(u

j 3

1n p j +Πn

j =1

(1-u

j

31n (1

-p

j

F (θ =ln L (θ , :

d θ

1n L (θ =F (θ =D 3Π

n

j =1

a j 3(u j -p j (p j -c j /p j 3(1-c j

通过解方程 F ′ (θ =0可求得能力参数 θ 极大似然估计值 根据此模型计算可以得知 , 如果 受测者答错了 , 能力的估计值就会降低 ; 如果受测 者答对了 , 能力的估计值就会提高

为了避免出现能力测试失败 , 提高计算方法的 收敛速度 , 使能力估计值快速趋于稳定 , 可以通过 两种算法对此极大似然方程进行求解 。一种是常 Ne wt on -Raphs on 迭代法 , 又称切线法 , 切线法 存在如下不足 :(1 方程的可行解中不能出现导数 为零的点 (不收敛点 ; (2 方程的收敛速度较慢 , 特别是当 θ(t +1 值趋近于方程的解时 , 收敛明显 减慢 ; (3 方程的解法中当不存在解时 , 缺少对实 际能力值的调整 ; (4 当方程出现多解时 , 缺少相 应的处理

第二种方法是中值法 , 可以解决切线法中存在 的收敛问题 , 中值法满足条件的可能性相对切线法 来说是较为容易 , 采用中值计算法 , 收敛速度快 , 现特殊情况时进行简单的调整 , 这在一定程度上保 证了最终的能力估计值曲线的平衡性

— 9 7—

312  基于神经网络的参数估计方法

运用神经网络进行参数估计的方法 , 通过将所 有考生在项目上的反应作为网络输入 , 将项目的 I RT 参数值作为网络输出 , 进行网络建模 , 并通过 锚题测验设计 , 提供训练样本以及训练网络 ; 训练 好的网络就可以对小样本和连续记分的 I RT 参数 进行估计 , 该方法可以得到较好的估计精度 在基 I RT 的题库建设中 , 连续记分模型已经不再采 , 取而代之的是更为实用的基于二值记分的三参 Logistic 模型 (3P L M 。所谓二值记分 , 即指考 生在项目上的作答要么正确 , 基于神经网络项目参 数估计方法也适用于二值记分方式

GRNN 是由 Specht 提出的一种前馈式监督型 神经网络 该网络的结构设计比较简单 , 它具有一 个径向基隐层和一个线性输出层 , 只有一个网络参 数需要调节 , 具有学习速度快 拟合能力强等优点 , 常用于解决回归问题 , 尤其非常成功地应用在函数 拟合中 Matlab

网络设计函数为 ne wgrnn (P, T, SP ,

样本 , T 为输出期望 , SP

其中 ,

练样本数 , , 且该 层网络输入函数和传递函数分别为 Euclidean 距离 函数和 Gaussian 函数 。线性层权值为训练样本的 输出期望值 , 该层的网络输入函数和传递函数分别 规则化为点积函数和线性函数

在区分度和猜测系数上 , 神经网络方法比数理 统计方法的估计误差要小 , 但在难度上 , 神经网络 方法的误差较大 ; 在一些情况下 , 神经网络方法的 优势并不明显 , 但是当去掉对项目参数的先验概率 分布的限制后 , 基于神经网络的参数方法才体现出 一定的优势 特别是在小样本测验情况下 , 去掉对 项目参数的先验概率分布的限制后 , 神经网络方法 的优势更加明显

313  基于遗传算法的参数估计方法

遗传算法 (Genetic A lgorithm , G A 是近些年发 展起来的基于生物自然选择和自然遗传理论的随 机化全局优化算法 。与其它方法相比 , 遗传算法 具有其它算法所没有的自适应性 全局优化性和隐 含并行性 , 在解决问题时具有很强的稳健性

遗传算法通过优胜劣汰选择个体 , 通过遗 传算子操作可产生新的优良结构的个体 , 采用与适 应值成比例的选择策略 , 可以使适应值高的个体具 有更多的生存机会 , 但也因此可能导致算法过早的 不成熟收敛等 。为了实现算法的自适应性与避免 早熟现象 , 可以用自适应的惩罚函数的方式调整适 应度函数 根据连续 k 代具有高适应度的个体满 足约束条件的情况调整惩罚因子 λ, 进而调整适应 函数为 :

λ=

λ3(1-δ

λ3(1+ε

λ

传统遗传算法采用的是二进制编码 , 现在应 用较多的是基于实数编码的遗传算法 (Real cod 2 ing Genetic A lgorithm , RG A 。这种遗传算法的过 程为 :在种群规模为 L 的父代种群基础上分别通 , 选择 杂交 , 如此反复 , 直到满足条件为止 。显然 , 进后的 RG A 实际搜索范围广 , 得到全局最优点的 机会也大

采用实数编码进行 I RT 3P LM 参数估计 , 是连续参数优化问题的自然描述 , 取消了编码 解码的过程 , 提高了算法的速度和精度 , 优点非 常明显

4  结束语

本文探讨了几种常用的基于项目反应理论的 试题参数估计方法 , 并分析了每一种估计方法的优 缺点 在建立试题库系统时 , 几种试题参数估计方 法可以结合使用 , 从而构建更加科学 高效 智能的 试题库系统

参考文献 :

[1]戴海崎 . 国内项目反应理论 (I RT 应用研究述评 [J ].考试研究 , 200511.

[2]李敏强 , 寇纪淞 , 林丹等 , 遗传算法的基本理论与应用 , 教育技术通讯应用开发 , 200417.

[3]习胜丰 , 何志国 , 基于 W E B 的自适应考试系统的研究 与设计 , 计算技术与自动化 , 200813.

— 0 8—

本文来源:https://www.2haoxitong.net/k/doc/6809cf40a31614791711cc7931b765ce05087ad8.html

《基于项目反应理论的试题参数估计方法(精).doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式