发新话题
打印

项目反应理论(Item Response Theory)简介

项目反应理论(Item Response Theory)简介

虽然项目反应理论的某些基本思想可以追溯到本世纪三四十年代,乃至比纳和西蒙的时代,但是人们普遍认为项目反应理论的兴起和发展首先应归功于F。M。洛德。1952年洛德在其博士论文《关于测验分数的一个理论》中,第一次对项目反应理论作了系统的阐述(当时他称其为项目特征曲线理论,后改名为项目反应理论)。通常将此看作是项目反应理论诞生的标志。由于洛德理论的数学复杂性,以及人们对理论本身的怀疑,因而这一新型的测量理论在当时并没有引起人们的关注。洛德本人在此后10多年中也未能在项目反应理论上取得多大进展。直到1965年洛德通过大规模的调查研究,证实了他所提出的项目反应理论的假设与现实生活中的测验问题相符,由此而引发项目反应理论的研究和应用。值得一提的是,正当洛德苦于验证其假设的同时,丹麦数学家G。拉彻于1960年独立地提出了含有一个参数的“样本无关”的心理测验模型,这就是以后项目反应理论中重要的单参数模型。

此后,项目反应理论获得了迅速发展。1968年洛德和诺维克在伯恩波姆的名著《心理测验分数的统计理论》中以四章的篇幅详细地阐述了项目反应理论中具有二、三参数的常态卵形模型和逻辑斯蒂模型的数学问题,至此,构成了项目反应理论的基本体系。在70~80年代,项目反应理论吸引了众多的教育和心理测验学者,从而使得项目反应理论取得了突破性进展。这一方面表现在一系列项目反应理论问题的专辑的发表,例如,洛德《项目反应理论在实际测验问题中的应用》(1980年版),C。L。赫林、F。德雷斯哥和C。K。帕森斯《项目反应理——在心理测量中的应用》(1983年版),R。汉布尔顿和H。斯沃米纳塞《项目反应理论:原理和应用》(1985年版);美国《教育测杂志》(JEM)于1977年秋夏季号刊登了“潜在特质理论应用”专辑,共有六篇研究报告,美国《应用心理测量》杂志于1982年秋季号发表了“项目反应理论和应用中的进展”专辑,另一方面,表现为项目反应理论在技术上和应用上的进展。早先困扰项目反应理论的数学模型复杂性,在近20多年的计算机技术协助下,得到了较好的解决,先后产生了计算机程序BISCA和LOGIST,它们都较成功地实现了项目反应模型的参数估计,为项目反应理论在实践中的应用扫清的障碍。目前,美国大多数教育行政机构、考试服务机构都进行项目反应理论的研究或应用,甚至美国国家行政事务委员会还将采用项目反应理论的应用成果定为一项官方政策。

除了美国之外,在加拿大、新西兰、瑞典和奥地利等国也对项目反应理论进行了广泛的研究和应用。近年来,在中国,项目反应理论也引起了人们的重视,有些学者在进行理论研究的同时,也尝试性地进行了应用。可以预见,随着项目反应理论研究队伍的不断壮大,项目反应理论将会越来越完善,越来越得到更广泛的应用。

一、基本理论假设。

目前,大多数的项目反应理论模型都假设在某一项目反应上只有一个单一人潜在特质起作用,并且可以采用数学模型来描述这一潜在特质水平与项目反应之间的函数关系。有鉴于此,可以归纳出项目反应理论的三条基本假设:

第一,一维性假设。指测验只测量被试的某一种能力(如计算能力),而可以忽略其他能力对测验结果的影响(如阅读能力)。也就是说,被试对测验结果的反应只受一种能力水平支配,而不受其他能力水平的束缚。极大多数的项目反应模型是基于这一假设之上的。也正是由于这一假设,项目反应理论受到了反对者的攻击,因为显而易见的是,在测验实践中完全满足一维性假设是较困难的。

第二,局部独立性。事实上,这是与一维性假设相等同的,它是指被试对测验中不同题目的反应在统计上是互相独立的。也就是说被试在测验中对某题目上的正确反应概率不依赖于他在其他题目上的正确反应概率。

第三,项目特征曲线形成的假设。这主要是指被试对项目所作反应的概率遵循一定的函数关系,这种函数关系可以用项目特征曲线形式表示出来。

二、项目反应模型。项目反应模型众多,对于两级评分系统而言,较常用的项目反应模型有以下几种:

第一,常态卵形模型。使用常态卵形模型来表示项目特征主要有以下几种:单参数常态卵形模型、双参数常态卵形模型、三参数常态卵形模型。

第二,逻辑斯蒂模型。与常态卵形模型相类似,逻辑斯蒂模型也主要有以下三种:单参数模型(又称拉希模型)、双参数模型、三参数模型。

三、信息函数。针对经典测验理论通常只能提供一种对所有被试而言而不管其能力水平变化的唯一的测量有效性指标,1986年伯恩鲍姆提出了使用信息函数来描述在每一种被测量的能力水平上一个测验或测题的测量有效性。因而在项目反应理论中信息函数有项目信息函数和测验信息函数两种。

四、应用

项目反应理论用来解决实际问题的首先一步是选择一种项目反应函数模型,并且获得对项目参数和能力水平θ的估计,这种估计可以利用计算机程序而完成。项目反应理论在实践中有较多的应用,下面简洁地描述一些。

1、测验构建。运用项目反应理论对测题库中的题目进行校正,尔后就可以从这些题目库中选择项目以构建成预先详细阐述了其测量属性的测验。

2.等值。等值对于那些编制了许多不同形式的测验而又希望在同一量表水平汇报测验分数的测验编制者而言,是一个值得研究的测量课题。

3.项目偏差。具有一维性的测验题目,对于该测验所实施的总体中的所有子体而言,也必须是测量了该同一特质,否则,可以认为该题目对某个具体子体有偏差。由于在项目反应理论中项目反应函数并没有依赖被试组而对项目进行校准,因而项目反应理论提供了一种寻找题目偏差的方法。

五、争议和趋势

项目反应理论是建立在一种数学模型基础上的,那么如何确定充分模拟被试与测验题目交互反应所需的必要成分的数目,则是测量学家们争论的问题。

提倡单参数项目反应模型的人认为,只需要一个人的参数(即能力水平θ)和项目的一个参数(即项目难度b)即能设计项目反应模型。而反对者认为,除了在模型中包含难度参数外,还需考虑项目的区分度参数和被试对项目猜测的参数,也即认为项目反应模型应是三参数的。这种争论表面上只是涉及各自对项目反应模型的假设,即前者认为,具有相同能力的被试对同样难度的测题有着同等成功的可能性,而后者认为结果并非如此。这似乎是项目反应理论的内部争论。实质上,这种争论涉及两者在测量基本原理上存在的分歧,这也可以进一步说是在测验编制和评定中使用项目反应理论方法的提倡者和反对者之间的差异。这里的中心问题是测量方法与测量内容的关系问题。

项目反应理论的支持者认为:科学通过寻求能促使经验产生的最简单方法之中实现了进步。当一个人回答测题时,这情形具有潜在的复杂性,许多方面因素影响了个体对该测题所作出反应的结果,因而不能不以一种可起作用的人的反应理论加以说明。为了达到一种可操作的状况,则必须发明一个简单思想,并尽力编好测题和测试个体,以便它们之间的相互反应受制于这一思想,最后将其统计结果输入到数据库中来看这种发明是否有用。

相反,项目反应理论的怀疑者认为:一个良好的教育成绩测验必须自身界定了被测量的目标。这意味着,不应允许评定的方法来决定测验的内容或更改测验中所暗示的目标的定义。从测验编制者的立场出发,目标的定义是不可侵犯的,他不能在定义上作手脚。通过那些对教育目标作出决定且负责的社会机构,将目标传递给测验编制者;并且测验编制者必须做的是,努力在他们组成的测验中尽可能清楚地、精确地体现目标的定义。

尽管存在着争议,但项目反应理论还是对教育和心理测量领域产生了极大的影响,并且朝着完善和成熟而不断前进着。由于目前还不可能彻底查明使用数据满足假设的精确度,因为对于表面上满足了假设的数据而言,只有当从项目反应理论中所作出的预言能独立地加以证实后,这才令人心安。同时,项目反应理论的应用通常比经典测验理论的相似应用在代价上更昂贵,并且许多情况下要借助于计算机工具。因而,如何较好地解决这两个问题,是项目反应理论自身发展的趋势之一。此外,项目反应理论发展的另一趋势就是如何在多级评分体制下构造项目反应模型。

TOP

发新话题