测验信度


测验信度

文章插图
测验信度【测验信度】测验信度又叫测验可靠性,是指某一测验在不同的时间或以等值的不同形式对同一群体施测所得结果的一致性或稳定性 。如果同一个人在一个测验上的分数毫无规律地摇摆不定,那它们对智力的测量就是没有价值的 。
基本介绍中文名:测验信度
外文名:test reliability
类别:测验
内容:测量一致性
影响因素:测验内容、被测对象和施测过程
套用学科:统计学
简单介绍一个好的测量工具必须稳定可靠,即多次测量结果要保持一致,否则便不可信 。但是,高信度并不是测验追求的最终目的,它只是使测验有效的一个必要条件 。影响因素信度的影响因素,主要来源于三个方面:即测验内容、被测对象和施测过程 。检测内容(1)测验的长度由于测验是测量的一个样本,因此取样的适当性必然影响到测验的信度 。如果测题数量太少,不能代表整个学习内容的全域,这样的测试必然带有偶然性,其信度不可能很高 。要提高信度,一般来说,增加长度是一个有效的方法 。当新增加的题目和原来的题目取自同一总体,即与原题目具有同质性时,增长测验才能改进信度 。增加测验长度的效果是遵循报酬递减率的,即当测验达到一定长度后,增长测验往往得不偿失,有时会引起学生的疲劳和反感而降低可靠性 。为了节省经费和时间,有时还需要把过长的测验适当缩短,而不使其对信度有大的损害 。总之,增加测验长度可以提高信度,但是测验长度须有一定限制,并非越长越好 。(2)测验难度测验的难度和信度没有简单的关係 。然而,如果测验对某团体过难或太易,则分数範围将缩小,信度也将降低 。这表明,要使信度达到最高,能产生最广分数分布的难度水平方为合格 。当测题难度过大,远远超出被试能力水平时,被试对许多项目作随机反应即瞎猜,则所有被试的总分接近随机分面,因此其信度极低 。反之,测验太易,几乎所有被试均能正确作答,则分数分布很集中,因此信度也很低 。施测对象即使一个测验经过精心编制,题目取样具有代表性,由于受测者动机和焦虑的变化,也会给测验信度带来影响,这是最难控制的因素 。由于应试动机不同,影响到他的注意力、持久性和情绪状态,表现为不同的焦虑水平,从而影响被试的测验成绩,使信度受到影响 。一般说来,恰当的动机,适度的焦虑会使人的兴奋性提高,注意力增强,提高反应速度,从而对测试成绩产生积极影响 。动机过强、焦虑过高都会使工作能力降低,注意力分散,思维变得狭窄而刻板,从而对测验成绩产生消极的影响;反之,动机过弱、焦虑太低,会导致被试对测验抱无所谓的态度,降低反应行为的效率 。适当的动机和焦虑水平是保证测验信度的必要条件,过强或过弱的动机和焦虑水平都不利于测验信度的提高 。施测过程测验的环境条件如通风、室温、採光等条件会影响到测试的稳定性,室内燥热、考场周围嘈杂,座位拥挤、考试秩序混乱等都有会导致测验信度下降 。主试错误理解指导语,不按规定严格施测,或故意製造紧张气氛等也会影响测验的信度 。估计方法重测信度对同被试用同一测验进行前后两次测试,以所得两分数的相关係数作信度指标的信度 。通过计算两次相同测验分数的相关验证测试对象的一致程度複本信度对同被试用两複本测验进行前后或连续的施测 。并以所得两分数相关係数为信度係数的信度 。分半信度对同被试测试同一个(在评分时人为的以前后或奇偶分成对等的两个小测的)测验所得两小测分数的相关係数为信度係数的信度 。评分者信度对同被试进行同一测验,但以多个评分者评出的分数的相关係数为信度係数的信度 。适应于不同的评分者的主观判断 。