纸笔智力测验
来源:医药卫生网作者:医药卫生网 阅读:11728
更多

纸笔智力测验(Paper -and -Pencil Intelligence Tests)与个体智力测验不同,纸笔智力测验可以团体进行,因而节省时间和费用。另外,这种测验能够迅速且客观地评分,因此,测验使用者就能在相对较短的时间里,获得大量的阐明问题的资料。

纸笔智力测验的应用性很广,适用于中小学校儿童、大学和研究生院的考生、应征入伍者、职业申请以及专业学校考生。人员的选择和分配需要客观的、切实可行的方法来对大量个体进行分类。

一、纸笔智力测验的起源

当人们使用"斯坦福-比纳智力量表"等个别智力测验来一次测验试几个被试时,这就导致了团体智力测验。法国于1905年编制了"比纳-西蒙量表",成功地用它来评定法国中小学校中智力落后儿童,而斯坦福大学心理学家L。M。推孟编制了第一个在美国受到普遍接受的比纳-西蒙量表的修订本,美国众多心理学家和教育工作者广泛使用推孟于1916年修订的"斯坦福-比纳量表。"推孟的一名研究生A。S。奥蒂斯为完成博士学位论文,把比纳量表中的一些测验项目设计为纸笔测验形式。奥蒂斯完成研究生学业之时,正值美国需要一种方法来对第一次世界大战中大量应片入伍者进行鉴别和分类。奥蒂斯与推孟、耶基斯和那时其他著名心理学家一起,编制了一种分类工具,从而构成第一个纸笔智力测验即"军队甲种测验"使用"《军队甲种测验》"的大规模"试验",证实纸笔测验方法的可行性。短期之内,纸笔智力测验在美国学校中广泛使用,教育工作者试图用它来解决学校入学人数大量增加的问题。商业上出版的用于教育的最早纸笔测验包括"奥蒂斯团体智力量表",以及由M。E哈格蒂在1929年设计的"全国智力测验"。

二、团体学习能力倾向测验

纸笔智力测验最初只是作为个体智力测验的替代物,用以提高效率,中然至今仍在这种意义上使用纸笔智力测验,但纸笔智力测验的若干种变式已经有了独自存在的价值,其中之一为预测学业成就的团体学习能力倾向测验。

学校中使用的早期纸笔智力测验一般包括一级或二级水平,具有若干个单独记时的分测验。这些测验通常注重词汇、常识和学校中教授的各种技能。许多早期智力测量看来与学校成就测量相重迭。当代的批评家认为,智力测验评定的内容很少趣出言语和数学成就;此外,智力测验和成就测验之间内容的重复意味着得自学习能力倾向测量的资料成为多余。使用"学习能力倾向"这个词,就是为了澄清早期出现的、现在仍然流行的关于所测能力的性质的一些错误概念。特别值得指出的一种流得的错误概念是:认为智力测验测量出生时固有的先天能力。

团体学习能力倾向测验一般包括多种水平,每一水平适用于相近的几个年级,这样就可以在那些水平上有效地测量出能力范围。适用于幼儿园至三年级的测验通常不要求学生阅读,刺激采用图片或几何图形。在四年级及以上则要求阅读,虽然阅读尚不致于影响到所评定的智力过程。

一种著名的学习能力倾向系列是A。S。奥蒂斯和R。T。伦农在1978年编制的"奥蒂斯-伦农学校能力测验"(OLSAT)。这个系列共有五级水平,其中两种初级水平适用于幼儿园至三年级,根据分类、类推、言语多项(包括执行指示、数量推理、言语理解)三个分测验而评出一个总分。适用于四年级至十二年级的三种水平包括若干不同类型的测题,采用循环的或螺旋的混合排列,这方便了测试和评分。测题类型包括:词汇类推、反义词、图片类推、图片系列、算术推理、数字系列、句子填充等。评出一个单一的解释分数。测验时间从40分钟至80分钟不等,依据测验水平形式而定。常模有多种形式。

另一个广泛使用的测验系列是桑代克和哈根在1978~1982年编制的"认知能力测"(CAT)。三个部分的测验可以分开使用,也可以综合使用,具有多种水平形式,适用于三年级至十二年级。

言语部分包括四个分测验:(1)词汇。在5个备择词中,找出一个最合适的词填在句子的空白处;(3)词汇分类。想一想3个刺激词为什么能归在一起,然后从5个备择词中选一个与它们同类的词;(4)词汇类推。根据前两个词的关系,从5个备择词中选出一个,使其和第三个词的关系与第一、二个词的关系相同。

数量包括三个分测验:(1)数量关系。如果第一项大于第二项则写A,反之写B,如果两者相等则写C;(2)数字系列。下面的数是按一定顺序排列的,从5个备择数字中选出一个,使其能排在这一数列中;(3)列出等式。安排下面的数字和运算符号,建立一个式子,然后从5个备择数中选一个,作为这个式子的运算结果。

图形部分包括三个分测验:(1)图形分类。3个刺激图形在某一方面有共同之处,从5个备择图形中选出与刺激图形相近的一个;(2)图形类推。根据前两个图形的关系,从5个备择图形中,哪个能用3个刺激小图形既不重叠又不剩余地合成。

每个部分测验评出一个单一年解释分数。依据编制者的观点,这个测验系列测量学业能力倾向和和借助社会文化的言语体系、数字体系和图形符号体系进行的抽旬推理能力。

另外,"认知能力测验"中还包括初级型测验,其中初级I型适用于幼儿园到二年级,初级II型适用于二至三年级。四个分测验是:口语词汇、关系概念、多得心智和数量概念。

这个测验1981年得出新的全国常模,以离差智商、百分等级、标准九等分数表示。

三、测验分数的解释

早期团体测验一般得出一个智龄,它可用来计算比率智商。目前测验通常提供按年龄的常态标准分数以及年龄百分等级和年级百分等级。智龄中然是早期测验的产物,但时常提供给想要一个关于认知发展的年龄相关测度的那些研究者。目前测量的标准化样组通常出自总数为10万或更多的经过仔细选择的被试,以代表所测年龄或年级的全车总体。例如,"奥蒂斯-伦农学校能力测验"的标准化样组采用分层随便机取样,人数大约占到全国学校学生总数的4%。阿纳斯塔西认为,这些测验的常模一般比个别测验的常模更有代表性,因为后者通常仅根据每一年龄组100个左右的被试来制订常模。目前使用最广泛的测验与特定出版者的基本技能成就成套测验同时制订常模,以便于对学习能力倾向与特定学科中的成就进行比较。

四、尚未解决的问题

纸笔智力测验从一开始就是众多争论的焦点。存在许多关于纸笔智力测验的解释和使用方面的错误概念。期望这种测量会提供医治社会弊病的灵丹妙药,这是可笑的,结果是极大的失望和幻想的破灭。遗传因素的环境因素都对智力测验分数产生影响,但我们迄今为止对这两种因素的复杂性及相互关系知之甚少,因此智力测验的反对者频繁进行辛辣攻击。少数民族群体成员的分数一般较低这一研究发现遭到指责,说是测验固有偏见有利于中产阶级白人。美国不少城市已经一律禁止使用纸笔智力测验,理由是少数民族学生在测验中人为地处于严重不利的地侠。

美国"全国能力测验研究委员会"在一份全面研究能力测验在社会中的作用的报告中,建议在评判测验对于实现社会目标有多大效果时,应该有一种全面的看法,委员会强调要同时公开测验的益处和测验的局限性。有测验也罢,无测验也罢,在人员选择和人才分配方面总要应用一些分类标准的。标准化能力测验是有局限性的,可也确实为人员选拔和人才分配的工作提供了一种客观的、经济有效的方法。尤其是心理学家负有特殊的专业责任心来明智地使用测验,并教育当事人和其他专业人员正确地使用和解释测验结果。

(http://www.yywsb.com)
编辑:阿勇