国际学生能力检测(PISA)排名可信度受学者质疑

2023-04-23 10:32:29

国际学生能力检测 (Programme for International Student Assessment),惯称PISA测验,是由经济合作与发展组织 (Organisation for Economic Cooperation and Development,简称OECD) 执行,针对15岁学童进行数学、科学与阅读能力检测,并于每三年发表其检测结果。PISA检测目的在于检讨各国的教育品质对于经济成长影响之个别差异,此检测广受各国政府重视,并深深影响其教育方针,例如英国 Gove即针对英国在2000至2009年间排名下滑而进行大规模教育改革。PISA排名始于2000年,受国际公认是最具可信度的教育指标,然而此指标的参考价值近日却在学术界引起广泛争议和讨论。
    
丹麦哥本哈根大学Svend Kreiner教授最新发表的文章指出,PISA排名所使用的Rasch模型具有相当问题存在,其结果导致各单一国家排名有範围落差,例如:加拿大的排名可能介于2至25名,日本可介于8至40名,而英国可介于14至30名。Rasch模型的机制在于以採样学生的成绩进行统计运算,以其结果预测所有母体学生,亦即所有参与此能力检测国家的学生,可能的检测表现。Kreiner曾为Rasch模型设计者Georg Rasch的学生, 熟知Rasch模型操作方式的他对于PISA排名深感忧虑。他表示使用Rasch模型的先决条件是所有测验问题必须一致,亦即难易度需等同,否则将存在项目功能差异 (differential item functioning,简称DIF) 的问题。然而基于各国文化与民族性差异,OECD必须避免部分可能涉及精神层面的敏感问题,此举即造成Rasch模型的公正性受损。
    
举例来说,2006年的阅读共有28题,OECD对其中8题潜在文化歧视的问题进行差别删减,因此并非所有国家的学生都回答一样数目的问题,然而调查结果显示,这些受争议的问题确实对于有回答的学生之成绩有所贡献。此外,Kreiner指出,2006年的阅读检测中,完整回答所有问题的受测学生只占10%左右,40%的学生只回答14题,而将近一半的学生完全没有回答任何阅读问题。除了阅读受争议, 数学亦有50%学生完全没有参与测试,但Rasch模型仍然就两项学科演练出所有参与国学生的排名。
    
OECD对此评论进行回应,他们表示PISA测验的目的在于提供各学生的学科表现预测值,而非个别学生的实际测验成绩,即使删除了文化敏感问题,其余的问题仍存在语言和文化本质上的差异,而OECD的工作在于减少而非消除此差异。Kreiner对此回应并不认同,他表示此差异仍然足以让Rasch模型无法正确运作,因此PISA排名 「完全无法信赖」。OECD技术顾问Ray Adams回应,Kreiner的研究仅採样小规模的群体,进

友情链接

Copyright © 2023 All Rights Reserved 版权所有 在美留学教育专业网站