致敬70年 杨惠中:创建中国特色大学英语测试系
中国娱乐网-娱乐新闻资讯网站   2019-07-10 23:32   来源:未知

  杨惠中:上海交通大学外国语学院教授、语言学与应用语言学专业博士生导师;曾任上海交通大学外语系主任(1985-1991)、全国大学英语教学研究会会长(1985-1999)、全国大学英语四、六级考试委员会主任(1987-2004),现任国家教育考试指导委员会专家组成员、教育部考试中心高级顾问,全国大学英语四、六级考试委员会顾问。主要研究领域包括:语言测试、语料库语言学、语言教学。

  社会的发展和中学生英语水平的提高对大学英语课程不断提出新的、更高的要求,这些都及时体现在了CET考试的总体结构设计和题型设计中,特别是2004年由金艳教授等年轻一代学者主持考委会工作后,改革的步伐进一步加快。20世纪80年代中期的大学英语课程目标是,“培养学生具有较强的阅读能力、一定的听(和译)的能力、初步的写和说的能力,使学生能以英语为工具,获取专业所需要的信息,并为进一步提高英语水平打下较好的基础”。因此,初期的CET把阅读能力作为考核重点。

  在2016年修订版的CET考试大纲中,考试内容和题型都发生了较大变化。目前,CET考试的听力与阅读占比都是(35%),听力材料采用新闻、讲座或报道等体裁的语篇,以更好地体现英语的实际应用;阅读包括长篇阅读理解;写作(15%)采用图片、表格、情景描述、名言等各种提示信息,以丰富考试内容,并防止考生采用“套用范文”之类的应试策略。此外,2013年起新增“段落翻译”(15%),首次尝试在考试中融入中国元素,要求考生在30分钟时间内,将一段140-150字(四级)或180-200字(六级)的汉语段落翻译成英语,主题包括中国文化、历史、地理、经济、社会发展,如丝绸之路、中国茶文化等;

  效度是对考试质量最重要的要求,是测试的核心问题。大规模标准化考试的效度要靠实验来验证,并将证据公诸于众。20世纪90年代中期,CET考试委员会与英国文化委员会合作,开展了为期3年的效度研究,通过大规模问卷调查、考试内容分析、考试数据分析、考试与外部效标(如教师评价、其他考试等)的关联、教师和学生访谈、对比考试等,分析了考试的表面效度、内容效度、同期效度(效标关联效度)等。效度论证采集了多种类的数据,运用多视角、多层面的分析方法,对CET考试进行了全面的效度论证,标志着我国语言测试效度研究进入了数据驱动的实证研究阶段;

  3.重视研究测试与教学的关系,不断完善考试内容、在实验的基础上探索新题型,以期改进考试对教学的后效。

  4.为了帮助教师深入了解学生英语学习的发展模式和特点、英语口语的发展模式和特点、英语阅读理解心理过程等等,建立了大批语料库。在实证研究的基础上出版了专著,这些语料库对公众开放,以供对CET所反映的学生实际英语能力及其发展规律进行深入研究;

  CET为了达到教育测量专业要求,在工作中形成了一套完整的制度:在试卷设计方面,从命题、审题、预测、试题分析到对比测试等都有严格的质量控制措施,保证了考试的心理测量学专业水准;在统计分析及成绩发布方面,从机器阅卷、分数等值处理到成绩正态化处理等都有成熟的措施,保证了成绩报道的科学性和分数的可解释性。

  在考务组织方面有严格的制度,保证了考试的严密性和公正性。以上这些工作都依靠信息技术的充分运用。

  21世纪初,CET开发了主观题在线评分系统,由教育部考试中心于2006年全面推广至全国12个CET主观题阅卷点。在线评分系统提高了评分的效率,并通过在线评分质量监控,进一步提高了评分信度。

  CET信息化发展中最有特色的是计算机化口语考试。1999年面试型CET口语考试实施以来,极大地推动了我国大学英语口语教学,考点和考生人数不断增加。但是,面试型口试需要投入大量人力物力,对考官要求高,限制了口语考试的规模。为此,考委会开发了计算机化口语考试,并于2013年开始全面取代面试型口试,为提高口语考试效率、进一步扩大口语考试规模创造了条件。口语机考滤除了面试型口试中考官的影响,使考试更加公平。而且,由于采用了考生成组考试的形式,口语机考实现了考生与考生之间的互动交流,有效测试了考生的英语口头交互能力。此外,由于评分在考后进行,口语机考可更有效地监控评分质量并及时调整评分误差。CET口语考试目前规模已达到每年超过90万考生,将来口语考试将逐步成为CET的必考部分。

  信息技术也应用在防考试作弊中。任何具有社会权重的高风险考试都会出现作弊现象,作弊是某些能力没有达到要求而又希望轻松获得资格证书以谋取未来利益的舞弊行为,也是诚信的缺失,姑息作弊是对诚实考生的不公。防止和惩处作弊是考试实施过程中必须考虑的问题。在CET初期,抄袭是主要的作弊方式。为此,CET除了实行严格的监考和巡视制度外,还采用了排列不同的A、B卷预防作弊,并通过主观题答题是否雷同来进一步判断作弊现象。之后,高科技被用于考试作弊,作弊考生通过隐蔽的通讯设备接听答案,从而导致了大规模、群体性作弊现象的发生。为此,CET自2012年起采用多题多卷模式,每次考试采用内容、排列和组合不同的卷库,通过考生答题纸上的条形码判断其所答试卷的版本,并通过预测和等值等方式,确保不同版本试卷之间的难度等值,这一措施有效防止了高科技作弊现象。

  随着CET的用途被不断拓展,考试分数被用于各种高风险的决策,CET考试委员会越来越深刻地体会到,“考试的开发和使用不是在试管中作心理测量实验”,考试具有极强的社会属性,考试效度与考试所处的社会环境密不可分。笔者和桂诗春合作出版的《语言测试社会学》一书,深入分析了大规模考试的社会学问题,厘清了考试、教学与考试使用之间的关系,分析了应试教育产生的根源,论证了考试误用产生的社会后果,探索了考试社会化、教育考试质量监控机制等方面的问题。

  CET考委会经常在国际学术会议上报告研究成果,以便使国际语言测试界更好地了解CET,也使CET能紧跟国际语言测试研究的步伐。例如,2000年11月,在加拿大温哥华举行的国际语言测试年会(LTRC,为国际语言测试界规格最高的国际学术年会),破例向CET考委会代表提供了两小时的专题报告时间,我们宣读了4篇论文:《大学英语考试效度研究》《大学英语口语考试设计原理》《大学英语考试作文阅卷质量控制》和《阅读能力测试的内省法分析》。2005年7月,在美国威斯康辛举办的国际应用语言学年会上,CET与、考试的代表同台参加了“大规模考试”(The Big Tests)专题讨论,共同探讨大规模考试的改革,世界上三个大规模英语考试项目各自做了陈述,由语言测试界先驱A. Davies教授主持,从考试信度和效度、教学后效、测试者的道德规范和社会责任等方面对大规模考试作了深刻的点评。

  1.与美国教育考试服务中心(ETS)的联系最早开始于1983年春,当时ETS副总裁Solomon率团访问北京,和国家教委学生司讨论关于合作开展语言测试科研的事情,笔者也应邀出席了这次讨论,并提出了几点合作研究的建议。

  1983年5月,我幸荣地获得英国文化委员会提供的Hornby奖学金,前往英国做一年访问学者。当时经过再三考虑,我决定把研究学习重点放在语料库语言学方面,于是前往英国伯明翰大学访学进修,向Sinclair教授系统地学习语料库语言学。虽然收获极大,但所学内容与语言测试没有关联。直到1984年10月3日,当时我已经做好回国准备,忽然接到ETS从美国寄来的信函,邀请我前往ETS访问3周并承担我的一切费用。在普林斯顿期间,ETS毫无保留地让我参观了考试开发和实施的全过程,参观了当时已经研制成功的基于IRT理论的自适应机试模型,并安排同ETS几乎每个部门的负责人见面并进行深入讨论。现在回想起来,这是一次让我全面深入了解现代教育测量从开发、设计、到具体运作全过程的难得机会,我收获十分丰富,回来后写成了专门报告,供教育部有关部门参考。

  1999年8月13日,时任ETS总裁N. Cole博士一行在日本筑波出席LTRC学术年会后,顺道来上海访问CET考试委员会,代表团一行共四人,除总裁Cole博士外,还有负责科研的副总裁和负责行政的副总裁,第四位是ETS主管各种外语考试项目(包括TOFEL考试)的官员。笔者和董亚芬先生在与他们的交流过程中,就CET的性质、运行机制、在我国教育中的作用以及效度研究等,也毫无保留地做了详细介绍,ETS的们很感兴趣,认真地作了笔记,前后讨论了两个小时。Cole博士坦率地表示:“我们在ETS关心的也正是这些问题”,并希望今后有机会进一步加强交流。

  2.英国剑桥大学考试中心(UCLES)前后三任总裁都访问过CET考试委员会。1992年Reddaway教授正在上海外国语大学,顺道访问了CET考委会。1995年10月,作为和英国文化委员会合作开展CET效度研究任务的一部分,我们研究小组一行两人在英国Reading大学进行为期两周的合作研究,UCLES特地安排我们到剑桥大学访问,期间英方向我们详细介绍了考试的设计、运行与发展,Reddaway教授还介绍了UCLES的性质、发展历史及科研情况。1996年百年校庆,UCLES新任总裁Holstead教授应邀来CET考委会就大规模教育考试做了学术报告。2002年,随着CET考试规模越来越大,考委会高度重视考试与教学的关系,在举行“语言测试与语言教学”国际学术会议,著名语言测试专家Bachman教授等应邀出席做学术报告,美国ETS和英国UCLES等机构都派代表出席会议并发表论文,会议前UCLES新任总裁S. Lebus教授来信,表示了出席会议的愿望,经教育部批准我们马上补发了邀请函。这些学术交流说明国际上对我国语言测试研究的动态非常关注。

  3.1996年9月,日本“英语鉴定学会”(Society for Testing English Proficiency,简称STEP)一行八人专程从日本来上海访问CET考试委员会。STEP是日本文部省认可的英语考试机构,从1968年开始实施,到1996年已达到每年考生360万人的规模,在英语标准化考试这一点上,STEP和CET很相似。我们毫无保留地回答了他们想了解的许多问题。同年11月,笔者应邀回访了日本东京STEP总部,就CET设计原则、CET效度研究、大学英语教学大纲设计等做了多次讲座。通过交流我们也学习了日本STEP的经验并且与其建立了密切的合作关系。

  4.通过与STEP的交流我们产生了一个想法,为了推动亚洲各国和地区的英语教学和英语语言测试的发展,由CET考试委员会发起,于1998年11月在举办了“亚洲地区英语语言测试研讨会”,出席研讨会的除了CET考委会外,还有日本英语鉴定学会、韩国国家课程与考试研究所(KICE)、香港考试局、大学入学考试中心,可谓三国五方。这次研讨会开得很成功,各方反应热烈,决定以后每年在三国五地轮流举行研讨会。到第三年,决定正式成立学术组织,制定了章程,定名为“亚洲英语语言测试学术论坛”(Academic Forum on English Language Testing inAsia,简称AFELTA),迄今为止,研讨会从未间断。

  AFELTA的宗旨是“推动亚洲地区的英语教学和英语语言测试”,始终站在国际语言测试研究的前沿,讨论的主题涉及大规模高风险考试的效度研究、语言测试与语言教学的关系、成绩报道体制研究、新技术在语言测试与研究中的应用等等,近年来的研究重点更涉及大规模高风险考试的社会学问题、形成性测试与课堂教学、网考、建立亚洲地区统一英语语言能力等级量表等重大问题。这一发展轨迹反映了亚洲地区英语语言测试工作者认识的深化,努力使语言测试更准确地测量学生的英语语言能力、更好地为语言教学服务。一个跨地区的学术组织在长达20年的时间内不间断地定期举行学术会议,说明它为亚洲国家和地区的英语语言测试专业机构提供了一个有价值的平台,为交流学术观点、探讨语言测试新技术和新方法创造了良好的条件。

  考试涉及一个国家的教育主权,中国学者有能力独立自主地开发达到心理测量学专业标准的语言测试项目,准确地评价学生的英语能力。

  与境外上述著名教育考试专业机构的交流完全是一种平等的、学者之间的、坦率而真诚且毫无保留的交流,因为大家都充分意识到大规模教育考试的主事者肩负着重大的社会责任,应当交流经验、相互学习。实际上,这正是在践行国际语言测试协会的《ILTA道德规范》:“语言测试是一个跨学科的领域,要求其从业者在研究内容和方法上不断吸收应用语言学、教育测量学、心理学等相关领域的新成果,拓展自己的专业知识与技能,提高学术素质,钻研新理论、新方法、新技术,精益求精,以推进语言测试的专业化进程,保证考试的信度和效度,加强考试对教学的正面导向作用。”

  CET考试委员会的工作非常辛苦,考委会成员第一届只有7人,第2届起扩大到15人,但全部为兼职,加上办公室4位工作人员,组织和运行如今每年几百万、上千万考生的超大规模考试,不能不说是一个奇迹,靠的就是拼命工作和奉献精神。例如,大规模考试中采用的多项选择题,虽然形式简单,但命题的专业要求极高,每道题从命题到成熟要经过“命题-审题-试测-计算机试题项目分析-复审-构卷”的漫长而复杂的过程,确保每道试题在难易度、区分度等方面都达到规定要求后才能用于实际考试,这个周期往往长达一年之久。有关人员在实际工作中对多项选择题的命题、审题都抱着一种敬畏之感,兢兢业业。

  像CET这样获得社会信任的高风险考试,必须对学生高度负责,试卷上不能出现任何差错。十多页的试卷虽然只是“一份”,却意味着数万个不允许出现任何一个差错的“单位”,每次付印前都要经过反复仔细审校,才能签字付印。在长达30年的实际考试中,试卷上尚未发现任何差错。只有对工作持极端负责任的态度,才能做到这一点。

  虽然迄今为止尚未有任何人对CET试卷的学术质量和文字水准提出过批评,但是由于大规模考试的高风险性质,CET难免受到来自各方面的不理解、出于各种考虑的非议,这种非议有时难免会影响正在埋头苦干的考委会成员的情绪,这时,董亚芬先生常常鼓励大家说:“别管它,我们把自己的工作做好,只要对得起学生,问心无愧就可以了。”正是这种排除干扰、气定神闲的精神,支撑着CET考委会成员为我国大学英语教育事业鞠躬尽瘁、努力不懈。不但如此,CET考委会成员还必须签字承担保密责任,包括不允许利用考委会成员身份编写出版模拟试题集或举办培训班等进行牟利活动。

  CET考试是一项具有中国特色的考试。30年来,它经历了各种风风雨雨,但坚持改革和自我完善的宗旨不变,坚持为大学英语教学服务的初心不改。迄今为止,基本上做到了保证考试“命题的科学性、评分的一致性、组织的严密性、成绩的可比性”,从而得到了社会公认,并且引起国际语言测试界的重视。大规模考试的存在必定有其社会基础和学术环境。CET的设计基于我国改革开放对大学生英语能力提出的要求,其发展得益于我国英语教学理论和实践水平的不断提高,以及语言测试领域对效度越来越深刻的理解。

  随着改革开放的深化,我国的英语教育还需要进一步提升质量,大规模考试会继续存在。当然,考试改革和发展需要教育主管部门的支持,需要考试研究者对信度和效度的追求,需要院校领导、教师和考生的配合,也需要考试使用者理解并合理使用考试。希望我国自主品牌的考试能够更加稳步地发展,并尽早走出国门、面向世界,为中国了解世界、世界了解中国作出贡献。


[责任编辑: admin]