中国第三方教育评价发展的机遇和挑战

栏目:行业资讯 发布时间:2019-10-15
分享到:
二十多年来,我们试图通过各种方式改进中国的教育,也有些成效,但总体上不够理想,经过反复分析、筛选、实验,得出的结论是要想优化中国的教育生态,办出更高品质的教育,唯有建立健全的第三方教育评价。

内容来源:全国第三方教育评价机构联谊会2017年会致辞
作者:
储朝晖,中国教育科学研究院研究员、全国第三方教育评价机构联谊会主席

第三方教育评价的理念自1990年代传入中国并开展学理探讨,至今已20多年。对于试图推进第三方教育评价的人们来说已经比较漫长,而相对于人类历史发展进程而言又只是短短一瞬间。可喜的是当下依然在向前推进,并由我们作为当事人设计它的实际操作过程。

二十多年来,我们试图通过各种方式改进中国的教育,也有些成效,但总体上不够理想,经过反复分析、筛选、实验,得出的结论是要想优化中国的教育生态,办出更高品质的教育,唯有建立健全的第三方教育评价。建立第三方教育评价也是当下改进中国教育可供选择的有效途径。

一、第三方教育评价发展的机遇

相对于世界多数发达国家第三方教育评价经历一百多年的发展已经成熟而言,中国各行业的第三方评价正在迅速发展阶段,其中第三方教育评价则处在孕育期,受教育体制与机制制约,教育领域第三方评价在各类第三方评价中相对滞后,可喜的是在滞后的状态下奋力发展。

1、政策连续且日益明确

最近十年来,政府对于推进第三方教育评价的政策是积极而又连续的,《国家中长期教育改革和发展规划纲要(2010-2020年)》虽然没有使用“第三方”的概念,但是有了这层含义,明确提出:“推进专业评价。鼓励专门机构和社会中介机构对高等学校学科、专业、课程等水平和质量进行评估。建立科学、规范的评估制度。探索与国际高水平教育评价机构合作,形成中国特色学校评价模式。建立高等学校质量年度报告发布制度。

2013年《中共中央关于全面深化改革若干重大问题的决定》再次明确:“深入推进管办评分离,扩大省级政府教育统筹权和学校办学自主权,完善学校内部治理结构。强化国家教育督导,委托社会组织开展教育评估监测。

2015年,教育部发出《关于深入推进教育管办评分离促进政府职能转变的若干意见》,这个意见将现代学校制度和评价制度作为一个整体,明确“推进管办评分离,构建政府、学校、社会之间新型关系,是全面深化教育领域综合改革的重要内容,是全面推进依法治教的必然要求”,“以推进科学、规范的教育评价为突破口,建立健全政府、学校、专业机构和社会组织等多元参与的教育评价体系。”明确了学校自评、政府督导、专业机构和社会组织开展教育评价的三种评价一并发展的架构,具体表述为“大力培育专业教育服务机构,整合教育质量监测评估机构,完善监测评估体系,定期发布监测评估报告。扩大行业协会、专业学会、基金会等各类社会组织参与教育评价。制定专业机构和社会组织参与教育评价的资质认证标准。引入市场机制,将委托专业机构和社会组织开展教育评价纳入政府购买服务范围,按照公开、公平、公正原则,建立健全招投标制度和绩效管理制度,保证教育评价服务的质量和效益。重视扩大科技、文化等部门和新闻媒体对教育评价的参与。重视学生会等学生组织在教育评价中的作用。鼓励有条件的地区和学校积极参与国际组织实施的教育质量评估项目。”这些表述已经十分明确具体。

2015年修订通过的《中华人民共和国高等教育法》新增添了“教育行政部门负责组织专家或者委托第三方专业机构对高等学校的办学水平、效益和教育质量进行评估,评估结果应当向社会公开”的条文,说明发展第三方评价已经成为高等教育界的共识,也有了法律依据。

2017年9月24日中共中央办公厅、国务院办公厅印发《关于深化教育体制机制改革的意见》中重申“建立健全教育评价制度,建立贯通大中小幼的教育质量监测评估制度,建立标准健全、目标分层、多级评价、多元参与、学段完整的教育质量监测评估体系”,进一步明确强调:“健全第三方评价机制,增强评价的专业性、独立性和客观性”。

政策之所以越来越明确,显示出这是中国教育体制健全发展的必然选择,在“十九大”后的教育发展中进一步促进第三方教育评价发展也是必然趋势。

2、社会需求正在增长

社会对第三方教育评价的需求在于第三方的相对独立性、客观公正性、专业性,这种需求自古就存在。第三方评价能否转变为教育发展现实的需求,在很大程度上,与是否建立了相对成熟、专业的第三方教育评价技术模式相关,这种技术模式在国际上已经有了,与中国社会体制相切合的模式也正在摸索。中国对第三方教育评价需求的现实性和迫切性已经客观存在,如中国人民大学恢复自主招生邀请第三方监督,高校信息公开情况也请第三方评价;甚至有人倡议建立第三方处理机制遏制学术造假。由第三方研制争议较多的大学排行榜在社会上影响逐渐增大,校长职级评定、学校办学资质评定等都产生了第三方评价的需求。并且这个过程中需求随着使用的有效性而逐渐增长。

当然,第三方教育评价的需求是立体多样的存在,包括对学生的评价、对学校的评价、对政府教育工作的评价;也包括对从早期教育到高等教育、成人教育等不同学段教育的评价,对教育的管理、教学、校园安全等不同方面的评价,也可以对特定学科、特定能力、特定环节的评价。上述这些方面的需求都在生成或发展过程中,又是不平衡的,生长的多少和快慢与教育自身对客观公正性的需求程度相关,与评价结果的使用广泛程度相关,也与相应领域的评价技术成熟程度相关,需要第三方教育评价机构根据实际选择自己能够满足的需求作为发展机会。

3、第三方教育评价机构出现并开展评价业务

一般人将中国民间的大学排名机构产生当作中国第三方教育评价机构的开始。1998年后,上海教育评估事务所、云南高教评估事务所、江苏教育评估院等政府主办的省级评估机构建立,2004年教育部成立高等教育评估中心,这些机构主要进行的是第一方评价或第二方评价,偶尔也开展一些带有第三方评价性质的工作。

事实上,从2010年起,北京等地就开始委托第三方的财务公司邀请包括教育、管理、财务等方面的专家在内的专业人士对教育经费使用进行事前、事中、事后评估,并在全国多地推广,这类评估的主体虽是财政经费,却与教育直接相关。麦可思公司进行的大学生就业调查、多家公司进行的大学排名也在一定程度上具有第三方教育评价性质,也有一些学校或政府委托第三方进行评价、撰写质量评价报告,由此看来中国真实运行的第三方教育评价也就是近十年的事。

近十年来,在工商登记注册中包含教育评价业务的公司不断增多,总数达到万计,但大多数都未实际开展过评价业务。也有一些开展过实际评价业务的公司因市场不足等原因速生速灭。通过这次年会前的摸底调查,中国大陆真正实际开展过第三方教育评价的机构也就几十家,参加我们第三方评价机构联谊会的新老成员共33家,可以说目前国内开展教育评价业务的多数机构均已加入第三方教育评价机构联谊会。这33家当中开展教育评价业务的多少深浅都有较大的差别。2015年第三方教育评价机构联谊会组建本身就是中国第三方教育评价事业发展的重要事件,标示着中国第三方教育评价从单个机构打拼走向联合发展的新阶段。

二、第三方教育评价当前面临的挑战与风险

对于第三方的界定已有众多讨论,有人将它分为利益第三方和独立第三方。在实践中,当下中国教育评价的第三方比较多的还只是利益第三方,因为它们的评价标准往往是由第一方或第二方确定,第三方仅仅是拿着第一方或第二方的尺子去量一下施测对象,报告所量得的结果。从操作层面定义独立第三方主要看它是否真正制定并使用自己的标准去进行评价。在中国当下第三方教育评价的发展仍面临不少挑战和风险,这需要从事第三方教育评价的机构不断深化认识。

1、发展第三方教育评价面临的挑战

第一个挑战,你是第三方吗?政府提倡发展第三方专业评价近十年来,正是由于第三方的缺位使得第三方教育评价发展迟缓。如果没有真正意义上的第三方,无论政府发多少文件、出再多的政策都无法使第三方教育评价真正发展起来。

有人认为官方评估机构到它不具有行政隶属关系的地方实施评价就可以算第三方;有人认为半官方的协会、评估中心也可以算第三方;也有人认为与政府没有关联的纯粹个人、组织,能满足公众对第三方需求市场的才算第三方。但这些都仅是从形式上进行分别。

从实质上说,只有具有了第三方意识才能算真正的第三方。第三方意识是中立客观的立场看问题的意识,他在一定程度上是第一方和第二方的挑战者、追问者,甚至批评者,是实施第三方评价的必要条件。这种意识有了教育的专业基础才能构成教育的第三方专业评价。值得注意的是,只有第三方教育评价机构具有第三方意识还不能有效开展第三方教育评价活动,只有第一方和第二方当事人也具有了健全的第三方意识,产生了足够的第三方用户,第三方教育评价才能正常开展起来。受文化、体制及多重因素的影响,中国人形成建立健全的第三方意识还需要经历漫长的过程,还可能出现反复,这是对我们开展第三方评价的长期且具有韧性的挑战。

第二个挑战,第三方评价的市场有多大?这是不少第三方评价机构高度关注而又心中没有底的。准确地说,第三方教育评价的市场已经有了,但不像一些人想象的那么大,甚至在一定的程度上还需要利用非市场的因素辅助才能找到用户。第三方评价机构用户多少又是与各个机构的信誉与专业水平直接相关,这意味着现实的第三方教育评价市场不是天上掉馅饼,而是需要各个机构充分利用自己的技术等各方面资源去打拼拓展。

最终的结果必然是有市场的第三方教育评价机构获得生存,无市场的则会被淘汰,这样的结果很严酷,警醒每个涉足第三方教育评价的机构一开始就做好自己的定位,准确了解第三方评价的社会需求,依据自己的专业特长和资源优势确定自己的评价领域、专业与技术发展路径和长期的发展规划,做好迎接市场挑战的充分准备。

第三个挑战,专业水平能否快速有效提升。第三方评估机构的真正价值和独特的支撑在于专业化,在于用专业化的方式对数据进行分析,使得评价不再是差不多、走过场。

在中国现有的环境下,短期内“关系”似乎是决定第三方教育评价机构生存最为关键的因素,为满足政府信息公开需求,半官方评估机构的生存土壤和适应性更强,但这种状态仅能维持一段时间,由于不能完全保证立场中立,依然会产生“既当裁判员又当运动员,很难保证评价的客观公正”的现象。这个过程的时间长短当然由多种因素决定,总归是有限的。长远地看,一个机构的专业技术水平是决定它能否生存下去最为关键性的因素,这样表达并不排除第三方评价还有其他决定其存亡的因素。

专业技术水平的提升就如同自己举起自己那样十分艰难。当今正是以信息技术为主的多种技术飞速发展时期,教育本身就是极其专业的工作,对教育的测评理论和技术自然复杂,可操作的技术也快速发展,尽管第三方教育评价机构可以引进借鉴一些国际成熟的专业技术,但是借鉴使用也得有消化能力,需要用户适应。因此能否应对专业技术的快速发展的挑战就成为决定第三方教育评价机构命运的长远决定因素。

2、发展第三方教育评价需要防范的风险

在中国有些迟到的第三方教育评价成长发展的环境就不算良好,自产生之日起就遭遇了“先天不足”,在发展中依然会存在众多风险。

第一个是信誉风险。第三方遇到的困难主要在于观念,中国人的社会心理普遍不相信一切带有商业色彩的东西,于是政府、公众对于第三方公信力的怀疑根深蒂固。即便有政府的管办评分离政策提倡,是否信任和接受第三方专业化的市场服务在社会民众和一些政府官员心中依然还是问题。

第三方信誉度的累积需要长期的诚实精细工作,信誉的累积需要经历一个过程,并不能要求第三方一开始就是完善的。一方面我们期望社会给第三方时间、空间加以改进,不能采取“一错即否”的态度;另一方面第三方有要有高度的责任感和警惕,意识到任何一个第三方教育评价机构长时间积累的信誉都可能在一瞬间毁于一个小小的疏漏。所以第三方教育评估机构要把信誉当成自己的命根子,采取足够牢靠的措施构筑控制和防范信誉风险体系。

对信誉最大的杀伤是造假或使用粉饰的数据统计,尤其要防范在利益驱动下的造假。这种现象在过去的大学评估和义务教育均衡评估中都大量出现并为世人诟病。第三方教育评价机构以什么样的态度、有多大能力解决作假问题成为其信誉有无和多少的关键,也会成为市场发展的重要影响因素。

第二个是测评技术风险。任何技术都不是不会发生问题的,SAT的测试可谓技术成熟,可它还是经不起中国培训机构和考生的攻势,不得不以中国考生的明显答卷类同而宣布成绩无效。对学校办学水平、效益和质量的评估,在世界各国都是很大的理论和技术难题,原因在于教育质量的评价很难被完全量化,质性评价又不具备可比性。因此,减少技术风险一方面要在探索新技术上走在同行的前列,在使用评测技术上尽可能走在中间,使用成熟的技术,同时要注意使用的细节,做充分的分析和检验;另一方面将工具测评和专业化评估与足够量的实地调查结合起来,尽可能防止信息不足不全而产生失真。

第三个是资金链断裂风险。新建立的不少第三方教育评价机构是以其他资金积累作为基础创办评价机构的,有些可能还在比较长的时期内保持多种业务并行,仅仅依靠教育评价的业务难以保证机构的持续运行,而且在新聘用人员、技术开发的时候都需要新的资金投入,第三方教育评价实现投入与回报平衡短期内有较大的难度,所以需要理性投入,做好切合实际的规划,善于经营,适当利用其他业务补充资金。只有赢得上述挑战,并有效防控了上述风险的第三方教育评价机构,才会有未来。

三、第三方教育评价机构联谊会未来的发展方向

依据国际上一些原创性的第三方教育评价经历了40年到60年的时间才走向成熟的历史考察,中国作为后发展的第三方教育评价国家,创立有公信力的评价机构也要花很长时间,中国整体的第三方教育评价成熟最短需要10年,如设想得长一点估计需要30年。

全国第三方教育评价机构联谊会建立的目标就是以联合促发展,通过改善中国教育的评价机制,形成良性生态,把教育办得更好。

具体而言,就是将民间形式不同、关注点各异、相对弱小分散、信誉不高、各自为战的带有教育评价功能机构联合起来,建立起各机构联络、交流学习、共同提升的平台。并在此基础上争取社会认同,拓展政策空间和发展机会,提高专业水平和能力,提升第三方评价的信誉。

第三方评价机构联谊会成立后,曾形成并发布《第三方教育评价共识》,明确中国第三方教育评价专业机构的发展处于起步阶段,建立并健全第三方教育评价是建立良性教育生态,提高教育质量的迫切需要。第三方教育评价机构联谊会的使命就是在这个过程中发挥专业的联合促进作用。 对联谊会未来的工作目标和发展方向做出如下设想:

1、拓展整体空间

第三方教育评价需要政府、学校、第三方以及社会的不断互动与积累,已经开展活动的第三方评价机构也深感中国在第三方评价制度、体制、机制方面缺少最基本的安排成为面临的重要障碍。联谊会将通过政策、媒体、举办活动等多个渠道创造互动机会,破解体制机制难题,拓展第三方教育评价的整体空间。

政府无疑在第三方评价的发展上起到至关重要的作用。要促动政府强化第三方购买服务,有计划地列出需要纳入第三方评价的清单,通过招投标或议标的方式选择第三方教育评价机构,不能朝三暮四,今天给第三方一个项目,明天又不让做,后天又让第三方做另一项目,很难维持专业的连续存在。还设法促使政府在基础教育评价项目、高等教育评价项目上对第三方评价机构一碗水端平,加快有政府或事业单位背景的评价机构改革,让他们参与公开投标而非当然地获得拨款或补贴,以培育更多自食其力的真正第三方。联谊会将设法提高对第三方教育评价结果的使用和认识水平。引导社会、学校、教师、家长、人力资源部门熟悉并使用第三方教育评价结果,鼓励教育当事人依据实际需要使用第三方教育评价结果作为自己成长发展的参考依据,充分发挥评价的引导、诊断、改进、激励等功能。促进政府、学校或人力资源部门建立第三方教育评价结果使用机制,探索教育评价的政府、学校或个人的认可与采购模式,提升用户对第三方教育评价机构的认可度。打通政府对独立第三方评价机构的政府采购服务项目渠道,并给予政策、行业和环境的支持。

2、协助第三方评价机构提升专业水平

联谊会短期内将协助各会员机构建立专业团队,普及专业常识,开展专业交流。现在已经开展的会员单位资质评定既是邀请全国教育评价专业领域国内公认的专家对各会员单位进行专业授信,也是针对性地专业指导。

长远的计划是建立第三方教育评价行业标准,包括确立服务标准,解决行业服务品质良莠不齐问题;逐步建立评价机构的专业标准,提高教育评价机构专业化程度,促进该行业整体专业水平提升。

中华人民共和国标准化法》2017年修订版11月在人大通过,其中一个亮点就是鼓励团体标准的制定与发布。规范的第三方评价可以做一套标准体系,可联合几家单位一起起草和发布,在行业内起到树立标杆,提高威望,带领其他机构跟进规范化的目的。从信用评价标准化经验和第三方教育评价需求来看,有以下几个方面适合做成标准:

等级划分规则,例如信用标准规定信用A级代表信用良好,失信风险较小,AAA级表示信用极佳,一段时间内几乎没有失信可能,教育评价机构联谊会已经启动会员资质评定;将来从长远考虑对会员机构评定的基础上做一个类似的规定,让不同的称号、等级所代表的水平成为标准,成为行业内通用的共识。

评价程序规范,目的是规范评价过程,是评价结果可信。成立专家委员会、评价执行小组,按照标准进行评价,评价结果的沟通与异议处理,评价结果的公开等。在这方面已经反复修订的《评价实施专业规范》在朝这方面努力。

评价指标,相当于评价模型。科学的评价指标、权重、打分规则是保证评价结果尽可能贴近被评价对象实际状况的核心。标准可以针对被评价对象的分类,规定部分相同、部分不同的评价指标,把非本机构机密的可公开的指标及其打分规则写进一级、二级、三级指标。形成一个完整的指标体系。

以上3个方面是评价系列标准的主要组成部分,联谊会适时制定团体标准,并根据实施反馈的信息和需要在应用中及时修订。

各会员单位需要积极合作,及时有效利用联谊会创造的机会提升自己的专业水平,尽可能实现技术专业化、方案个性化、服务人性化、操作简便化,为个性化的成长发展提供高品质的评价服务。

3、完善行业治理与内部治理

行业治理是第三方评价机构的同行环境,内部治理是第三方评价机构的内部运行规则以及面对市场的应对策略,这两个方面又有相关性,是个别的评价机构无法解决的问题,联谊会一建立就遇到这方面的问题,并先后制定并反复修改了《全国第三方教育评价机构联谊会公约》,《全国第三方教育评价机构联谊会教育评价实施专业规范》,并要求每个入会的机构在认同本会《章程》的同时签署这两个文本,这是目前我们所采取的行业治理与内部治理措施,希望各成员签了字就要严格实施,因为这既关乎中国整个第三方教育评价的发展是否顺利健全,也与每个机构的发展前景直接相关。

需要强调的是,联谊会的治理不是刚性的,需要各个会员机构自觉参与并遵照执行,它只是第三方教育评价机构的独立性、专业性缺失或受到威胁的时候的一根救命稻草,大家都自觉维护它,其力量就十分强大,如不维护它在关键的时候就救不了你的命。所以,希望各会员机构像维护自己生命那样确保上述两个文本的权威性,这在契约文化不足的中国很难做到,但为了保住第三方教育评价整体发展的信誉,也为了保护各个会员机构,各个机构都必须做到,若发现有确有实据的违反者,只能请出。

这次会议我们提出实现“更大的联合、更大的机遇”的目标,全国第三方教育评价机构联谊会希望促进第三方教育评价机构多元多样态发展。专业性、客观性、自身的评估伦理会是第三方安身立命的根基。

再次强调我们的信念:建立更多专业水平高、服务质量好的第三方教育评价机构,完善中国教育评价体系,形成良性教育生态,中国教育才能办得更好。