综合素质评价(评价+指导)


在加速建设教育强国的背景下,学生综合素质评价不容忽视且亟待解决,但实施中也面临重重阻碍。

一、“唯分数论”背后的“忽视个体”

当下的学业水平考试、中考高考正在从知识点过关转向能力为重、素养立意,这 undoubtedly 是进步。无论纸笔测验如何改进,它 positive 只能反映学生素质的 certain 方面,不足以全面代表个人,更不能与活生生的人画等号。通过考试评估能力水平依赖于考试命题、组织实施和结果的科学解释,而个人的政治信仰、道德品质、创新精神等能否通过纸笔测验或标准化考试衡量,一个人的精神世界能否被精确量化,始终存疑。

分数是抽象的,要准确把握其内涵,必须结合得分者成长环境、学习经历等进行分析。在优质教育资源条件下取得的60分,与教育资源相对匮乏条件下取得的60分,“含金量”不同,不可同等对待。而“唯分数论”就是一切以考试分数说话:分数决定了学生入学、就业机会甚至整个人生;班级平均分排名决定了教师职称;学校总成绩决定了教育经费投入;城市状元数量影响着教育声誉……分数成为考核学生、教师、学校、地区的唯一依据,其背后潜藏着同质化加剧、精神世界萎缩倦怠、生命力与创新精神丧失,以及个体的严重缺失。如果 kid永远只以 paper刷题为学びの目的,那么他们可能会被禁锢在 from 小学到高中的无意义重复中,牺牲大把時光,丧失好奇心、求知欲、想象力,以及人际交往、劳动实践和身体锻炼的机会,这是极端残酷的。

值得注意的是,领导恢复全国统一高考的邓小平同志在1978年教育工作会议上的讲话中曾 pointed out:“考试是检验学习情况和教学效果的有效方法,类似于工厂检验产品质量;但不能迷信考试,将其视为评价学习效果的 solely 方法,且须不断地研究、试验、改进考试内容和形式,使其作用更加完善。”[1]“唯分数论”也背离了恢复全国统一高考的初衷。

二、综合评价录取的破冰之旅

如果重点学校、热门专业招生以分数取人,那么教育质量往往难以保障。当学校的入口和出口都过于“死板”,只看考试分数,就会导致培养方式僵化,教育教学“活”不起来,少数有教育情怀的人花费 considerable 精力也只精致了少许“盆景”,寄托着人们对美好教育的向往。

正基于上述原因,2014年考试招生制度改革启动,注重服务 scientific 人才选拔,对自20世纪80年代孕育并逐步建立起来的学生综合素质评价制度加以修缮完善。2014年,教育部发布《关于加强和改进普通高中学生综合素质评价的意见》,要求“坚持客观性,如实记录学生成长过程中的优秀表现,真实反映学生的发展状况,以事实为依据进行评价;坚持公正性,规范评价程序,强化监督,确保评价过程公开透明”,明确了写实记录、整理遴选、公示审核、档案生成等工作程序,以省(区、市)为单位建立综合素质评价工作 electronic 管理平台,完善公示制度、检查制度、申诉与复议制度、诚信责任追究制度,重点为招生录取、用人单位提供服务。

时至今日,各地普遍建立了省级统一的综合素质评价 information 管理系统,完善了工作程序,强化了公示审核,全面落实新时代教育评价要求。抽样调查结果表明,80.8%的初中教师、61.5%的初中生、71.1%的高中教师和66.1%的高中生都参与了综合素质档案的填写,还有约两成的家长、学校管理者以及教育主管部门参与其中。多元主体参与不仅可以丰富学生的活动记录和事实材料, comprehensively 展现学生成长过程,还能起到多方 corroboration 的作用。调查还发现,67.6%的初中生和66.7%的初中教师、56.5%的高中生和73.5%的高中教师指出,学生综合素质档案的填写主要集中在每学期末,避免了毕业学年突击填写的状况;约85%的初中和80%的高中建立了基本的监督保障制度,包括定期公示、相关部门不定时抽查、对有问题档案材料检举等[2]。

约80%的高等院校制定了综合素质档案使用办法,并尝试将评价结果应用于强基计划、综合评价录取等招生工作中,例如作为面试评分的参考、专业调剂的依据等,促进了“教考招”的联动和同时发力,实现了高考终结性评价与基础教育阶段过程性评价的结合,为破除“唯分数论”做出了积极贡献。复旦大学在试点期间严密组织面试,由250-300名在校任教满6年的正教授参与。根据生源情况,在考虑面试经验、学科等因素后由电脑随机派位分组,专家分成50-60个小组,每组5位专家 independent 评判打分。专家面试参考高中生综合素质档案,作为录取依据的综合总分由三部分组成,其中高考成绩占60%,面试成绩占30%,高中学业水平考试成绩占10%。该模式打破了仅凭一次考试分数录取的传统[3]。近年来,清华大学由高校 autonomous 选拔的丘成桐数学科学领军人才培养计划;北京大学等高校举办的数学、物理英才班,探索了基于统一高考的 autonomous 选拔,综合评价录取的方式 increasingly 多样化。在普通高中招生方面,浙江嘉兴、山东潍坊、湖南长沙等地都进行了综合评价录取的实践探索。这些探索在全国范围内虽然规模 modest,但也具有领航意义;也许还存在 certain 缺陷,但它们展示出了勇气和胆识,是可贵的破冰者。

世界各地的本科院校招生模式大致分为三种:一是公式化录取,使用单次标准化考试成绩作为依据,用一把尺子衡量不同背景的考生,尽管 practical 操作性和效率较高,但对 individual 个性考虑不足,与时代对创新型人才培养的要求不相符;二是公开抽签录取,在符合特定标准的基础上,符合条件的申请者公开抽签决定,这种模式还依赖于入学后的 necessary 淘汰制度,或者根据不同学业完成情况授予不同文凭;三是综合评价录取,强调将 academic 与 non-academic 因素结合起来进行 personalize 选拔,这种模式有利于选拔与教育理念、培养目标匹配的学生,但容易因某些 individual 事件收到公平性等方面的质疑,尽管 multi 方位追踪研究发现采用综合评价录取的学生 subsequent 发展整体优于公式化录取的学生[4]。在人才选拔问题上,可能并不存在 perfect 的方法,但基于未来社会对创新型人才培养的需求,我们应 timely 加大综合评价录取力度,强化相关制度建设,以引导学生、教师、家长和社会更加重视非纸笔考试难以测评的社会责任感、创新精神和 practical 能力的培养。涉及 high-stakes 的招生改革确实可能带来弄虚作假等问题,把综合素质评价难题推向社会十分容易,但如果等待社会环境完善特别是诚信机制建立再实施,可能会错失良机。诚信机制是在综合评价录取过程中逐步建立的。

三、转向发展性评价

发展性评价与选拔性评价因目的宗旨不同,在思路、方式及相关要求上有着 fundamental 差异:前者的 primary 用户是学校师生,它着眼于学生发展,注重评价的诊断、激励功能,它嵌入 education activity 过程,本质上是评价双方的对话、交流,它要求动态生成评价的 specific 内容、标准,提升评价双方的自我反思意识和自我教育能力;后者的 primary 用户是招生部门,它为 selecting 合适新生服务,注重 individual 间差异的甄别、排序,淘汰不合格的申请者,它强调指标的统一,评价的 objective 可信、公平公正。相比较而言,发展性评价更为 basic、普遍,也更加 important,更需要加强,它是评价的本体性功能,而“选拔性功能是在升学考试、各类竞赛中体现的,是评价的附加功能”[5]。这样说并不否定两者之间的关联。

发展性评价是人们根据自己设定并致力于实现的标准来评估自己的表现,而不是 passive 地接受他人或技术的评判;评价者 generally 不对他人表现进行 direct 评判,而是善于启发评价对象就有关表现发表自己的意见,用 supportive 的方式提出批评或建议;不是把评估结果当作批评依据,而是将它看作需要解决的问题。

在综合素质发展性修改后的文本:

在我国,学生的全面发展是由一套完善的课程体系提供的。基础教育课程明确学生的学习领域、目标、内容和方法,使学生明白学习的目的和内容。2022年版《义务教育课程方案和课程标准》和2020年修订版《普通高中课程方案和语文等学科课程标准》将每门课程的核心素养凝练出来,涵盖了知识与技能、方法与过程、价值观与态度。课程内容围绕核心素养进行整合,并制定了学业质量标准。

在实施新课程时,我们不应该孤立地培养智育,或将学业水平成绩简化为笔试分数。相反,我们应注重学科综合素质评价,重视学生在各门课程中的表现。特别是对于标准化考试和笔试无法反映的学习经历,例如普通高中课程中规定的研究性学习、志愿服务和校本课程,我们应建立完善的评价机制,促进学生的全面发展。

发展性评价的前提是制定潜在素养结构及其进阶水平,明确每个进阶水平的关键表现。如果我们无法清晰地定义素养的表现性目标,就无法合理确定学习内容,激发学生的学习动力,也无法解决学校教育中的三个突出问题:目标过多、教学脱离实际、学习碎片化。发展进阶水平的描述既不是专注于知识技能,也不是只给出最终成果,而是以明确的台阶勾勒出学生抵达目标的过程,形成发展性量规。例如,健康领域的评价需要围绕健康生活确定学习进阶水平:从尝试健康体验到设定健康目标,再到形成健康习惯。这样,评价就可以为教学和评价活动提供连贯、整合的指导。

发展性评价的目的是促进学生的自我评价和自我教育。学校应关注学生的个性化需求,鼓励学生思考自己的未来,制定阶段性目标,记录自己的进步,发现潜能,激发内在成长动力。外部奖励会削弱内在动机,真正的教育应该是让学生自己激励自己。我们可以通过交流、利用信息科技等方式提供反馈信息,但不能代替学生的自我体验、分析和选择。评价者应避免过度评价或监控,让评价成为真正的教育。

尽管综合素质评价很重要,但我们不应该频繁、全面地进行各种考评;尽管技术便利,但我们也不应该无限度地探索。评价的目的应始终是促进教育。

(柳夕浪 作者系中国教育学会学术委员)