论文标题:Explainable Few-Shot Knowledge Tracing
期刊:Frontiers of Digital Education
作者:Haoxuan Li, Jifan Yu, Yuanxin Ouyang, Zhuang Liu, Wenge Rong, Huiqin Liu, Juanzi L, Zhang Xiong
发表时间:23 Sept 2025
DOI:10.1007/s44366-025-0071-x
微信链接:点击此处阅读微信文章

传统知识追踪虽借助深度学习取得进展,但与真实教学场景存在差距。一方面,传统方法依赖大量学生练习数据训练模型,而实际中教师仅通过少量练习就能分析学生知识掌握情况;另一方面,传统模型多仅预测学生答题正确性,呈“黑箱”特性,无法像教师那样解释推理过程,且难以整合学习环境中的多维信息,在开放式答题、编程学习等场景适应性不足。
研究论文
为填补这些空白,北京航空航天大学熊璋教授团队联合清华大学李娟子教授团队,在Frontiers of Digital Education(《数字教育前沿(英文)》)期刊上发表了一篇题为Explainable Few-Shot Knowledge Tracing(《可解释的少样本知识追踪》)的文章,提出可解释少样本知识追踪新范式并构建认知引导框架,为教育评估提供更贴合实际教学场景的解决方案。

图1 传统知识追踪与可解释的少样本知识追踪
研究引入大语言模型(LLMs),提出可解释少样本知识追踪任务。该任务以少量有价值的学生练习记录为输入,在追踪知识掌握情况和预测未来表现的同时,生成自然语言解释。其核心是认知引导框架,该框架借鉴教育评估系统的认知、观察、解释三要素,构建了完整的工作流程。观察模块收集学生的多维数据,并筛选出少样本输入;认知模块包含知识状态分析和表现预测子模块,前者动态分析学生对各知识概念的掌握程度,后者结合知识状态和解释信息预测学生在新任务中的表现;解释模块则生成自然语言解释,既对学生过往练习行为进行说明,也为表现预测提供依据。

图2 面向可解释少样本知识追踪的认知指导框架
在实验验证方面,研究选用FrcSub、MoocRadar、XES3G5M三个公开数据集,设计不同信息丰富度的输入模式,并与DKT、DKVMN等6种主流传统知识追踪模型对比。结果显示,GLM-4、GPT-4等大语言模型在少样本数据下,性能优于多数传统模型。同时,实验还发现题目文本信息对模型性能提升作用显著,知识概念信息效果有限;增加少样本数量能提升性能,但过多会因上下文冗长导致模型理解混乱。

图3 GLM-4 与 GPT-4 在 (a) FrcSub 和 (b) MoocRadar 上的表现
在解释质量评估上,邀请有教学经验的专家从客观和主观两方面评价。客观指标显示,模型生成的解释完整性达99.4%,对知识概念识别准确率90.2%,整体表现稳定;但主观评价中,近半数专家认为模型对知识状态建模和练习分析质量有待提升,超20%专家觉得无框架引导的解释更合理,且专家间评价一致性低,说明模型解释需进一步优化以符合教育专业判断。
未来可通过检索增强生成优化少样本选择、拓展多模态输入、将框架部署到在线学习系统等方向改进,同时需降低模型应用成本,提升解释在实际教学中的实用性,为智能辅导系统、教学聊天机器人等提供更可靠的学生知识状态分析能力,助力个性化教育开展。
文章信息
Haoxuan Li, Jifan Yu, Yuanxin Ouyang, Zhuang Liu, Wenge Rong, Huiqin Liu, Juanzi Li, Zhang Xiong. Explainable Few-Shot Knowledge Tracing. Frontiers of Digital Education, 2025, 2(4): 34 DOI:10.1007/s44366-025-0071-x

识别二维码,免费获取原文
作者信息

黎昊轩,北京航空航天大学计算机学院2025届硕士毕业生,清华大学人工智能学院在读博士研究生,现从事“人工智能+认知神经科学”的交叉研究以及人工智能赋能教育的应用研究工作。

于济凡,清华大学教育学院助理研究员,MAIC平台研发负责人,主持国家自然科学基金青年项目,清华大学水木学者博士后,研究领域关注教育人工智能,尤其是大模型驱动的多智能体学习环境等课题,深度参与清华大学AI赋能教育与学生成长项目,在国际会议和期刊上发表40余篇论文,曾获ACL最佳演示论文奖,EMNLP杰出论文奖以及CIKM最佳资源论文提名奖。

欧阳元新,北京航空航天大学计算机学院教授、博士生导师,北京市高等学校青年教学名师奖获得者,国家教材建设重点研究基地执行主任。一直从事自然语言处理、智慧教育与教育数字化等方面的研究,主持国家自然科学基金教育 与技术领域面上项目两项。

刘壮,北京联合大学智慧城市学院数据科学系讲师,北京航空航天大学计算机学院2024届博士毕业生,主要从事推荐系统、图数据挖掘、机器学习等方向的研究工作。

荣文戈,北京航空航天大学计算机学院教授、博士生导师,国际标准化组织/国际电工委员会C语言标准工作组(ISO/IEC JTC1/SC22/WG14)注册专家,国际电工委员会自主与人工智能应用伦理系统评估组(IEC/SEG10)注册专家,国家智慧城市标准化总体组副组长,全国信标委智慧城市标准工作组副组长,主要研究方向为自然语言处理、机器学习、数据挖据和信息系统等。

刘惠琴,清华大学教育学院研究员、博士生导师,清华大学深圳国际研究生院党委书记,教育部-清华大学研究生教育战略研究基地主任,清华大学工程教育研究中心主任。兼任中国学位与研究生教育学会学术委员会副主任、研究生教育学专业委员会主任,中国高等教育学会高等教育管理分会副理事长,研究领域为高等教育政策与管理、研究生教育、工程教育、未来教育与学习等。

李涓子,清华大学计算机科学与技术系长聘教授、博士生导师。长期从事知识工程与自然语言处理研究,重点研究知识驱动与数据驱动相结合的认知智能理论、方法和应用,在大规模知识获取与融合、可解释神经符号知识推理、以及大模型知识增强方面取得丰硕研究成果,并在智能科技情报和智慧教育等领域产生规模化应用。

熊璋,北京航空航天大学计算机学院教授、博士生导师,国家教材委员会科学学科专家委员会委员、国家教材建设重点研究基地主任、国家一流本科课程负责人、教育部义务教育/普通高中信息科技课程标准专家组组长、中国教育学会学术委员会委员、北京市优秀教学团队带头人,曾获国家科技进步一等奖、国家级教学成果二等奖,以及全国优秀教师、教育部跨世纪人才、有突出贡献的回国人员、北京市教学名师、北京市师德标兵等称号。
推荐阅读
重磅解读 | 数字教育研究全球十大热点 2025(免费下载)
《数字教育前沿(英文)》专题征稿 | 教师数字素养提升方法及路径探索
《数字教育前沿(英文)》专题征稿 | 中国数字教育
期刊介绍
期刊特点
1. 国际化投审稿平台Editorial Manager方便快捷。
2. 严格的同行评议(Peer Review)。
3. 免费语言润色,有力保障出版质量。
4. 不收取作者任何费用。
5. 不限文章长度。
6. 审稿周期:第一轮平均30天,投稿到录用平均60天。
7. 在线优先出版(CAP)。
8. 通过SpringerLink平台面向全球推广。
在线浏览
https://journal.hep.com.cn/fde
(中国大陆免费下载)
https://link.springer.com/journal/44366
在线投稿
https://www.editorialmanager.com/fode/
邮发代号
80-164
联系我们
fde@hep.com.cn
010-58582344, 010-58581581


特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。