在由区块链教育新媒体平台链想家主办,biendata竞赛平台承办的 MOOCCube学生行为分析挑战赛赛道二中,三支来自大数据分析与应用研究方向(大数据分析与应用安徽省重点实验室)的队伍(alphabate,nnnyt和 xiaoerbaode)取得了优异的成绩,包揽了前三名。三支队伍的队长分别是顾垠、吴金泽和沈双宏。
本次比赛中,参赛选手需要根据学生的历史作答记录以及题目的知识点、文本信息,预测学生能否答对给定题目。赛题地址为 https://biendata.xyz/competition/chaindream_mooccube_task2/
2021年1月21日,三支队伍在 bilibili直播间分享了他们的解决方案。
首先分享的是沈双宏同学,沈双宏详细介绍了他在 SIGIR2020年论文 Convolutional Knowledge Tracing中的 CKT模型,他成功地将该模型应用到本次比赛中。不同于以往的知识追踪模型,CKT模型中有一个滑动窗口,能够捕获单个学生过去一段时间内的记录,从而建模学生的个性化能力
随后,吴金泽同学分享了他们团队的技术方案。他们对实验室自研的 NueralCD模型(Fei Wang, Qi Liu, Enhong Chen, Zhenya Huang, et al., Neural Cognitive Diagnosis for Intelligent Education Systems, AAAI'2020)进行了拓展,提出了多维神经认知诊断框架(MNCD)。具体而言,多维神经认知诊断框架主要分为两个部分,即主客体建模部分以及认知关系建模部分。其中主客体建模部分设计了知识关系矩阵和知识深度映射矩阵,将学生和试题扩展到一个更高维度的复杂表示上,而不是仅仅使用标量表示学生在知识点上的能力或题目在某一方面的要求。认知关系建模部分,采用了一种直观通用的方式,用主客体表征的差值衡量学生的表现,并进行得分预测。
最后分享的是顾垠同学,他首先分析了数据的稀疏性,学生做题时间顺序以及时间跨度。然后顾垠又介绍了两种模型:DKT和DKTR。由于题目数据的稀疏性,DKT只考虑了题目的知识点信息。DKT的做法是一种简化,而 DKTR通过 Rasch Model-Based Embeddings,可以考虑同一知识点下不同题目的差异。在复赛阶段,顾垠组的最高成绩由 DKTR取得。
最后主持人对整个比赛作了一个总结,本次比赛分享圆满落幕。
本次比赛取得的好成绩,得益于大数据分析与应用安徽省重点实验室在智能教育领域的深厚积淀和科研实力。实验室多年来致力于通过人工智能技术助力学生的个性化学习和教师的精准教学,在认知诊断和知识追踪等核心任务方面皆取得了多项研究成果。部分研究成果已落地应用于智能教育平台。
实验室相关研究小组主页:http://base.ustc.edu.cn/
实验室整理的公开数据和代码资源:https://github.com/bigdata-ustc