基于短文本聚类的学生评教方案设计

基于短文本聚类的学生评教方案设计

基于短文本聚类的学生评教方案设计

[摘 要]高校学生评教对提高高等教育质量至关重要。学生评教的直接目的是对该门课程的任课教师的教学效果做出评价,但是更重要的是为了总结和分析教师的教学经验,为本科教学质量的稳定提高找到科学的方法和规范。然而,当前高校学生评教方案的缺陷是在学生评教过程中,评教的指标过多并且以打分的形式,浪费了学生许多宝贵的时间;而且仅仅通过评教得分,并不能给出老师较好的建议。鉴于短文本聚类与分析技术的快速发展,提出基于短文本聚类的学生评教方案,一定程度上可以弥补这个缺陷。

[关键词]短文本聚类;学生评教方案;评教得分

[中图分类号] G473 [文献标识码] A [文章编号] 1674-9324(2020)44-0-02 [收稿日期] 2019-09-25

目前多数高校把学生评教系统作为教师教学质量监控的重要方式,但在该系统实际的操作过程中出现一些问题急需进一步的完善和解决[1]。本文聚焦于如何改进现有评教方案,提出基于短文本聚类的学生评教方案,以节约学生评教时间和更好的发挥高校学生评教的作用。

一、当今评教方案的优势和弊端

高校教师的教学水平是影响高等教育最为关键的因素,学生评教是督促教师不断改进教学质量的有效方法。学生评教就是学生对本门课程教师的教学态度与方法,教学组织安排,教学效果与语言表达,教学内容的科学性与前沿性,板书质量,作业批改情况,答疑辅导情况等等进行评价,给每一项内容打上相应的等级或分数,然后由相关部门合计成明确的总分,反馈给任课教师。这个结果往往会被作为考核教师的重要依据,这同教师的评优、职称和晋级都有着重要的联系。学生评教与专家评教、同行评教、领导或督导评教等方式相比,其结果较少受到社会人际关系的影响,可信度较高。

然而,学生评教也有诸多弊端,对高等教育教学发展工作不利。由于高等院校设置的二级学院及每个学院开设的专业种类较多,对于不同的学院,不同的专业,其学生理解水平、对课程的感兴趣程度及课程难度系数等方面存在着一些差异。如果一个班级中绝大部分同学对某门课程内容比较感兴趣,他们的学习积极性就较高,学习过程中就会收获更多的知识和乐趣,该门课程的任课老师就会更加受同学们欢迎及得到较高的学生评分;反之,遇到难度大、较难理解并且课时量又比较少的课程,大部分同学很难学懂,或者需要学生自己花较多时间练习才能掌握的课程,他们的学习积极性就较低,甚至学习过程中有抵触情绪,在对该门课程任课老师评价时,就会比较随意、给比较低的评分,有失客观性[2]。

有些学生因违纪受到老師批评或者由于个人原因不喜欢某位老师,就可能用各种方式影响和鼓动其他的同学对老师做出不好的评价。因此,不是所有的同学都能正确理解评教的目的和意义,也不是所有的同学都能够准确地理解评价标准。有些学生仅仅根据老师行为的表面现象,不去思考教师这样做的根本目的是什么,对同学的未来有什么重要的影响。还有为数不少的同学厌倦评教,只是迫于高校相关政策而不得不评,因此他们极可能对评教敷衍了事或者盲目评价一通。在上述诸如此类的情况中评教已完全失去其意义。

分数是一个抽象的数字,我们也不能断定得96分的教师课堂教学质量一定比95分的教师教学质量好。从得分数值来看,微小的差别是合情合理的,不影响数据的有效性,然而对于评教结果的排名和教学水平等级的确定,却有着重大的意义。有时0.001分的差别,就可能分属不同的等级,进而待遇不同,这对教师来说是不公平的,也打击了教师教书育人的积极性。

评教确实重要,但不是简单的评出谁好谁劣,而是要帮助老师正确地认识自己,认识自己教学工作不足之处。针对当前高校学生评教存在着诸多弊端,本文提出一种基于短文本聚类的改进的学生评教方案,可以一定程度上消除一些弊端,取得更多的良好效果,以帮助教师和教学管理部门积极改进教学设计、合理安排教学内容,提高教学质量。这样可以让老师带着自信走进教室,让老师坦然、安然、愉快地传道授业解惑,为教育健康发展做出更大的奉献。

二、基于短文本聚类的学生评教方案设计

短文本是一类数据的总称,它主要是指文本的宇数比较少的、经常用短语代替句子的一类数据。随着Web2.0技术的发展,社交媒体方便、实时的特点,用户产生的信息以短文本为主。当代高校学生和教师也已经习惯了网络上的短小精悍、易于写作和阅读的短文本。我们从手机短消息、微信消息和评论、QQ消息和空间评论、电子商务网站的商品评论信息、Facebook和Twitter上的留言和评论可以看出,网络上的短文本交流已经成了人们日常非常重要的交流方式之一。因此关于短文本分析的理论和技术发展很快。本评教方案是基于频繁词集词共现网络的短文本聚类算法[2](也称为FWN短文本聚类算法)的改进,针对学生评教短文本进行自动聚类和为每一个生成的文本类自动生成类标签。短文本聚类算法得到的聚类结果一般能够使得主题相关的文本在一个类别内,不同主题的文本在不同类别。本文中,我们把一个班级学生对某位教师的评价都放在一个文本中,每一位同学的评论是文本的一个段落。这样对教师评教信息的聚类,就映射成了对文本的聚类。

针对学生评教信息的短文本聚类算法的流程如下[3]。Step1:数据预处理;Step2:挖掘频繁词集;Step3:构建频繁词集网络(Frequent Word Net,FWN);Step 4:挖掘话题社区;Step5:聚类算法;Step6:生成聚类标签。

Step 1:数据预处理。高校学生素质较高,其短文本评论一般来说主题明确、表达清晰而且用词范围较小,因此我们可以根据大量的评教短文本来设计专用的可以动态更新的中文分词器,这比直接选用一般的类似Jcseg中文分词器的效率高得多。

Step 2:频繁词集挖掘。使用FP-Growth算法执行评教短文本频繁词集挖掘任务。

Step 3:频繁词集网络构建。FWN网络是基于词在K(设置K≥1)频繁词集中的词共现关系构建的网络,即频繁词集中所有的词为节点,如果两个词同时在同一个频繁词集中出现,那么就认为他们之间存在一条边。

Step 4:话题社区挖掘。频繁词集共现网络是根据词在K(鉴于评教短文本自身特点,设置K≥4)频繁词集中的共现关系构建的网络,FWN网络将词抽象成网络中的节点,将词在频繁词集中的共现关系抽象称为网络中的边。

Step 5:评教信息文本聚类。首先采用一种基于目标函数优化的社区发现算法找到FWN网络中存在的话题社区,这样就找到了语料数据中存在的话题及其具有的特征词集合;然后计算特征词集合和短文本之间的相似度以进行聚类,采用K-means聚类方法,类别数设置为3。

Step 6:聚类标签生成。采用一种生成类标签的算法来生成一个易读易理解的标签,其目的是让此标签对同一个类里的短文本内容进行简要的概括。

三、结论

针对当前诸多打分的高校学生评教方案,如果高校强制要求学生网上评教而不是让学生主动地参与到评教中来,这样他们就会带着一些反感情绪给出不够客观的评教得分。如果同学旷课较多,对课程教学方式和过程不熟悉,对课程内容一知半解,那么他们的评教数据也不够准确。上述诸如此类的问题,如果采用本文提出的基于短文本聚类的评教方案都可以有效应对,本文方案实行是要建立在学生自愿的基础上的,这样做是获得有效评教数据的必要前提。让自愿评教的同学用文字留下自己的真实观点,然后针对同学的评论用短文本聚类分析技术,分析出教师教授该门课程的优势与不足。

参考文献

[1]蒋鹭婷.浅谈高校学生网上评教的问题及对策[J].科教导刊(上旬刊),2018(09):16-18.

[2]姜允志,宋新红.高校学生评教系统中存在的若干问题及对策研究[J].教育教学论坛,2019(44):239-240.

[3]李伟.基于频繁词集词共现网络的短文本聚类方法[D].北京交通大学,2016.