分享

E

 书法初步 2016-02-19

E-learning评论文本的情感分类研究

本文由《开放教育研究》杂志授权发布

作者:潘怡、叶辉、邹军华

摘要

自本世纪初起,E-learning作为一种灵活、丰富、高效的学习方式,被越来越多的学习者接受,而伴随着学习技术的逐步成熟,学习者对E-Learning应用的要求也从最初的知识推送提升到能够在讲授者与学习者之间搭建有效的沟通桥梁,将零反馈的封闭式学习变成多反馈的协作学习。E-learning的评论信息隐含了学习者在学习中遇到的问题和建议,从中可挖掘学习者对学习资源及授课者的意见。这对改善教学模式、完善教学支持服务意义重要。现有E-learning系统所提供的海量评论信息中正面评论与负面评论夹杂,给挖掘学习者的真实意见和需求带来困难。本文对文本情感分类过程进行归纳,构建了一种情感分类应用模型,在完成预处理、创建词典、提取情感特征后实现了一个情感分类引擎,并将该引擎与实际系统整合。改进后的系统能够将学习者的评论文本自动分为正面评论、负面评论和中性评论,实际性能及用户体验评价结果表明,新的基于情感单元的情感分类方法能满足E-learning评论文本的情感分类需求。

一、引言

自2000年起,伴随计算机网络技术及多媒体教育的兴起,E-learning(吴战杰,2013)发展迅速,在线学习与传统课堂学习效果的比较成为研究热点。尽管多数学者相信E-Learning的学习效果和传统授课方式的效果类似,但仍有不少人坚持认为前者的学习效果有待改进。美国Pew研究中心对2124名成人抽样调查结果表明,仅29%的受访者认为在线学习与传统课堂授课效果相似(Bell & Federman,2013)。究其根本,这与E-learning未能在讲授者与学习者之间架起有效的沟通桥梁不无关系。由于讲授者不能及时从学习者处获得有效反馈,各类E-learning平台目前仅能呈现较低层次的学习过程,讲授者无法引导学习者展开深入探讨。

文本情感分析,又称情感分析(Sentimen Analysis),采用数据挖掘技术对用户发布文本中所包含的观点、情绪等进行分析,对用户的情感倾向如“赞同”“反对”或“无所谓”等作出判断。随着Web2.0的兴起与发展,用户主动发布信息越来越多,如各种新闻、产品评论、论坛帖子、Blog等,他们不仅是信息浏览者,也是信息提供者。这些由用户主动发布的信息往往表达了他们对某一主题或事件的看法,或对某一产品的意见,有的还蕴含了用户的兴趣爱好和个性特征,反映了用户对某一事物的情感或态度。如果将文本分类研究视角扩展至发布在学习平台上的评论,识别隐含其中的情感信息,发现学习者情感变化的规律,并将这些规律及时反馈给讲授者,则有助于讲授者判断学习者对讲授课程及讲授方式所持有的情感倾向,从而调整授课内容及方式,有效促进E-learning的认知深度,提高E-learning效果。

早在1997年,哈兹瓦斯罗和麦基翁就尝试使用监督学习方法(Hatzivassiloglou & McKeown,1997),对英文词语进行情感语义倾向性判别,2002年庞等(Pang & Lillian,2002)提出了文本情感分类(Sentiment Classification),并使用传统的三种机器学习方法对电影评论按照“正面”和“负面”情感进行分类。同年,特尼(Turney,2002)提出了基于情感种子词与PMI的无监督情感分类方法。2008年,第一届中文倾向性分析评测会议(Chinese Opinion Analysis Evaluation)在北京召开,与会专家指出文本倾向性分析已成为自然语言处理的热点。特征项选择方式对分类算法效果有较大影响。王素格和朱嫣岚等分别基于同义词词集和HowNet(《知网》)研究了中文词汇的情感倾向(王素格,魏英杰,2008;朱嫣岚等,2006),陈建美等(2009)通过语法特征提取,利用条件随机场(Conditional Random Fields)自动发现情感词汇;王根等(2007)利用多重冗余标记CRFs分析句子的情感倾向;樊娜等(2009)利用主题概念和CRF研究了主题情感句的分析与提取;夏云庆等(2010)提出情感向量空间模型,并研究了歌词情感分类的应用,闻彬等(2010)和姚天昉等(2008)分别研究了文本情感分类和文本意见挖掘;王洪伟等(2010)对Web文本情感分类的研究进行了探讨,将情感分类分为主客观分类、极性判别和强度判别三类任务,分析了情感分类中的语料库选择和研究难点。随着情感分析技术的不断成熟,目前许多大型公司都试图应用情感分析,挖掘用户对产品的看法和意见,以此修改产品的相关设计或向用户推荐符合个性需求的产品。例如,贝尔开发了产品评论意见挖掘系统(Bell & Federman,2013),通过对用户评论的分析,统计用户对产品的意见,并以友好方式呈现,方便用户选购时与其它产品进行比较。

在教育领域,近年虽然出现了许多交互性E-learning平台,学习者可通过留言板、资源评论、课程评论、教师评论等提交评论,但这些评论信息却没有得到有效利用,主要原因在于评论信息太多,且正面与负面评价相互掺杂,难以分析学习者的看法。如何应用情感分析从这些评论文本中挖掘学习者对教育资源和网络课程的情感态度,对E-learning的发展意义重大。本文首先从技术层面概括了文本情感分析的一般过程原理和技术,提出了情感分类在E-learning中的应用模型,实现了评论文本情感分类引擎,并将其整合到“课程在线”中进行应用评价。本文为文本情感分析技术在教育中的研究与应用跨出了第一步,希望能起抛砖引玉的作用。

二、文本情感分析及关键技术

情感分析有广义和狭义之分。广义情感分析包含分析文本中说话人的心理,狭义情感分析则主要判断说话人关于某物或某事的观点是“赞同”还是“反对”。可见,狭义的情感分类实际上是一种文本分类,其基本过程和技术与文本分类近似,涉及领域同样包括人工智能、Web文本分类、文本挖掘、心理学等。与自动文本分类不同的是,传统的文本分类目标是挖掘文本主题的归属,不涉及用户情感的内容。本文探讨的文本情感分类,主要是分析并判别分类文本中所包含的各种用户情感信息,如积极或消极、肯定或否定、喜爱或厌恶等。

(一)基本过程

文本情感分类技术是文本分类技术的一种新形式,基本过程和分类算法与文本分类大致相同(见图1),主要区别在于特征提取阶段。文本情感分类更注重情感特征的提取,而非主题特征的提取。

E-learning评论文本的情感分类研究

由图1可以看出,文本情感分类过程依次经过五个环节:

1)收集数据。要分析用户对某一事物的情感态度,首先需要收集用户的评论信息。目前,用户评论数据的来源主要有网站留言板、产品在线评论、产品论坛、新闻评论等。

2)预处理。为了减少干扰,提高情感分类的效率和准确性,在特征提取和分类前需要对文本进行预处理。根据不同的文本特性和算法要求,预处理需要完成不同的任务。对中文文本,预处理一般需要进行中文分词、词性标注、去停用词等操作。

3)主观句识别。对长文本,往往需要借助情感语义词典识别文本主观性句子,以在后期分类阶段进行情感判断。对内容较短的评论文本,一般不需要经过主观句识别。

4)情感特征提取。情感特征提取是文本情感分类与普通文本分类的最大区别。情感特征提取需提取反映用户情感倾向的文本特征词汇,如形容词、否定词等。而普通文本分类中提取的是反映文本内容主题的特征词汇,如关键词、主题词等。因此,普通文本分类使用的TF-DF、信息熵、互信息以及卡方检验等特征提取算法在文本情感分类中无法直接使用。对于情感特征的提取目前主要通过情感语义词典实现。

5)文本情感类别判断。提取文本的情感特征后,要构建情感模型,并使用常规文本分类算法完成文本情感类别分析,其主要分类算法有朴素贝叶斯、支持向量机(Support Vector Machine,SVM)等。目前对情感模型研究相对较少,一般将评论文本的情感分正面、负面和中性三类。当然,研究者也可以通过表意非常明显的特征直接进行判断。

(二)基于情感单元的情感特征提取

情感特征提取是文本情感分析的主要任务之一。情感语义词典是情感特征提取的主要来源,算法将隐含在文本中,表示情感的词汇提取出来形成情感特征词,然后将文本表示为向量空间模型SVM,提交给Bayes或SVM分类器进行情感分类。但是,以词汇为特征的向量空间模型存在以下问题:

1)无法消除某些与情感表达无关的词汇;2)很多情感词汇存在歧义,SVM无法消除词汇歧义;3)基于情感词汇的SVM没有考虑否定词和修饰词在情感表达中的重要作用;4)评论文本一般较短,基于情感词汇的SVM中特征词汇过多,容易导致产生数据稀疏的SVM。针对以上问题,清华大学夏云庆等(2010)提出“情感单元”概念,在定义对象的情感特征时将情感单元作为其单位元素,组织构成相应的向量空间模型。

基于情感单元的情感特征包括以下三部分(夏云庆等,2010):

1)情感词典。它可形式化地描述为一个三元组L={C,N,M},C={ci},i=1,…,I;N={nj},j=1,…J;M={mt},t=1,…,T。其中C是情感词集,每个情感词都被赋予一个表示正面或负面极性强度的数值,正数表示正面情感,负数表示负面情感。N是否定词集,M是修饰词集,每个修饰词用一个正数表示加强情感强度,用一个负数表示减弱情感强度。

2)情感单元。情感单元是在约定大小的上下文窗口中出现的情感词、否定词和修饰词及其强度数值。它可形式化地表示为U={ci,nj,mt},ci表示窗口出现的情感词及其对应的极性强度,nj表示窗口出现的否定词及其频率,mt表示窗口出现的修饰词及其修饰强度。

3)情感特征。根据情感单元定义和汉语情感表达习惯,可总结如下6组12种情感特征(见表一)。

E-learning评论文本的情感分类研究

基于情感单元的情感特征去掉与情感表达无关的词汇,通过上下文窗口能在一定程度上消除歧义,还考虑了否定词和修饰词对情感表达的置反作用等,能较好地提高情感分类的准确性。此外,只有12个情感特征,向量维度低,不仅可避免数据稀疏,还能提高情感分类计算的复杂度。

三、应用模型

在Web2.0技术影响下,E-learning平台中学习者、教师、管理者之间的交互变得容易、频繁、便捷。除同步视频、在线聊天等实时、同步交互方式外,留言板、教育资源评论、网络课程评论等延时、异步交互方式也扮演重要角色。E-learning相对于传统教学的最大优点在于它使学习可以发生在任何时间、任何地点。从这个角度讲,延时、异步的交互方式比实时、同步交互方式更具重要作用。目前,学习者通过留言板、教育资源评论、网络课程评论发布的正面信息与负面信息相互夹杂,使教师和管理者无法从中挖掘学习者的真实需求,严重阻碍学习者与教师和管理者间的交互。情感分类通过对评论文本的语义分析,判断评论者对某一事物的情感态度,为评论文本的情感分类开辟了新道路。

通过对现有E-learning平台各模块的分析可知,情感分类最直接、最简单的应用就是对留言板、教育资源评论和网络课程评论发布的信息进行情感判断,并按照情感分类显示给学习者、教师和管理者。具体应用模型见图2。

E-learning评论文本的情感分类研究

将E-learning的评论文本引入情感分类,从系统架构的角度看,需要从三个部分作出调整,它们分别为:E-learning平台、E-learning管理平台和数据存储。从用户使用角度看,情感分类会给三类成员带来新的使用体验,他们是学习者、教师和系统管理员。

E-learning平台的主要功能是供学习者浏览学习资源,学习网络课程,与教师和其他学习者相互交流。引入情感分类后的E-learning平台出现的最大区别在于:学习资源和网络课程的评论信息按照情感极性分类显示。学习者可较快了解某一学习资源或某门网络课程的优缺点,选择更加适合自己的学习资源和网络课程。

为了实现评论信息按照情感极性分类显示,我们在系统模型中作了两点调整:1)在留言板、资源评论和网络课程评论中引入情感分类引擎,用于判断评论信息的情感极性;2)在评论信息数据存储中加入“情感极性”字段,用于存储评论信息的情感类别和情感强度;3)在向学习者展示评论信息时,需要读取数据存储中保存的情感极性和强度,按照情感类别分组和按照情感强度排序显示。

E-learning教学管理平台的主要功能是让教师上传、发布和管理教学资源,远距离实时授课,布置学习任务,查看学习者留言并与学习者交流。引入情感分类后的教学管理平台将使教师和管理者产生新的使用体验:他们面对的不再是混杂、海量的评论信息,而是一份正面评论与负面评论的统计报告,外加一段简短的建议。要实现这种新的使用体验,教学管理平台需作如下调整:1)从数据存储中读取评论信息的情感类别和强度,并进行简单的统计,如正面、负面评论的条数;2)对同类评论信息利用数据挖掘技术,发现评论的关键对象或属性,并生成意见摘要。

通过对上述应用模型的分析可知,对评论文本引入情感分类后具有如下特征:1)学习者通过分类显示的评论信息,可更清晰、快捷地发现优质的学习资源,选择适合自己学习风格的网络课程;2)教师和管理人员通过评论信息统计报告和建议摘要,能够制作满足学习者需要的优质教学资源,解决教学问题,提高教学能力;3)通过对学习者评论信息的挖掘,发现学习者的学习风格等特质,提供个性化服务。

四、情感分类系统的实现

长沙学院“课程在线”是典型的E-learning系统,主要用于辅助课堂教学或网络教学。教师可通过“课程在线”建设网络课程,包括课程大纲、讲义、课堂视频和其它扩展性学习资源,供学生下载;学习者可选修自己感兴趣的课程,通过审核后便可进入“课程在线”平台浏览课程视频,下载相关学习资源,与其他学习者和教师讨论交流。学习者还可通过留言板、学习资源评论和课程评论三模块发表评论信息。根据E-Learning评论文本的情感分类应用模型,我们在三个评论模块中引入情感分类技术,将评论信息按照情感极性分为正面评论、负面评论、中性评论,并统计每个类别评论的数量。

实现“课程在线”中评论文本的情感分类系统,关键在于情感分类引擎的实现。通过对情感分类基本过程及关键技术的研究,情感分类引擎中关键模块的技术实现如下:

1)预处理。主要工作包括:中文分词、词性标注、去停用词。ICTCLAS是目前最成熟且综合性能最优的中文分词软件之一,可实现中文分词和词性标注。各种词典数据压缩后不到3M,且支持用户自定义词典。本文中使用的停用词表在原有基础上除去了形容词、副词和动词。

2)相关词典。本研究采用表一的12个情感单元作为情感特征,系统的情感分类引擎实现需要三类词典:情感词典、否定词词典、修饰词词典。本文使用HowNet在2007年发布的“情感分析用词语集”(董振东等,2007)中的中文评价和情感词语作为情感词典,使用中文的程度级别词语作为修饰词词典。否定词词典由人工从HowNet中抽取22个否定副词组成。

3)情感特征提取。情感特征提取的关键是从预处理后的句子中找出情感词,然后在一定的窗口大小中找出情感词的修饰词和否定词。本文通过对情感词典中所有情感词的词性统计,得出情感词的词性主要为名词、动词、形容词,因而本文将选取文本中名词、动词和形容词作为主要候选匹配词,并采用二叉树形式存储情感词典,以提高情感特征词的匹配效率。如果匹配成功,再根据夏云庆提出的五条抽取规则(夏云庆等,2010),以七个词语作为窗口大小,抽取情感词的修饰词和否定词。根据情感词极性,修饰词和否定词数量,计算评论文本中每个情感单元的权值,形成情感向量空间模型。

4)情感分类器。在情感分类阶段,本研究选择性能较好的SVM分类算法,采用LibSVM工具实现。台湾大学开发的支持SVM的机器学习开源软件,能实现数据分类及回归分析功能,且灵活易扩展,应用非常广泛。

五、实验结果及分析

为了验证一般情感分类方法对E-learning评论文本进行情感分类的有效性,以及情感分类对E-learning的促进作用,本文从两方面进行实验:一是情感分类的准确性;二是学习者、教师和管理员在使用情感分类后的评价。

(1)情感分类准确性

目前,情感分类方法的准确性主要采用准确率评价。准确率指对一个测试集进行情感分类后,分类正确的文本数量占测试集文本总数的百分比。为了计算基于情感单元和SVM的情感分类方法对评论文本分类的准确率,首先需要构建评论文本情感分类语料库。本文从“课程在线”平台的留言板、资源评论和课程评论三部分的评论文本中选择450条评论作为实验语料,对挑选的语料进行人工情感极性判断,人工分类后的语料(见表二)。

E-learning评论文本的情感分类研究

实验采用LibSVM默认的参数配置,选取每种语料类型的2/3作为训练集,将其余的1/3作为测试集。

学习者、教师和系统管理员是E-learning平台的直接使用者,对情感分类的引入有切身体验。为了了解他们对情感分类的使用感受,本研究随机抽取“课程在线”的42名教师、72名学生和12名管理员作为调查样本,让他们对情感分类功能打分,打分范围为0~10。0~4分代表负面(不准确),5~7分代表中性(基本准确),8~10分代表正面(准确),统计结果见表三。

E-learning评论文本的情感分类研究

由实验结果可以看出,基于情感单元和SVM的情感分类方法基本可满足E-learning评论文本情感分类的要求,平均准确率在80%以上。但是,相对于一般的产品评论情感分类,E-learning评论文本的情感分类准确率明显略低。这也从另外一方面证明E-learning评论文本在情感表达上有自身的特点,研究针对E-learning中评论文本的情感分类方法是必要的。

(2)实用性评价

本研究还让使用者进行实用性评价,打分范围为0~10。0~2分代表“不实用”,3~4分代表“实用性较差”,5~6分代表“较实用”,7~8分代表“很实用”,9~10分代表“非常实用”,结果见表四。

E-learning评论文本的情感分类研究

由实验结果可看出,所有学习者、教师和管理员都肯定情感分类在E-learning中的实用性。82.15%的受访者认为非常实用或很实用。由此可见,情感分类的引入有效地提高了E-learning平台的可用性。

六、结语

用户在互联网上发布信息直接或间接地表达他们对事物的情感态度,从中挖掘他们的情感态度意义重要。在E-learning平台中,从学习者的评论文本或Blog中挖掘学习者对网络课程、学习资源和教学平台的情感态度,对促进E-learning发展作用重大。本文首先归纳了文本情感分类的五个步骤:数据收集、文本预处理、评价主观句识别、提取文本情感特征词汇以及分析并判读文本所属情感类别,指出情感特征提取是文本情感分析与普通文本分类的主要区别,也是文本情感分类的关键技术。目前以词汇为特征的向量空间模型存在一定问题,宜选用以情感单元为情感特征单位,构建情感向量空间模型,并将其引入具体课程在线论坛的情感文本分类引擎,完成预处理、创建词典、提取情感特征及最后分类等工作。实验表明,基于情感单元和SVM的情感分类方法基本可以满足E-learning评论文本情感分类的要求,平均准确率在80%以上;学习者、教师和管理员肯定了情感分类在E-learning中的实用性。由此可见,情感分类的引入有效地改进了E-learning平台的可用性。但是,文本情感分析技术在E-Learning中的应用远不止于此,还需进一步研究。此外,情感表达的复杂性与情感模型的科学性,提取更合适的情感特征,提高情感分类的准确率等,这些都期待开展更深入的研究。

E-learning评论文本的情感分类研究

E-learning评论文本的情感分类研究

E-learning评论文本的情感分类研究

[基金项目]湖南省普通高等学校教学改革研究项目“构建有效激励体系,促进软件工程专业实践教育创新”(411)成果之一。

[作者简介]潘怡,博士,长沙学院计算机学院副教授(panyi@ccsu.cn);叶辉(通讯作者),博士,长沙学院计算机学院讲师;邹军华,博士,湖北大学教育学院副教授。

转载自:《开放教育研究》杂志 2014年4月第21卷第2期

排版、插图来自公众号:MOOC(微信号:openonline)

了解在线教育,

把握MOOC国际发展前沿,请关注:

微信公号:openonline

公号昵称:MOOC

E-learning评论文本的情感分类研究

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多