分享

抄袭论文检测技术研究的意义

 Me_萌兔兔 2012-11-29

目前,剽窃已经是一个日益严重的问题。随着数字化图书馆和互联网的普及和迅速发展,大量的以数字形式存在的资源使剽窃变得更加容易,尤其是学生和学术研究人员,他们通过网络搜索工具很容易就可以找到与课题研究相关的内容。可见,这些数字化信息给人们提供帮助的同时,也成为滋生剽窃行为的温床。特别是近几年来,抄袭、一稿多投等一系列的剽窃事件屡见报端,其问题的严重性越来越引起人们的重视。

2001年,据一份由美国学术信誉(Academic Integrity)研究机构的Donald对来自美国25所学校的4500名学生的调研问卷统计:72%的学生承认在写作时有过一次或多次的抄袭行为;另外,97%的学生承认在发表论文或写作业时曾经尝试过抄袭;还有15%的学生承认在发表论文时,部分章节来自学术刊物或者网站而不注明出处; 90%的学生承认曾经通过互联网抄袭,当然有些学生属于认识问题。

2004年,在中央广播电视大学召开的开放教育试点集中实践环节专题研讨会上,陶水龙公布了法学、教育管理、行政管理三个专业(本科)审查判为抄袭的情况:法学专业毕业论文总数为812份,其中判为抄袭的为324份,平均抄袭率为40%,16家市州电大中超过平均数的有9家,其中比例最大的前三家分别为80%、75%、63%;教育管理专业毕业论文总数为466份,其中判为抄袭的为80份,平均抄袭率为17%,11家市州电大中超过平均数的有5家,其中比例最大的前三家分别为33%、30%、30%:行政管理专业毕业论文总数为107份,其中判为抄袭的为23份,平均抄袭率为21%,9家市州电大中超过平均数的有2家,其中比例最大的前三家分别为77%、47%、19%。

以上两份材料表明,学生论文中的存在的抄袭情况也同样十分严重,这些触目惊心的数字已经向我们敲响了警钟。因此,要杜绝此类现象、净化学术氛围,除了要加强学生的教育、制定相应的法律法规外,建立有效的抄袭识别系统已刻不容缓。

另外,本课题的研究在网上论文评价系统、教学资源库建设、数字图书馆和搜索引擎领域等领域也具有一定的应用价值:

①上论文评价系统为教师提供了一个学术交流、评比的平台,通过这个平台教师可以获得专家对论文的指点。但由于上传的论文量比较大,而且论文中可能存在抄袭现象,如果人工排查会费时、费力,因此在网上论文提交系统中加入抄袭识别功能,让系统就能够自动地完成甄别工作,就会节省专家们的工作量,同时也会提高评比工作的公正性与公平性。例如:论文检测系统

②教学资源通过图像、文字、声音和视频等多种表现形式,向学生提供了丰富的学习材料,激发了学生的学习兴趣;同时,教师也可以利用资源让教学变得更加生动。但是使用者在添加资源的时候,仅仅通过简单的搜索,不可能避免重复资源的上传,这样就增加了资源库的冗余,使资源库变得不利于管理也不方便使用。因此,在资源库中加入重复识别的功能也很有必要。

③在数字图书馆中,材料一般都以数字形式存档。但由于数字形式的文档最容易被复制,所以经常会出现论文剽窃进而侵犯知识产权的问题。因此在数字图书馆中加入抄袭识别技术,文档入库前首先检查是否复制了库中文档的内容、是否构成剽窃,并将检查结果通知给用户。这样就保护了信息提供者的知识产权又降低了系统的存储开销。

④搜索引擎,目前随着网络资源的形式和内容不断膨胀,大量的重复、冗余信息也充斥其中,例如:相同内容的文章大量出现在不同的博客、维客、论坛中,而搜索引擎只是返回与用户查询相关的结果,因而存在大量的重复。这显然浪费网络资源和检索资源,同时也耗费提问者的精力。在搜索引擎中加入重复识别功能,可以实现网页消重,进一步提高了有效网页的搜集速度。

此外,研究本课题还具有以下两点学术意义:

①丰富信息检索理论,本文的研究对信息检索理论提出了新的挑战,拓宽了其研究范围,丰富了信息检索的理论和实践。

②端正学者研究态度,引导教师和学生们树立正确的学术研究观念。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多