首页论文查重动态论文检测系统让抄袭文章无所遁形,各大高校有办法

论文检测系统让抄袭文章无所遁形,各大高校有办法

时间:2014-09-20 编辑整理:早检测网 来源:早检测网

学术论文是否存在抄袭、剽窃行为;怎样检测、鉴定其内容;有没有一套切实可行的办法⋯⋯这一系列的问题困扰着学术界的相关领域研究者。2008 年4 月,一套由武汉大学信息管理学院沈阳副教授研发,名为“ROST 反剽窃系统”的软件,在中国部分高校及科研单位开始推广使用。目前,国内研究此类软件的单位主要有两家,另一套是由中国学术期刊杂志社与清华同方知网共同研制的“学位论文学术不端检测系统”,沈阳副教授自主研发的“ROST 反剽窃系统”更侧重于预防剽窃。该软件已经推广到全国20 多家高校院系、100 多家期刊社测试使用,拷贝版本多达1000 多份。

武汉大学信息管理学院的副教授沈阳在接受《中国新闻出版报》采访时坦言,“ROST 反剽窃系统”受追捧的程度这么高,是他之前未曾预料到的。

从兴趣上升为责任

1992 年作为江西省赣州市的理科状元,沈阳曾经满怀希望前往武汉大学攻读情报专业。当初抱着想当“间谍”的梦想,到校学习后才发现情报专业并不是想象中的那样神秘。一直读理科的他,大学4 年却都学的是文科知识内容,渐渐地沈阳对自己所学的专业失去了兴趣,甚至有些失望了。大四时,他开始接触电脑游戏,可他并没有沉迷于其中,反而对系统编程情有独钟。他开始向别人请教软件编程与制作,并利用空闲时间在一家软件公司兼职学习。凭着聪明、踏实、勤奋,他很快掌握了软件制作的技术。几年的积累,他体会最深的就是:自己一定要掌握软件新技术,要开发一些可以引领行业方向的领先技术,要有超前的思维意识,不能仅靠着和其他公司一样都能做出的软件去占领市场,市场需要的不单是跟风之作。这一直是他制作、研发软件的核心理念。带着这样的执著他一路走到了技术总监的职位。工作上的成就,并没有让他停下学习的脚步。回归学校的他继续走在研究的路上,他说,自己喜欢学校那种浓郁的学习氛围。2003 年沈阳以访问学者的身份去美国宾州大学以及麻省理工大学进行学术交流,在那里他看到了国外先进的技术和保护知识产权理念。当他看到国外有反抄袭的检测软件时,直觉告诉他,国内也应该做些检测抄袭的软件。而且作为老师,自己也需要这么一套软件用来自测。

1992 年作为江西省赣州市的理科状元,沈阳曾经满怀希望前往武汉大学攻读情报专业。当初抱着想当“间谍”的梦想,到校学习后才发现情报专业并不是想象中的那样神秘。一直读理科的他,大学4 年却都学的是文科知识内容,渐渐地沈阳对自己所学的专业失去了兴趣,甚至有些失望了。大四时,他开始接触电脑游戏,可他并没有沉迷于其中,反而对系统编程情有独钟。他开始向别人请教软件编程与制作,并利用空闲时间在一家软件公司兼职学习。凭着聪明、踏实、勤奋,他很快掌握了软件制作的技术。几年的积累,他体会最深的就是:自己一定要掌握软件新技术,要开发一些可以引领行业方向的领先技术,要有超前的思维意识,不能仅靠着和其他公司一样都能做出的软件去占领市场,市场需要的不单是跟风之作。这一直是他制作、研发软件的核心理念。带着这样的执著他一路走到了技术总监的职位。工作上的成就,并没有让他停下学习的脚步。回归学校的他继续走在研究的路上,他说,自己喜欢学校那种浓郁的学习氛围。2003 年沈阳以访问学者的身份去美国宾州大学以及麻省理工大学进行学术交流,在那里他看到了国外先进的技术和保护知识产权理念。当他看到国外有反抄袭的检测软件时,直觉告诉他,国内也应该做些检测抄袭的软件。而且作为老师,自己也需要这么一套软件用来自测。

回国后,他就开始着手于反剽窃软件的研发了,他想着先做演示版出来供自己使用。他把这个想法告诉了当时的同事,大家都很支持,也都表示希望能将自己写的东西或学生的论文做做检

测,毕竟一些“学术原罪”是有的,如果一些教材上的文章都是抄袭之作还怎么用来教书育人?2006 年,他先向国家有关部门申请反剽窃软件相关技术的两项专利,但还忙于研究其他项目的沈阳并没有立即展开“反剽窃”原型升级。一件发生在自己身上的被拷贝抄袭事件让沈阳加快了研发反剽窃软件的节奏。有一次,沈阳把准备投稿在期刊上的文章拿给一位同事看,不久后,他发现那位同事也写了一篇和他论文内容类似的文章。面对这种公然的学术抄袭沈阳很生气,虽然抄袭的文章经过改动已经变得不那么像了,可是想着劳动成果被盗用他心里就不舒服。这种文章被抄袭的尴尬与无奈让沈阳意识到,遏制这种抄袭之风,从技术领域揭露抄袭行为已到了刻不容缓的地步。此时,他深知研发反剽窃软件已不单是兴趣,它已上升为一种责任,是一种反对学术不端行为的正义之举。

“抄袭”有市场,研发经历困难也有乐趣

俗话说,万事开头难。虽然已经开发过 50 多个软件产品,自己独立编码完成的软件也有十七八个,可资金少、人力资源不足,还是让软件开发的工作充满困难。他自己完成了大约80%的程序编辑,剩下的编程由他带的两个学生完成。他想到,软件制成之后在技术上为反剽窃工作提供了技术检测支持;要用自己的力量与学术不端行为抗衡,从行动上支持学术打假工作;困难需要人去克服,自己有责任和义务坚持在困难中完成这项具有社会意义的工作。学习的日子总是会遇到困难的。聪明的学者会把做研究时遇到的枯燥与寂寞当成一杯咖啡去品尝,苦中有甜。软件最初检测器的设计、信息指纹法的应用要求他制作一个快速查找中文词典的系统。沈阳制作了一套程序,在速度上可以赶超世界先进水平,他用自己女儿的名字为这个独家研制出的算法命名。这样的运算、演算过程让他充分享受到了研究带来的乐趣。截至2009 年6月,沈阳已在反剽窃软件领域获得一项专利授权,申请两项专利,发表7 篇论文(含5 篇英文文章,其中一篇发表于数字图书馆领域国际排名第一的会议JCDL2009),开发了一系列辅助工具,在该领域取得了重要进展。

国内抄袭之风愈演愈烈的今天,他深知凭借个人力量不可能把这一陋习消除。他认识到,国内的抄袭之风是有其社会根源、历史根源和现实根源的。人们向来喜爱引用一些名言名句为自己的文章引经据典,这种无意识的抄袭行为甚至贯穿了我们文章写作的过程中。再有老师的论文中也存在学术原罪,已有的教材雷同度也高得吓人,让人们很难避免抄袭行为。加之,社会追求速度化、利益化现象严重,各行各业都在追求数量放弃或牺牲质量的浮躁心理也极大程度地影响了高校的学术风气,抄袭在所难免。怎么转变人们对学术抄袭固有的认识?怎样才能打开国内市场把自己的软件推广出去?经过一年多的实践,他在市场中看到了“ROST 反剽窃系统”的实用价值。虽然开始时各大院系并不推崇用一套软件检测学生的论文的真实性,随着清华同方知网研制的“学术测谎仪”的面世,未来“ROST 反剽窃系统”的客户不光是各大院系、出版社、期刊社、及政府、法院、知识产权技术鉴定部门,更大的市场将在整个数字出版行业,而数字出版已从早期的卖产品(电子书、版权)发展到了以反剽窃软件为代表的内容挖掘业务上来。反剽窃软件与数字出版相结合的新形态将会促进数字出版发展。

将反剽窃研究进行到底

2008 年4 月产品面市,而面对2008 年12 月清华同方知网研制的类似“学术测谎仪”软件,沈阳并不太担心二者的冲突、雷同。因为在他看来,这2 套软件差异很大。首先,从设计目标上讲,“ROST 反剽窃系统”由检测器、阅读器、测定文献比较器3 部分组成。最先设计时也是考虑从教师自身需要出发,主要用于预防剽窃,检测文章内容是否抄袭。而清华同方知网研制的“学术测谎仪”更侧重鉴定剽窃。其次,在技术算法上,二者也有区别。“学术测谎仪”主要采用“自适应多阶指纹法”,而沈阳设计的软件是在信息指纹法的基础上加柔性匹配共同检测一篇文章内容。

举例而言,取一段内容从中挑选特征字先进行绝对匹配,再适度做柔性匹配的方法检测文章内容。先取定一个预值,检测结果如果相似度超过95%系统就会认定此文章为全文拷贝,少有修改;如果相似度在85%以上则被认定为略经修改的拷贝文章。在选取预值确定相似度参考衡量指标时要寻找一个平衡点,平衡精判、避免误判。既要肯定他人自我创造的劳动成果,也要缓解、控制学术不端行为的愈演愈烈。再次,二者覆盖资源不同。“学术测谎仪”的后台是覆盖了5000万学术论文的数据库,“ROST 反剽窃系统”则是以490 万篇论文及覆盖188 亿个网页数据为主。在中国,数据资源库还需要不断完善,不过“ROST 反剽窃系统”要应对的似乎不仅是技术升级的问题。

从 2008 年4 月起该软件已在全国20 多家高校院系推广和100 多家杂志社期刊社测试使用。一年多来,沈阳利用“ROST 反剽窃系统”开展了一系列反学术不端行为的检测。该系统多次抽样检测表明,在一些大专院校内,学术抄袭现象严重,从老师到博士、硕士、本科生,抄袭程度逐步递增。以一所部属高校为例,783 篇论文中,涉嫌抄袭者过半,其中全文抄袭的论文有161篇,占总体的20.4%;段落剽窃的有256 篇,占33.2%。其中一个院系的30 篇博士论文中,有4篇学术不端的,绝大多数的文章存在标注不规范的问题,没有一篇论文完全符合规范。由此可见,想要真正端正学术行为,光靠仪器检测是不行的,还要从思想上根本转变对抄袭行为的看法。不

过令沈阳高兴的是,“ROST 反剽窃系统”发布以后已经得到了社会的广泛关注,他自己也会继续深入研究反剽窃技术和制度设计。



在线咨询
在线留言
系统列表
返回顶部