林墨 新智元 今天
新智元推荐
来源:林墨(ID:linmo_wx)
编辑:克雷格
【新智元导读】署名“IKE ANTKARE”的论文有102篇,让IKE ANTKARE在谷歌学术中的h指数一下飙升到了94,成为计算机科学领域科学家H指数排名第6的学者。实际上,这些是格勒诺布尔大学的CYRIL LABBE教授利用MIT研究人员发明的SCIgen自动生成的。
谷歌学术、百度学术等学术搜索引擎以收录范围广泛、免费访问等优势逐渐抢占了学术文献全文的入口,这一点让web of science和Scopus等数据库商紧张不已。
收录范围广便能够建立更庞大的引文网络,因此,谷歌学术、百度学术等学术搜索引擎收录的文献的被引次数更高,所以,一些学者在委托图书馆出具引文报告时,希望以谷歌学术的被引次数为依据,作为自己论文影响力的佐证。
但是,学术搜索引擎中随意的数据给造假提供了极大的空间。
辛辛苦苦几十年,不如一键生成?
格勒诺布尔大学的CYRIL LABBE教授利用MIT研究人员发明的SCIgen,以“IKE ANTKARE”作为作者名(注意哦,作者并非真实存在),自动生成了102篇科研论文,让IKE ANTKARE在谷歌学术中的h指数一下飙升到了94,成为计算机科学领域科学家H指数排名第6的学者。
下图显示了该研究中使用的工具SCIgen,只要在SCIgen网页上的作者栏中输入作者名,程序就可以自动生成一篇拥有完整结构的computer science论文,包括Titles, authors, sections, bibliography, graphs, figures等等。
注:SCIgen 论文生成器
请看用SCIgen 论文生成器自动生成了一篇我的论文,是不是挺吓人?
注:SCIgen 论文生成器自动生成的论文
如何让谷歌学术收录自动生成的论文?
要想获得谷歌学术中的 h 指数值,首先得让谷歌收录你的论文。CYRIL LABBE用与上文所说的方法,利用SCIgen生成了100篇论文,每篇论文都对所有的100篇论文进行引用,然后生成该论文的html页面,html页面包含论文标题、摘要及PDF全文链接等信息。
注:图片来源于参考文献中的论文(伪造论文的引用关系)
为了让谷歌学术能够对这100篇论文进行索引,CYRIL LABBE在这100篇伪造论文的参考文献中加入了1篇真实的已被谷歌学术索引的论文,然后将这100篇论文上传到网上。不久,IKE ANTKARE的h指数就已经飙升到了94,甚至高于爱因斯坦的h指数84。
你可能引用了虚假论文
目前,谷歌学术已经对这批论文进行了处理,但是在百度学术中,仍能看到这些用软件生成的论文及其被引频次。
注:你可能引用了百度学术中的虚假论文
从这个案例中我们可以看到,数据随意的学术搜索引擎,很容易被人为操纵,因此不宜使用其引文数据作为学术评价的数据源。
参考文献:
LABBÉ, C. (2018). One of the great stars in the scientific firmament. ISSI NEWSLETTER, 6(2), 48-52.
(本文授权转载自:林墨)
【加入社群】
新智元 AI 技术 产业社群招募中,欢迎对 AI 技术 产业落地感兴趣的同学,加小助手 aiera2015_3 入群;通过审核后我们将邀请进群,加入社群后务必修改群备注(姓名 - 公司 - 职位;专业群审核较严,敬请谅解)。
,