论文中了顶会，却被曝抄袭前导师小组论文，多处原文及公式完全一致

萧箫发自凹非寺

量子位报道 | 公众号 QbitAI

论文中了机器学习顶会，却被举报抄袭。

这是一篇收录在ICML 2020的论文，被贴在Reddit上后，事件迅速发酵：

论文来自加拿大约克大学（York University），题为「PoKED: A Semi-Supervised System for Word Sense Disambiguation」，研究方向是NLP中的词义消歧。

但它的核心方法、公式、网络结构图，却与另外3篇论文中的部分文本及图例如出一辙，其中两篇同样来自顶会。

而在仔细查看之后不难发现，这3篇论文都来自同一个教授，也是作者之前所在的导师小组。

这到底是怎么回事？

多处原文相似，2篇来自顶会

这篇被抄袭的论文，主要介绍了一个名为PoKED （Position-wise Orthogonal Knowledge-Enhanced Disambiguator）的网络结构。

但举报人发现，这一结构却几乎全部抄袭自3篇论文。

第一篇被抄袭的论文，来自顶会ACL 2019（这篇论文曾经投过EMNLP 2018，未被接收）。

抄袭的画风是这样的，左边是ICML 2020的论文，右边是ACL 2019的论文：

除了换一种表达方式以外，内容基本如出一辙。

据举报者的PDF显示，抄袭的篇幅基本涵盖了论文第三章的核心方法（论文解决核心问题所用的网络架构）部分，公式和图片也高度接近。

第二篇被抄袭的论文来自ACML 2017，在一个细节模型上高度相似。

最后一篇论文目前也已经发表在arXiv上，网络结构几乎一样。

而这些被抄袭的论文，全部来自作者的前导师小组。

此外，论文作者似乎不止在这一篇论文中进行了抄袭。

目前就职于OpenAI的Lilian Weng也发推表示，自己的博客同样被这位作者的另一篇论文抄袭。

抄袭对象来自前导师小组

3篇论文涉及的导师Hui Jiang，目前是加拿大约克大学的一名教授，而这些论文的其他作者，也基本都来自这个导师的小组。

从Hui Jiang教授的主页来看，第一篇ACL 2019的一作Chao Wang，目前仍然是Hui Jiang小组的一名在读博士生。

第二篇ACML 2017的一作Hengyue Pan，是一名已经毕业的博士生；至于第三篇arXiv论文，二作Mingbin Xu也同样来自Hui Jiang小组。

被举报抄袭的论文作者Feng Wei，曾经也是Hui Jiang的一名学生，只是目前在主页上的信息已经显示为“dropped”，日期是19年4月。

然而Feng Wei的这篇ICML 2020论文信息显示，他目前仍然在加拿大约克大学就读，也许导师换成了Uyen Trang Nguyen教授。

虽然论文介绍PPT上的作者有2位，但这篇论文在最终投稿到ICML 2020的时候，却只有Feng Wei自己的名字。

目前，ICML官方尚未就此事给出回应。

Reddit版块主持人已留存帖子

这件事在Reddit上迅速发酵后，Machine Learning版块的主持人programmerChilli已经出面，并给出了解决方案：

目前，为防止出现意外，这条线程已经被锁定。如果事情无法通过正当渠道解决，这条帖子也能保留作为证据。

此外，Chilli自己也表示：

同意调查，但先别急着深究作者的过错。请给博士一些同理心，因为陈姓华人博士生就是一个案例。

Chilli所指的，是去年一起佛罗里达大学的博士自杀的案件。这名博士生，在短时间内中了一篇ISCA顶会论文，然而在修改时发现论文问题太多，但教授却一直不给撤稿，最后只能无奈自杀。

但其他网友也有不同的意见。

例如这次的举报者，对于抄袭本身愤愤不平，认为没必要为抄袭编造一个“想象”的理由出来。

但对于举报者将抄袭这种事情曝光在Reddit的机器学习论坛上，也有不少人表示反对。

这些网友认为，举报就应该找官方的渠道，将这种没有坐实的信息贴出来，是在浪费大家的时间。

对于这件事情，你怎么看？

标签: 论文加拿大约克大学导师 icml

论文中了顶会，却被曝抄袭前导师小组论文，多处原文及公式完全一致

最新资讯

看现场！沪上各学校上好学生成长“必修课” ｜劳动教育进行时

教育部曝光8起违反教师职业行为十项准则典型问题

小学生作文《我的理想》走红，老师边批边笑，网友：段子手！

小学生“狂草”字体走红，字迹凌乱，求批卷老师心理承受面积

定了！山东高校宣布“错峰”放寒假，最长达54天……

化竞金牌保送北大！成都外校国集大神4000字长文回忆化路血与泪！

文档百科