机翻降重?掩饰抄袭?SCI期刊上的奇言怪语,不少来自中国作者
机器之心报道
编辑:蛋酱
深度神经网络 , 怎么就翻译成了「profoundneuralorganization」?
如果你经常阅读计算机领域的论文 , 一定会发现一些神奇的词汇 , 比如「伪意识(counterfeitconsciousness)」、「深层神经组织(profoundneuralorganization)」、「海量信息(colossalinformation)」 。
这都是什么?每个字母都认识 , 但合在一起还是怪怪的 , 总觉得涵义不够明确 。
结合上下文语境 , 读者才恍然大悟:哦 , 其实就是「人工智能」、「深度神经网络」和「大数据」 。
这些不明所以的词汇 , 在学界有自己的专属名称:「torturedphrases」 。
今年7月 , 法国图卢兹大学的学者GuillaumeCabanac和他的同事在arXiv平台上传了一篇27页的论文 , 介绍了关于该现象的一些调查结论 。 
文章图片
论文链接:https://arxiv.org/pdf/2107.06751.pdf
自动文本生成器一直被用于「科研文献写作」 , 那些毫无意义的论文很容易被人和机器检测到 。 但今天的AI技术已经能够生成更加「以假乱真」的文本 , 与人类写作的文本无法区分 。 一般来说 , 「torturedphrases」可能是自动翻译或试图掩饰文章内容抄袭的结果 。
表1先展示了研究者在各个文献中找到的奇怪短语 , 并给出了它们实际上对应的术语 。 起初这只是一种偶然的发现 , 当研究者发现这种现象出现得过于频繁之后 , 他们采取严肃的方法用已经确定的术语进行了滚雪球式搜查 。
「facerecognition」变成了「facialacknowledgement」 , 「artificialintelligence(AI)」变成了「(counterfeit|human-made)consciousness」 , designspreparingunit其实是GPU , focalpreparingunit其实是CPU , 简直离谱……
文章图片
表1 。
当研究者以「profoundneuralorganization」为关键词在Dimensions进行检索时 , 有860篇出版物至少包含这个短语 , 其中31篇都发表在同一个期刊《微处理器和微系统》上 。 
文章图片
随后研究者将研究重点放在了《微处理器和微系统》期刊上 , 他们借助一种工具调查了一系列来自这本和其他期刊的摘要 , 该工具可以识别文本是否是由GPT生成的 。
表2展示了该期刊2017-2019年间发表的378篇文章中排名前5位的贡献国家/地区和机构 。 
文章图片
接下来 , 研究者对2018年2月至2021年6月的数据进行了更深入的分析 。 图2显示了从2020年开始 , 每一期发表的文章数量的变化 。 
文章图片
研究者使用了「编辑评估」来表示从提交稿件到接收稿件的时间 , 包括:初步筛选、邀请审稿人、同行评议和最终决定 。 每篇论文发表的元数据将其编辑评估的节点分为三个日期:提交、修订和接收 。
根据对提交日期与接收日期的分析 , 2021年出版的各期的编辑评估突然缩短 。 大多数文章都是在编辑评估后发表的 , 但评估周期出人意料的短 。
从2021年2月第80卷开始 , 较短的处理时间(低于40天)变得普遍 。 编辑评估时间(表3)在比较2018-2020年的数量和2021年初的数量时 , 平均处理时间减少到五分之一 , 中位时间减少到六分之一 。 而这些论文的作者中有很多来自中国 。 
文章图片
表3:编辑评估时间的变化 。
一部分论文具有相同的提交、修订和接收日期 , 其中大部分出现在该期刊的特刊中 。 这个现象很可疑 , 特刊通常由客座编辑负责 , 并专注于特定的研究领域 。
- 36氪首发|烹饪机器人公司「智谷天厨」获数千万元天使轮融资,羲融善道独家投资
- iPhone|Plus时隔5年回归!曝苹果全新6.7寸手机名为iPhone 14 Plus
- iqoo|卡贴机大降价,iPhone13只要3000出头,网友都说“真香”
- 红米手机|真我GTNeo3和红米K50谁的综合实力更好,哪个更值得购买?
- 零售业|确定涨价!iPhone14四款新机全面涨价!国行也在其中!
- 图像传感器|到手1849元重量189g这才是高性价比的骁龙870直屏手机
- ios16|一步到位能用5年,目前这3款手机能闭眼入,买手机不要太小气
- 酷派|OPPO折叠屏手机专利曝光酷派新机cool 12A上架
- 口红|下周发布!华为P50 Pocket新版开启预订:送1699元口红耳机
- 永冻土出现神秘巨洞,它曾发生过大爆炸,科学家担心危机将出现
