《自然》杂志一项分析显示,越来越多科研人员正借助大语言模型辅助文献检索、撰写稿件与编排参考文献。然而,人工智能(AI)模型却时而“无中生有”,捏造查无实据的虚构条目。据预测,自2025年起,或有数万篇学术出版物混入此类AI生成的无效引文。
图片来源:《自然》网站
有学者指出,若任由“幻觉引文”渗入学术体系,不仅会催生错误结论、干扰后续研究,甚至可能误导科研方向。长此以往,将会悄然侵蚀公众对科学的信任。
“凭空捏造”愈演愈烈
今年早些时候,法国图卢兹大学计算机科学家纪尧姆·卡巴纳克收到谷歌学术通知,称其文章被《国际牙科杂志》一篇论文引用。他颇感错愕:自己的研究本系探讨如何识破伪造论文,与牙科领域风马牛不相及,且他对那篇被引文章竟毫无印象。他推测,此条引文极可能是AI杜撰出来的幻觉。
这只是冰山一角。多项调查与研究显示,随着大语言模型在文献检索、手稿撰写和参考文献整理中的普及,AI“凭空捏造”学术引文的现象正愈演愈烈。
引文错误在学术出版界并非新鲜事。美国西北大学范伯格医学院学术伦理与诚信研究专家穆罕默德·侯赛尼表示,在生成式AI问世前,引文错漏便已存在,如作者姓名拼写有误、出版年份或期刊标题张冠李戴、数字对象唯一标识符(DOI)缺失错录、被引文献的实际内容与引用者所述细节存在出入等。但如今的“幻觉引文”已非单纯的信息偏差,而是彻头彻尾的虚构,两者性质截然不同。
过去一年间,“幻觉引文”已频频现身各类文献。一项针对三场计算机科学会议近1.8万篇论文的分析显示,无法溯源至实际出版物的参考文献数量呈井喷之势。今年1月公布的数据表明,2025年已有2.6%的论文至少包含一条“幻觉引文”,而2024年该比例仅为0.3%。今年2月的另一项研究则估计,在另外四场2025年计算机会议上,2%至6%的论文含有无法通过数据库与期刊档案核验的标题或参考文献。
《自然》杂志新闻团队与英国Grounded AI公司合作开展的独家分析进一步证实,2025年至少有数万篇期刊论文、专著及会议记录可能掺杂AI生成的“幻觉引文”。
Grounded AI公司联合创始人兼首席产品官尼克·莫利透露,2025年暴露的引文错误类型,与大语言模型普及前团队所见的传统错误大相径庭。这一变化清晰表明,AI的广泛使用正是该问题滋生的主因。
对此,美国俄勒冈州立大学政治学家艾莉森·约翰斯顿直言,科研人员或将面临“幻觉引文”泛滥成灾的乱象。
多措并举逐一核验
面对来势汹汹的“幻觉引文”,各类应对工具与机制正应运而生。
德国柏林自由大学神经科学博士迈克尔·沃尔希奇,用Python编写了一款专用脚本,对Crossref数据库中的引文样本进行交叉比对,精准核查元数据错漏。目前,他已筛出500余篇存疑文献,经人工逐一核验后,悉数公示于学术评议平台PubPeer。
开源平台CheckIfExist可自动核验参考文献是否被指定学术数据库收录,助学者避开“查无此文”的陷阱。与此同时,法国国家科研中心与卡巴纳克团队联合推出免费工具bibCheck,目前已面向研究人员开放。该工具能精准比对引文,核查其是否指向真实存在或已被撤回的文献。
总部位于瑞士洛桑的“前沿”出版集团亦开发了一款内部AI筛查工具,专用于稿件初审阶段标记完整性缺陷,涵盖“幻觉引文”与无关引文等问题。
筑牢学术堤坝
在卡巴纳克看来,含有“幻觉引文”的论文绝不应堂而皇之地出现于学术殿堂。一经发现,出版方应立即发布声明,并视情况启动更正或撤稿程序。
面对此类问题,出版界的应对策略各有侧重。SAGE与泰勒-弗朗西斯集团坦言,若查出的引文错误不影响结论,且不涉及更广泛的学术不当行为,通常采取拒稿或要求修改的处理方式。威立出版集团发言人则表示,一般仅就细节问题向作者发函澄清。施普林格·自然出版集团立场明确:对查实含有虚构引用的稿件一律撤稿。《国际政治经济学评论》主编约翰斯顿的态度则更为严格,凡向该期刊投稿被查出此类问题者,将被永久取消重投资格。
至于“幻觉引文”是否以及在何种情形下构成学术不端,学界仍有争议。此类疏漏有时并非作者蓄意为之,但可能酿成严重后果。例如,部分作者为求便捷,借助大语言模型自动排版参考文献,却未察觉AI已悄然篡改引文表述、错置DOI,甚至凭空捏造条目。今年3月,侯赛尼与美国国家环境健康科学研究所生物伦理学家戴维·雷斯尼克联名撰文指出,若综述或文献计量研究将子虚乌有的引文作为支撑核心论点的关键证据,理应将其定性为学术不端,因为这无异于伪造数据。
目前,各期刊对AI工具的管控尺度不一。多数出版商虽强制要求作者申报AI使用情况,但具体申报范围尚无统一标准。无论如何,“人工复核”始终是防范风险的最后防线。
侯赛尼等人强调,每一处虚假引用,都是学术生态中的一道裂缝,需要人们用心修补,还科学殿堂一片澄明晴空。
访谈
更多护航视频监控网络安全 做物联网安全的守护者 ——专访天防安全总经理段伟恒
在万物互联时代,网络安全的重要性日益凸显,尤其在快速发展的城市建设中,搭建的巨大物联网络对其安全保障…
做行业赋能者 HID迎接数字化浪潮新机遇 破解新挑战
今年3月份,全球可信身份解决方案提供商HID发布了最新的《安防行业现状报告》(以下简称“报告”),该报告…
数字化浪潮下,安防厂商如何满足行业客户的定制化需求?
回顾近两年,受疫情因素影响,包括安防在内的诸多行业领域都遭受了来自市场 “不确定性”因素的冲击,市场…