AI帮你写论文,参考文献却全是假的?伪文献、错页码、错作者的风险根源与解决路径
Nature 2026年4月刊发分析,指出2025年数万篇论文疑似含AI虚构引用;GPTZero在NeurIPS 2025接收论文中查出100+条幻觉引用。根源不在AI会幻觉,而在聊天工具与稿件之间存在「复制粘贴鸿沟」。

2026年4月1日,Nature 以新闻特稿形式刊发了一篇分析——Hallucinated citations are polluting the scientific literature. What can be done?——结论直白:2025年发表的论文中,有数万篇可能包含AI生成的无效引用。不是格式不合规,不是页码标错了位置,而是查无此文、查无此人。
此前不久,GPTZero 对 NeurIPS 2025 接收的 4,841 篇论文进行了系统性扫描,在 51 篇中确认了超过 100 条幻觉引用——伪造的作者名、虚构的 DOI、不存在的期刊卷号。这批论文通过了当时全球最严格的机器学习会议同行评审,Fortune 和 arXiv 随后均跟进报道(Fortune, 2026年1月21日;arXiv:2602.05930)。
两件事叠加,传递出一个比「AI会编造」更值得追问的信号:根源不在AI会幻觉,而在聊天框与稿件之间的「复制粘贴鸿沟」——引用在转移中丢失了与来源的绑定,错误在写作过程中不可见、不可控。

一、引用错误不止一种
泛泛地讲「AI引用有问题」不够。拆开看,至少涉及三类性质不同的风险。
伪文献(Total Fabrication)。 最严重的一种——AI生成了一个看起来完全合理的参考文献条目,但整条记录都是编造的:论文不存在,作者不存在,期刊不存在,DOI指向空地址。GPTZero在NeurIPS 2025中检出的案例即属此类。危险在于,仅凭表面格式的工整程度,几乎无法识别。arXiv:2602.05930 对此做了系统分类,发现伪文献常以「真实期刊名+虚构论文标题+捏造作者」的组合出现,格式上毫无破绽。
错页码 / 错卷期(Partial Attribute Corruption)。 期刊名、作者名和年份可能都对,但卷号、期号或起止页码是错的。AI倾向于「填补」一个看起来合理的数字,该数字却不对应真实文献中的任何一页。这类错误比完全编造更难发现——基本信息对得上,审查者容易产生「已经核实过」的错觉。
错作者(Author Hallucination)。 AI可能张冠李戴,把真实学者错配到他们从未参与的论文上;也可能虚构一个名字,嵌在真实作者列表之间。对于熟悉该领域的读者,这类错误或许能被直觉察觉;但在跨学科引用或不熟悉的子领域,错配的作者信息几乎无法用肉眼判断。
三类错误的共同特征:生成时「看起来都对」,只有与原始来源逐项比对才会暴露。而问题恰恰出在——多数写作流程中,并没有这一步。
二、结构性断裂:复制粘贴如何制造引用黑洞
把问题归咎于「AI会编造」只说对了一半。更深层的原因在于通用AI聊天工具与学术稿件之间的工作方式:写作在聊天框里进行,引用在聊天框里生成,然后作者把文本连同引用一起复制粘贴到Word或LaTeX文档中。
在这个过程中,引用脱离了它本应指向的来源。引用条目在聊天框中是一条文本,粘贴到稿件里还是一条文本——它与被引文献的原始记录之间没有任何绑定的、可追溯的连接。一旦复制完成,那条引用就从生成它的上下文里永久剥离。之后无论是作者自查还是导师审阅,都只能面对一行孤立的文字,无从判断它背后是否有据可查。
这就是「复制粘贴鸿沟」:引用在转移中失去了与来源的绑定,错误在写作过程中不可见、不可控。等到成文后再逐条回溯核实,成本极高,且完全依赖作者个人的勤勉程度。
三、换一个思路:把校验放进写作过程里
如果问题的结构根源是引用与来源的分离,那么解决方向就不是「写完之后再查」,而是「写作的同时就在校验」。相比通用聊天工具将引用与正文物理分离的做法,InkFount的路径是把这一逻辑落地为三件事。
第一,引用与资料库绑定。 在稿件中,正文引用不是自由文本,而是带有[@alias]标记的占位符,每一个标记都对应资料库中的一条具体条目。作者在写作中插入引用时,实际上是在建立一条从正文到来源的显式链接。这个链接不会因为段落移动、结构调整或多次修改而断裂。

第二,三态对账。 写作过程中,系统持续追踪正文引用与资料库之间的状态关系:bound(已绑定——引用有确切来源)、orphan(未绑定——正文中存在引用标记但资料库中无对应条目)、dangling(悬空——资料库中有条目但正文中从未引用)。三种状态的实时可见,让作者在写作的任何时刻都能知道哪些引用还没有落地、哪些资料还没有用上。
第三,AI只改稿,不凭空生成。 AI不负责「替你写一篇论文」。它围绕作者已有的稿件工作——读取段落、定位文本、提出修改、输出diff。作者对每一处改动保留采纳、撤销或重试的判断权。引用条目的增删修改发生在上文所述的绑定框架内,而非聊天框的自由文本中。

四、引得出,还要交得出去
引用校验的终点不是在写作工具里显示绿色标记,而是最终交付的文档在格式和可查验性上都站得住。
InkFount支持GB/T 7714-2015中文参考文献格式化标准,覆盖国内高校和期刊对参考文献著录格式的核心要求。稿件可导出为Word、PDF或LaTeX,参考文献列表随正文一并生成,格式统一,无需跨工具手动排版。
对于中文研究生和行业研究员而言,这条链路意味着:写作时引用有来源绑定,改稿时引用状态可见,交付时参考文献格式就绪——整个流程中,引用的存在性和准确性不是最后一道工序的结果,而是写作过程本身的属性。
五、没有银弹,但有更合理的流程
没有任何工具能消除AI的所有幻觉,也不应该有人建议作者放弃人工核验的最终责任。InkFount不会声称「100%杜绝伪文献」,因为它不是一个自动化写作器,而是一个写作工作台——核心价值不是替代作者的判断,而是让判断有依据、让错误在过程中暴露、让参考文献在写作时就与来源绑定在一起。
Nature那篇分析的标题末尾问了一句「What can be done?」。答案可能不在更好的提示词或更严格的导出前检查清单里,而在一个更根本的转变上:把写作的现场从聊天框迁回稿件本体,让引用从生成的那一刻起就有源可溯。
如果你正在准备需要交付的严肃长文,可以在 InkFount.cn 直接开始写作——未登录即可体验引用对账,浏览器本地稿件刷新不丢。
继续阅读
这些相关文章可以帮助你补齐写作流程中的其他环节。
2026年最好用的Markdown编辑器对比:InkFount、Typora、Obsidian、Arya谁最适合写论文?
从论文写作全流程出发,深度对比InkFount、Typora、Obsidian和Arya四款Markdown编辑器的核心差异,帮你找到最适合学术写作的工具。
邪修写综述的正确打开方式:先解决AI「幽灵引用」这道送命题
AI提速综述写作已成趋势,但《柳叶刀》2026年研究显示每277篇新论文就有1篇含幽灵引用。InkFount作为研究级写作工作台,通过参考资料库绑定与引用对账,让AI改稿可溯源、可审查,而非冒险一键生成。
Claude Code、Codex 与 Cursor 写论文对比:从代码草稿到定稿的完整工作流
本文对比 Claude Code、OpenAI Codex 和 Cursor 在论文写作中的实际表现:它们能快速将代码转化为论文初稿,但缺少参考文献、图表、公式与格式。推荐使用 InkFount 这类研究型 AI 工作台完成定稿,实现引用对账、GB/T 7714 格式导出与 AI 精准改稿。
在 InkFount 中实践这套方法
你可以直接在编辑器里搭建提纲、管理参考文献、插入引用,并在导出前完成结构与格式检查。