AI帮你写论文，参考文献却全是假的？伪文献、错页码、错作者的风险根源与解决路径

2026年4月1日，Nature 以新闻特稿形式刊发了一篇分析——Hallucinated citations are polluting the scientific literature. What can be done?——结论直白：2025年发表的论文中，有数万篇可能包含AI生成的无效引用。不是格式不合规，不是页码标错了位置，而是查无此文、查无此人。

此前不久，GPTZero 对 NeurIPS 2025 接收的 4,841 篇论文进行了系统性扫描，在 51 篇中确认了超过 100 条幻觉引用——伪造的作者名、虚构的 DOI、不存在的期刊卷号。这批论文通过了当时全球最严格的机器学习会议同行评审，Fortune 和 arXiv 随后均跟进报道（Fortune, 2026年1月21日；arXiv:2602.05930）。

两件事叠加，传递出一个比「AI会编造」更值得追问的信号：根源不在AI会幻觉，而在聊天框与稿件之间的「复制粘贴鸿沟」——引用在转移中丢失了与来源的绑定，错误在写作过程中不可见、不可控。

学术信息图：左侧Nature特稿封面卡片，右侧GPTZero扫描结果卡片，中间断裂链条标注“复制粘贴鸿沟”，表现AI虚假引用根源。

一、引用错误不止一种

泛泛地讲「AI引用有问题」不够。拆开看，至少涉及三类性质不同的风险。

伪文献（Total Fabrication）。 最严重的一种——AI生成了一个看起来完全合理的参考文献条目，但整条记录都是编造的：论文不存在，作者不存在，期刊不存在，DOI指向空地址。GPTZero在NeurIPS 2025中检出的案例即属此类。危险在于，仅凭表面格式的工整程度，几乎无法识别。arXiv:2602.05930 对此做了系统分类，发现伪文献常以「真实期刊名+虚构论文标题+捏造作者」的组合出现，格式上毫无破绽。

错页码 / 错卷期（Partial Attribute Corruption）。 期刊名、作者名和年份可能都对，但卷号、期号或起止页码是错的。AI倾向于「填补」一个看起来合理的数字，该数字却不对应真实文献中的任何一页。这类错误比完全编造更难发现——基本信息对得上，审查者容易产生「已经核实过」的错觉。

错作者（Author Hallucination）。 AI可能张冠李戴，把真实学者错配到他们从未参与的论文上；也可能虚构一个名字，嵌在真实作者列表之间。对于熟悉该领域的读者，这类错误或许能被直觉察觉；但在跨学科引用或不熟悉的子领域，错配的作者信息几乎无法用肉眼判断。

三类错误的共同特征：生成时「看起来都对」，只有与原始来源逐项比对才会暴露。而问题恰恰出在——多数写作流程中，并没有这一步。

二、结构性断裂：复制粘贴如何制造引用黑洞

把问题归咎于「AI会编造」只说对了一半。更深层的原因在于通用AI聊天工具与学术稿件之间的工作方式：写作在聊天框里进行，引用在聊天框里生成，然后作者把文本连同引用一起复制粘贴到Word或LaTeX文档中。

在这个过程中，引用脱离了它本应指向的来源。引用条目在聊天框中是一条文本，粘贴到稿件里还是一条文本——它与被引文献的原始记录之间没有任何绑定的、可追溯的连接。一旦复制完成，那条引用就从生成它的上下文里永久剥离。之后无论是作者自查还是导师审阅，都只能面对一行孤立的文字，无从判断它背后是否有据可查。

这就是「复制粘贴鸿沟」：引用在转移中失去了与来源的绑定，错误在写作过程中不可见、不可控。等到成文后再逐条回溯核实，成本极高，且完全依赖作者个人的勤勉程度。

三、换一个思路：把校验放进写作过程里

如果问题的结构根源是引用与来源的分离，那么解决方向就不是「写完之后再查」，而是「写作的同时就在校验」。相比通用聊天工具将引用与正文物理分离的做法，InkFount的路径是把这一逻辑落地为三件事。

第一，引用与资料库绑定。 在稿件中，正文引用不是自由文本，而是带有[@alias]标记的占位符，每一个标记都对应资料库中的一条具体条目。作者在写作中插入引用时，实际上是在建立一条从正文到来源的显式链接。这个链接不会因为段落移动、结构调整或多次修改而断裂。

InkFount写作界面示意图，左栏为Markdown正文含引用标记，右栏资料库高亮对应文献，连线显示引用核对状态。

第二，三态校验。 写作过程中，系统持续追踪正文引用与资料库之间的状态关系：bound（已绑定——引用有确切来源）、orphan（未绑定——正文中存在引用标记但资料库中无对应条目）、dangling（悬空——资料库中有条目但正文中从未引用）。三种状态的实时可见，让作者在写作的任何时刻都能知道哪些引用还没有落地、哪些资料还没有用上。

第三，AI只改稿，不凭空生成。 AI不负责「替你写一篇论文」。它围绕作者已有的稿件工作——读取段落、定位文本、提出修改、输出diff。作者对每一处改动保留采纳、撤销或重试的判断权。引用条目的增删修改发生在上文所述的绑定框架内，而非聊天框的自由文本中。

InkFount三态校验面板，Orphan标签页显示两条未绑定引用及其正文位置预览。

四、引得出，还要交得出去

引用校验的终点不是在写作工具里显示绿色标记，而是最终交付的文档在格式和可查验性上都站得住。

InkFount支持GB/T 7714-2015中文参考文献格式化标准，覆盖国内高校和期刊对参考文献著录格式的核心要求。稿件可导出为Word、PDF或LaTeX，参考文献列表随正文一并生成，格式统一，无需跨工具手动排版。

对于中文研究生和行业研究员而言，这条链路意味着：写作时引用有来源绑定，改稿时引用状态可见，交付时参考文献格式就绪——整个流程中，引用的存在性和准确性不是最后一道工序的结果，而是写作过程本身的属性。

五、没有银弹，但有更合理的流程

没有任何工具能消除AI的所有幻觉，也不应该有人建议作者放弃人工核验的最终责任。InkFount不会声称「100%杜绝伪文献」，因为它不是一个自动化写作器，而是一个写作工作台——核心价值不是替代作者的判断，而是让判断有依据、让错误在过程中暴露、让参考文献在写作时就与来源绑定在一起。

Nature那篇分析的标题末尾问了一句「What can be done?」。答案可能不在更好的提示词或更严格的导出前检查清单里，而在一个更根本的转变上：把写作的现场从聊天框迁回稿件本体，让引用从生成的那一刻起就有源可溯。

如果你正在准备需要交付的严肃长文，可以在 InkFount.cn 直接开始写作——未登录即可体验引用核对，浏览器本地稿件刷新不丢。