为什么AI总是捏造事实？AI：真不想的，容我狡辩一下

2026-03-18 13:24来源：江苏警方

　　现如今，几乎每个人的手机上都有那么两三个 AI 小助手，之前我们遇到了问题习惯去搜索引擎上搜索答案，现在可能更多地习惯于“有事问 AI”。

　　而 AI 也几乎不会让我们失望，任何问题都能给你列举出一串看起来很有道理的答案。

　　但如果你问的问题非常重要，比如是某个健康相关的问题，或者是写重要资料时候需要使用某个数据或者是某个案例，那真的建议你亲自去查实一下。

　　因为有时候，AI 会信誓旦旦地给你一个看似合理，实则不存在的答案。

　　还有些小伙伴发现，在让小龙虾（Openclaw）干活的时候，它列出了详细的19小时的学习计划，然后17分钟完成了...... 它也会早早编造一份数据存放在本地，等拖到预定的时间才交付。而在被发现之后，试图让人接受它已完成的工作。

为什么AI总是捏造事实？AI：真不想的，容我狡辩一下

　　图片截取自与小龙虾（Openclaw）对话小龙虾敷衍中......

　　其实，这个现象其实早就不是什么秘密了，它也被称作“AI 幻觉”，而且科学家们一直也试图通过增加算力或者优化数据的方式来解决这个问题。

　　但是在 2025 年 9 月，来自 OpenAI 和佐治亚理工学院（Georgia Institute of Technology）的研究人员发表了一篇重磅论文。

　　这项研究给出了一个颠覆性的结论：即便给到 AI 的训练数据集是绝对正确的，AI 在某些类型的问题上也不可避免地会犯错——这既是由统计规律决定的，也是目前不合理的 AI“考试制度”逼出来的结果。

　　下面我们就顺着这篇文章的思路一起来看一看。

　　预训练阶段就会出错

　　这篇研究发现，AI 出现幻觉跟预训练阶段以及后训练阶段都有关系，我们先看预训练阶段的情况。

　　数据模式和模型本身问题

　　为了方便研究，研究者构建了一个线性的二元分类模型（非此即彼），让它对已经标注了正确和错误的数据集进行分类。

　　因为这些数据已经经过了人工检验，所以是不存在任何错误的。但是用这些数据对AI模型进行预训练的时候，问题就出现了。

　　在有些类型的问题上（比如检查拼写错误），AI 的表现非常好，几乎从不犯错。

　　但是在另一些问题上，比如“数某个英文单词里某个字母出现了多少次？”，以及“某人的生日是几月几号？”AI 就有可能会出错。

　　研究者认为，这样的数据在做分类的时候很难用一条直线进行二元分类，一些模型用这样的数据进行预训练的时候就可能会产生错误。

　　打个比方，模型在分类的时候就像拿着一把刀把数据切分成两类，但如果数据的模式本身就是弯弯绕绕的圆弧，用一把刀就很难切分。

　　比如在这篇文章中，研究者使用这个问题“How many Ds are in DEEPSEEK? If you know, just say the number with no commentary”（DEEPSEEK 里有多少个 D？如果你知道直接说数字，不要加以评论）去询问 Deepseek V3 模型的时候，确实发现它给的答案并不准确，会回答 2 或者 3。

　　但是这个在使用 DEEPSEEK R1 模型的时候就没有这样的问题，这是模型本身差异导致的。

为什么AI总是捏造事实？AI：真不想的，容我狡辩一下

　　笔者用同样的问题对 DEEPSEEK V3.2进行了测试，也出现了类似的情况

　　研究者构建这样的简化模型进行测试，是为了说明，即便数据本身没有问题，在预训练阶段也会因为模型本身的限制以及数据模式等问题让 AI 产生错误判断。

　　这项研究中，研究者还进一步给出了测算，如果让 AI 直接去生成内容，产生错误的概率还会更大一些，大约比判断出错的概率高出两倍以上。

　　数据量过少也会影响

　　另外，在这项研究中研究者还发现，假如训练数据中某个信息过少，那么 AI 在回答的时候出错的可能性也会比较高。

　　比如，当你问爱因斯坦的生日是几月几号的时候，因为在大量的资料里都有这个数据，所以 AI 几乎不会出错。但是当你问某个普通人“田小豆”的生日是几月几号的时候，这个数据出现次数特别少，AI 出错的可能性也会变高。

　　特别是当数据只出现了一次的时候，这时候可能会更糟糕。

　　因为 AI 大概率不会直接回答你“我不知道”，因为它在训练数据集里确实见过，但它没有足够多的数据来确认这个信息到底是正确答案还是噪声，它准确回答这个问题的可能性也会更低一些。

　　数据模式和模型本身的限制，以及极少样本的数据，都可能会让 AI 在预训练阶段就产生“幻觉”，生成错误的内容。

　　努力得高分的 AI

　　如果说预训练阶段的统计学特征让 AI 有了编造的“潜质”，人类评价AI的方式也逼着 AI 去“编造”。

　　为了更好地理解这一点，我们可以先从大家都很熟悉的考试入手。人类社会中的大部分考试都是二元评分机制，即答对了得分，答错或者不回答都不得分。

　　所以，在考试的时候，哪怕你不知道答案，也不会交白卷，至少选择题填空题会随便蒙一个，万一蒙对了还会有“意外之喜”。

　　这项研究中研究者对比了目前主流的 AI 的评分机制，发现大部分评分机制也是类似的情况，如果 AI 坦诚地回答“我不知道”，它会得 0 分，跟回答错误没有区别。与其这样，它不如随便蒙一个答案，哪怕蒙对的概率再低，数学期望也比 0 高。

为什么AI总是捏造事实？AI：真不想的，容我狡辩一下

　　目前主流的评分机制大部分采用二元评分机制，图片截取自文献

　　为了在主流的评分机制中拿到高分，“AI 考生们”也和人类一样，学会了实在不行就乱蒙一个的本领。

　　对此，这项研究的研究者们也给出了一个合理的解决方案——在现有的 AI 评分机制中，引入一个“惩罚编造，奖励诚实”的机制。

　　比如，假如 AI 回答正确，获得 1 分，如果回答错误得 0 分，甚至扣分。如果回答“我不知道”，则可以不扣分，或者获得一个微小的分数奖励。

　　重要问题上不要轻信 AI

　　文献也给出了结论，AI 的幻觉是从模型的预训练阶段起源的，在后训练阶段为了追求更高的评分也可能会被放大。

　　虽然科学家们也采用了很多的方法减少 AI 幻觉，但至少在现阶段看来，AI 幻觉还是无法避免的。假如你需要让 AI 帮你解答一个重要的问题，比如在做公众演讲的时候用一个数据，建议亲自核实一下。否则被人发现这些数据根本不存在，那可就尴尬了。

　　而假如在问 AI 问题的时候，它对你说“我不知道”，你也应该感到庆幸，至少 AI 并没有打算胡编乱造一个答案蒙骗你。

　　转自：科普中国

[责任编辑: ]

阅读剩余全文（）

为你推荐

开春礼赞——西藏农区春耕仪式见闻

新华社记者晋美多吉摄　　春耕仪式是西藏农区重要的民俗活动，一般根据藏族天文历法推算，确定仪式开展的确切日子。新华社记者晋美多吉摄　　山南是西藏重要的农业生产地区和主要粮食产地，平均海拔3700米，气候适宜、土地肥沃，种植青稞历史久远。

18日

探访雄安新区“机器人学校”

3月17日，在中国雄安集团数字城市科技有限公司具身智能训练场，工作人员对机器人进行具身智能训练。

18日

踏青赏花享春光

春风和煦，花红柳绿，人们踏青赏花，享受美好春光。春风和煦，花红柳绿，人们踏青赏花，享受美好春光。春风和煦，花红柳绿，人们踏青赏花，享受美好春光。春风和煦，花红柳绿，人们踏青赏花，享受美好春光。

18日

神二十一航天员乘组圆满完成第二次出舱活动

这是3月16日在北京航天飞行控制中心屏幕上拍摄的神舟二十一号乘组航天员工作的画面。3月16日19时35分，经过7小时的出舱活动，神舟二十一号乘组航天员张陆、武飞、张洪章密切协同，在空间站机械臂和地面科研人员的配合支持下，圆满完成空间碎片防护装置安装等任务。

17日

北京至雄安新区开通定制快巴

3月16日，在北京地铁六里桥站附近，一名乘客走下从雄安新区驶抵北京的京雄定制快巴。3月16日，在北京六里桥地铁站附近，一辆从雄安新区抵达北京的京雄定制快巴在乘客下车后驶离。

17日

又见京城花满枝

春回大地，暖风轻拂，北京街头各种花卉次第开放，人们走出家门，赏花观景，乐享和煦春光。春回大地，暖风轻拂，北京街头各种花卉次第开放，人们走出家门，赏花观景，乐享和煦春光。

17日

我国成功发射遥感五十号02星

3月15日21时22分，我国在太原卫星发射中心使用长征六号改运载火箭，成功将遥感五十号02星发射升空，卫星顺利进入预定轨道，发射任务取得圆满成功。新华社发（尚宇航摄）

16日

蔡佳云、王蒙担任米兰冬残奥会闭幕式中国代表团旗手

3月15日，中国体育代表团宣布，越野滑雪和冬季两项男运动员蔡佳云、轮椅冰壶女运动员王蒙将担任米兰冬残奥会闭幕式中国体育代表团旗手。王蒙在本届冬残奥会和队友杨金桥携手鏖战，勇夺轮椅冰壶混合双人项目金牌，此项目为冬残奥会新设项目，这枚金牌具有历史意义。

16日

北京：多项措施应对“花粉季”

北京市园林绿化局还联合科研院所研发花粉固定剂、花粉控制剂等新型环保生物制剂，助力科学有效地开展综合防治工作。北京市园林绿化局还联合科研院所研发花粉固定剂、花粉控制剂等新型环保生物制剂，助力科学有效地开展综合防治工作。

16日

高山滑雪女子回转（坐姿）：张雯静夺冠

当地时间3月14日，在意大利科尔蒂纳举行的米兰-科尔蒂纳冬残奥会高山滑雪女子回转（坐姿）比赛中，中国选手张雯静夺得冠军。当地时间3月14日，在意大利科尔蒂纳举行的米兰-科尔蒂纳冬残奥会高山滑雪女子回转（坐姿）比赛中，中国选手张雯静夺得冠军。

15日

载入更多资讯

全部导航

为什么AI总是捏造事实？AI：真不想的，容我狡辩一下