关闭广告

斯坦福大学团队推出「许可证神谕」:让AI学会说「我不知道」

科技行者3432人阅读


当你向ChatGPT询问某位哲学家的出生日期时,它总是信心满满地给出答案,哪怕这个答案完全错误。这种现象被研究者称为「幻觉」,就像AI患了妄想症,总是编造一些听起来很有道理但实际上完全错误的信息。来自加州圣迭戈RA软件公司的理查德·阿克曼和保加利亚索菲亚大学的西蒙·埃马努伊洛夫在2025年发表的这项研究,提出了一个革命性的解决方案——「许可证神谕」系统。

这项研究发表在2025年的学术期刊上,研究者通过设计一种全新的架构,让AI在回答问题前必须先检验自己的答案是否正确,就像给AI装上了一个严格的「事实核查员」。研究团队在实验中取得了惊人的成果:传统方法只能达到56.7%的准确判断率,而他们的系统达到了完美的100%准确率,完全消除了虚假答案的产生。

研究者首先深入分析了AI产生幻觉的根本原因。在他们之前发表的研究《大型语言模型是如何被设计来产生幻觉的》中,研究团队指出,这个问题并非来自训练数据不足或模型调优不当,而是源于变换器架构本身的局限性。变换器模型就像一个只会模仿的学生,它能够生成语法正确、听起来合理的句子,但缺乏验证这些句子是否符合事实的能力。研究者将这种现象比作「平面语义空间」,在这个空间中

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

“小棕鞋”今年春天太流行了!这3双怎么搭都好看

LinkFashion 浏览 2664

650km续航 广汽埃安AION RT焕新款9月22日上市

网易汽车 浏览 5313

收评:沪指13连阳再创十年新高 两市成交额突破2.8万亿

财联社 浏览 9941

今天 | 送别杨振宁!群众含泪相送!队伍望不到头!

天津广播 浏览 4450

女子年初砸60万买黄金国庆后花20万买白银基金:真运气

潇湘晨报 浏览 18716

TVB颁奖礼红毯老龄化严重!50岁佘诗曼压轴,黄宗泽老到认不出

萌神木木 浏览 2958

QClaw指令发红包?微信员工紧急回应:假的!

雷科技 浏览 2747

摩洛哥队长赛斯自宣从国家队退役,共代表摩洛哥出场86次

懂球帝 浏览 2991

杭州银行年薪252万副行长获提拔,行长空缺大半年后终于敲定

湘财Plus 浏览 3670

"特朗普黄金卡"正式接受申请 从500万降至100万美元

国是直通车 浏览 20624

前男友转身花5亿娶闺蜜,徐梵溪的选择耐人寻味

失宠的小野猪 浏览 3766

凌晨4点利物浦保卫战!输球=英超5连败+72年之耻 标王缺席

叶青足球世界 浏览 4353

英超前六相互交锋积分榜:曼联、维拉积12分最多,阿森纳9分

懂球帝 浏览 3368

英超本赛季平均每场持续100分36秒,但净比赛时间只有54.7%

懂球帝 浏览 4724

姚晨:自然予我

时尚COSMO 浏览 6755

曹德旺退休其子接棒 老了……

道哥说车 浏览 4492

米体:尤文和米兰都有意金玟哉,但球员的高薪成为主要障碍

懂球帝 浏览 4583

米体:尤文愿承担恩-内斯里400万欧年薪,奥托利尼已到土耳其

懂球帝 浏览 3504

山姆变盒马?500万中产抵制“阿里味”

花朵财经 浏览 4214

苹果CEO库克上海两日行:看LABUBU,首次“直播带货”,直言“太爱中国人和中国文化”

澎湃新闻 浏览 4746

致敬 S14 第五冠队服,雷蛇推出巨甲虫 V2 Faker 款游戏鼠标垫

IT之家 浏览 4680
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1