关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者4477人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

疑一则广告惹祸 特朗普宣布终止与加拿大所有贸易谈判

财联社 浏览 10456

马杜罗紧急求助普京:委内瑞拉需要导弹、雷达和飞机

上观新闻 浏览 4269

理想MEGA车主声明: 车辆系突发自燃并非电池包破损

网易汽车 浏览 4427

打造全球好物“首发首秀地”,东方购物白玉兰直播间首度亮相第八届进博会

上观新闻 浏览 3576

日本首次正式参演美菲“肩并肩”军演

极目新闻 浏览 1663

美媒:美对伊朗行动选项"远超传统空袭"

新华社 浏览 3467

伊朗选出新领袖 战事还要打多久

红星新闻 浏览 2657

福建舰已完成多次海试 进度远超预期

央视新闻客户端 浏览 3855

黄慧颐手撕保剑锋 曾黎意外卷入风波

第一娱记 浏览 3525

马斯克评英伟达纯视觉自动驾驶系统Alpamayo

不看车bukanche 浏览 3609

宝马iX3增9款涂装 国产长轴距版或年底上市

车质网 浏览 548

太强了!“宁王”净赚722亿元,分红361亿元,曾毓群能分到多少?

数字财经智库 浏览 2758

太好看了!!!「镖人」把我看激动了!

吐槽电影院 浏览 2876

俄称已控制库皮扬斯克 正清缴乌军

每日经济新闻 浏览 3629

怼人上瘾?特斯拉官微把非智能车贬得一文不值,车主一点面子不给

小李车评李建红 浏览 3821

公开喊话 贾跃亭称FF愿与特斯拉展开合作

车质网 浏览 4166

Amazon和UCLA团队突破传统界限,开启无监督智能训练新纪元

科技行者 浏览 3558

Shams:因球场打架,阿尔瓦拉多被禁赛2场&马威被禁赛1场

懂球帝 浏览 3780

何晴告别式现场,前夫许亚军疑似现身双眼泛红,大量群众自发悼念

萌神木木 浏览 3679

合肥夜空上演“硬核”科技告白:1024架无人机点亮AI愿景

中安在线 浏览 4412

海南"零关税"豪车引热议 保时捷卡宴鲜有符合要求车型

每日经济新闻 浏览 31617
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1