关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者4480人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

首款可折叠iPhone最新消息:或在2026年秋季发布

环球网资讯 浏览 4000

跟队:萨尔可代表切尔西出战英联杯,但今晚不太可能出场

懂球帝 浏览 3405

张雨绮,不能「装死」了

独立鱼 浏览 3345

假期5天赚1万,全靠嘴甜

她刊 浏览 1246

奥特曼的“印钞机”与“吞金兽”:OpenAI年化营收超200亿美元背后的豪赌

澎湃新闻 浏览 3487

女星安吉丽娜·朱莉访乌 其随身保镖被乌军征兵处抓走服役

极目新闻 浏览 4352

金价暴跌后实探北京金店:有消费者拖行李箱“抄底”,回收变现需排队3个半小时

红星新闻 浏览 3313

新季各队最令人期待球员中部篇 内姆哈德追逐MIP?

体坛周报 浏览 5254

TA:从进攻核心到压迫发起点,梅西角色延伸提升球队上限

懂球帝 浏览 4102

阿里发布生态级AI助手数字人形象——千问“小酒窝”

大象新闻 浏览 1738

黄仁勋亲赴台积电“讨要更多芯片” 回应存储短缺、涨价等问题

财联社 浏览 4194

首款中国超跑,比亚迪仰望 U9 将入驻《GT 赛车 7》

IT之家 浏览 4569

90分钟战报:埃弗顿1-1桑德兰,詹姆斯-加纳点射绝平

懂球帝 浏览 2979

中国游客称在瑞士看到峨眉山石 官方证实:已落户10年

封面新闻 浏览 11871

医生手术时涉诈停机 20多天未能复机无法与病人联系

中国新闻周刊 浏览 11203

行驶超7万公里,初代问界M5满足国标涉水、底部撞击、火烧要求

IT之家 浏览 4010

美澳签85亿矿产大单 特朗普对澳大使说"我不喜欢你"

红星新闻 浏览 9108

刘晓庆回应年龄追问:关你们什么事

期望带来失望 浏览 3236

官方:麦克托米奈当选2025意大利足球盛典年度最佳球员

懂球帝 浏览 3997

1-9月主流车企销量成绩单,比亚迪326万辆完成全年71%

分秒汽车 浏览 4652

年底大牌返场 || 每次都“秒空”,这次100+真的好值!

黎贝卡的异想世界 浏览 3534
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1