关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者4478人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

澳国防部称监测到中国舰队活动 外交部回应

财联社 浏览 4051

这才是打开秋季的穿衣方式!衣服不贪多、搭配得体,养眼舒适

静儿时尚达人 浏览 6617

高市早苗要和中国打时间差 或赶在特朗普访华前访美

北京日报客户端-长安街知事 浏览 14849

趁换代前“捡漏”30万豪华中型SUV之选

网易汽车 浏览 5470

售价更低 荣威i5新版本车型发动机参数下调

车质网 浏览 4659

手握低空经济王牌矩阵 上海向世界eVTOL之都迈进

看看新闻Knews 浏览 3520

西班牙U20主帅:很高兴亚马尔、库巴西、赫伊森能进成年队

懂球帝 浏览 5054

近期石柯社媒频繁更新?他已签约成为杭州致禾文化旗下艺人

懂球帝 浏览 4850

奶茶冲泡巨头香飘飘“突围”:首家线下茶饮店将开业,曾多次试水快闪店

红星资本局 浏览 4537

日本自民党高官窜访台湾 外交部:"媚日谋独"令人不齿

澎湃新闻 浏览 9039

爱马仕的暮色时分有多美?

时尚COSMO 浏览 2663

特朗普抓获委内瑞拉总统马杜罗的前因后果

澎湃新闻 浏览 3627

雷军回应内部会议将玄戒O1读成01:鬼使神差念错了

IT之家 浏览 3511

月销暴跌至不到50辆 小米SU7 Ultra专属销售团队解散

大象新闻 浏览 99191

汪海林为《给阿嫲的情书》正名:胜利属于人民

小徐讲八卦 浏览 122

小S金钟奖获奖,坦言无助的时候想打电话给大s

韩小娱 浏览 4563

被张坤抛弃,又一巨头跌懵了!

财经锐眼 浏览 3290

向太曝郭碧婷父亲患病或时日无多,儿媳长期留台,私房钱贴补娘家

不八卦会死星人 浏览 4731

沃勒尔:罗马虽然输掉了与米兰的对决,但他们表现更胜一筹

懂球帝 浏览 4337

晒意大利女总理"色情照"的网站发关闭声明:很快再见

中国新闻周刊 浏览 9149

赞比亚总统:没在北京反美也没在华盛顿反华 求别脱钩

澎湃新闻 浏览 18458
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1