关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者3353人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

D系列首款产品 零跑D19将于12月28日上市

车质网 浏览 3889

LLM 仅靠自身就能增强推理?SePT 给出简洁在线自训练范式

机器之心Pro 浏览 1714

卡瓦哈尔谈国家德比:我们渴望复仇,击败他们意义重大

懂球帝 浏览 4531

为什么你越保养,皮肤反而越没光?

时尚COSMO 浏览 3742

记者:成都是最国企的俱乐部,现在应关心周定洋和莱切特续约

懂球帝 浏览 3913

走失女童被找到后父亲首度发声:感谢1.2万个恩人

极目新闻 浏览 10511

奇瑞QQ3纯电版要来了 轴距2700mm

网易汽车 浏览 3654

陈奕迅回应患焦虑症:仍在服药看医生,但已好转大半

大象新闻 浏览 4544

经典之上再造经典 BJ40探险家上市 13.49万元起

网易汽车 浏览 3480

乌总统:美方28点计划已有所精简

每日经济新闻 浏览 4112

业绩承诺补偿“爽约”,鹏欣资源起诉公司实控人,此前收购金矿不赚反亏超3亿

红星资本局 浏览 3395

蒋奇明挖到宝了,剧版《731》口碑井喷,抗战剧又有了新的标杆

娱乐圈笔娱君 浏览 3906

稳增5.6%!武汉GDP站稳2.2万亿

虎投邦 浏览 3288

特朗普:“国际部队”将进驻加沙地带

每日经济新闻 浏览 4351

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者 浏览 3543

新设计 兰博基尼Manifesto概念车官图发布

车质网 浏览 3788

第五代骁龙8之后,旗舰机有了新的“标准版”

科技行者 浏览 4030

投机永不眠!加密货币失宠 币圈玩家转战预测市场

智通财经 浏览 3306

特朗普与普京长时间通话 “会晤”与“战斧”成话题

极目新闻 浏览 4716

春晚主持人阵容曝光,5位都是老面孔

领略非凡 浏览 3367

秦煌如今过成这样只能算他活该?

一针见娱 浏览 4524
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1