关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者3354人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

纽约时装周:美+好穿,不可错过的4大趋势

LinkFashion 浏览 6918

伊朗最高领袖哈梅内伊遇害 中方回应

财联社 浏览 2826

美官员称委内瑞拉代总统即将到访 委方尚未证实

环球网资讯 浏览 3348

H-1B签证费涨至10万美元 分析人士:将重创美科技行业

财联社 浏览 22104

承德露露,温水煮青蛙

斑马消费 浏览 4450

5轮首球,维拉在赛季开始427分钟才收获首球,英超历史第三晚

直播吧 浏览 5230

伊朗炮艇逼近悬挂美国旗油轮

CCTV国际时讯 浏览 3291

女友BELLA+封面 | SUPER JUNIOR 东海:感性诗人与舞台的热恋

伊周潮流 浏览 6573

吉利品牌登陆英国市场,目标 2030 年实现 10 万台汽车销量

IT之家 浏览 4514

散户转移战场、交易量枯竭:加密行业的“静默调整期”

智通财经 浏览 3343

AI时代存储“超级牛市”降临?透视A股存储核心产业链掘金逻辑

时代周报 浏览 3367

节哀,诺丁汉森林老板马里纳基斯的母亲去世

懂球帝 浏览 3894

最有种的女明星

江湖人称艾掌门 浏览 4351

黄仁勋这波杀疯了 NVIDIA RTX Spark首测跑分:碾压苹果M5 54%!

快科技 浏览 583

新规在路上!基金销售要“变天”?

国际金融报 浏览 3923

vivo严打“黑公关”:索赔近千万!

互联网那些事 浏览 4611

数十农民工被拖欠百万工钱 劳务公司:争取春节前兑付

大风新闻 浏览 6764

最牛退休女工,靠卖易拉罐,纳税100亿

创业家 浏览 4582

跨年档12部新片来袭!没有大片全是情怀,55岁古天乐对打71岁成龙

萌神木木 浏览 3760

《麻省理工科技评论》发布2026年“十大突破性技术”

DeepTech深科技 浏览 3548

妻子在家中失踪 深井边的菜让丈夫顿感不妙

环球网资讯 浏览 35089
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1