关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者3576人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

男子围猎多名女性自称是"公务员" 有女子给他140万

极目新闻 浏览 96292

“疲惫脸”太丑了!有这些特征的女生怎么救?

Yuki女人故事 浏览 4994

无需多视角,单图重建可交互3D模型!南洋理工开源结构推理框架

新智元 浏览 1750

服装AB版带货套路:消费欺诈不能成行业“潜规则”丨中听

大象新闻 浏览 4244

美国欲“夺岛”,俄罗斯正“吞地”,中国应做什么?

浏览 27724

新一任美联储主席被任命 华尔街无法确定其"是敌是友"

环球网资讯 浏览 7872

美国宣布针对伊朗实施新一轮制裁

上观新闻 浏览 3331

10月车企交付数据汇总:小米小鹏均超4万,零跑破7万

三言科技 浏览 4246

琼瑶女神摘下假牙,撕碎的是流量滤镜

大龄女一晓彤 浏览 4607

云拒科技推出Yunjue Agent:能够从零开始自我进化的助手系统

科技行者 浏览 3368

官方通报贵州习水食物中毒事件:学生89人住院

界面新闻 浏览 23714

俄军空袭乌克兰首都基辅 供电供暖大范围中断

界面新闻 浏览 3667

小城大事:郑德诚风波解除,李秋萍为空降镇长

少女的烦恼 浏览 3596

波罗的海三国正式退出《渥太华禁雷公约》

上观新闻 浏览 3705

五菱宏光MINIEV 11月销量56756辆 登顶全行业销冠

太平洋汽车 浏览 3897

三种动力配置 星光560将于1月15日上市

网易汽车 浏览 3499

抖音发布2025直播治理白皮书,违规曝光量减少37%

财闻 浏览 3509

彩虹-7高空高速隐身无人机成功首飞 实现重大突破

新京报 浏览 9526

华为登顶,吃了谁的蛋糕?

智东西 浏览 3508

刚刚 | “死了么”APP征名!

天津广播 浏览 3486

双14.6英寸联屏 星越L长风系列上市限时价12.47万起

网易汽车 浏览 2743
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1