关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者3582人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

2026年央视春晚彩排开始!沈腾马丽回归,但呼声最高的是他们

娱乐圈笔娱君 浏览 3609

董璇带小酒窝给朵朵庆生,陈思诚佟丽娅大方合照

爱吃冰棍的小痞子 浏览 3330

记者:在对阵多特的欧冠比赛中,热刺将缺阵15人

懂球帝 浏览 3409

汪小菲陪马筱梅拍孕肚写真,俯身听宝宝动态,幸福洋溢在脸上

素素娱乐 浏览 3362

始祖鸟发布道歉信 但海内外版本不一致

极目新闻 浏览 23868

尚水智能三度试水A股终迎曙光 比亚迪十亿关联交易护航IPO闯关

叩叩财讯 浏览 3915

罗斯、威少、沃尔、莫兰特,四大野兽控卫谁的身体天赋最逆天?

仰卧撑FTUer 浏览 2693

无缘提前2轮保级!武汉三镇54天不胜,6年首负新鹏城,4纪录告破

奥拜尔 浏览 4561

雷克萨斯NX绝色限定版上市 售价30.96万起

车质网 浏览 3380

怒放竞技场3V3街头足球赛玉溪站落幕,奥斯卡、约尼查助阵

懂球帝 浏览 4431

《我不是药神》原型陆勇时隔5年重返印度

红星新闻 浏览 8359

男子花3万多网购2400克银条空欢喜 付款次日店铺清空

红星新闻 浏览 18604

RMC:姆巴佩找到外部专家以检查膝伤,他有望3月中旬回归

懂球帝 浏览 2776

BBA,势败如山倒

虎嗅APP 浏览 3445

泰晤士报:阿森纳关注卢克巴和利夫拉门托;贝尔塔想清理冗员

懂球帝 浏览 2585

特朗普:加沙"和平委员会"已成立

新京报 浏览 3585

曾以105.6万成交的"凶宅"再次上架 26.6万元起拍

封面新闻 浏览 9593

三季报,茅台失速!

YOUNG财经 浏览 4379

输深圳山西球迷绝望了!末节攻守全崩,精气神也丢,该清理混子了

篮球资讯达人 浏览 3557

米体:尤文自2019年起已完成四次增资,总额接近10亿欧

懂球帝 浏览 4170

揭秘!印巴冲突突然停火背后五大关键因素

浏览 8229
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1