关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者3577人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

里程碑,勇士主帅科尔取生涯执教第600胜&位列NBA第28位

懂球帝 浏览 2570

事业单位招考2名临聘人员进面试 网友质疑是"萝卜岗"

潇湘晨报 浏览 12604

在大陆淘金20年,眼看赚钱机会没了,香港老板套现17亿清仓离场

壹只灰鸽子 浏览 3649

赖清德只字不提台湾光复 还在公然纪念"古宁头战役"

海峡导报社 浏览 9980

ESPN:德容已与巴萨就续约达成协议,他的薪水将降低

懂球帝 浏览 4549

特朗普还嘴硬:莫迪保证过不买俄罗斯石油了

澎湃新闻 浏览 9615

普京酝酿的“重大行动”,会给中国带来机遇?

浏览 27778

欧洲各国在格陵兰岛凑出一个排兵力 丹麦驻军大幅增加

上游新闻 浏览 13069

国安部门破获一起直播泄露军事秘密案

上观新闻 浏览 5084

媒体:关于台湾问题 2028年有3个关键时间节点

经济观察报 浏览 9384

八大国家队世界杯进球榜:克洛泽16球第1,大罗第2,梅西第3

懂球帝 浏览 4580

香港中文大学突破AI训练难题:单个词汇也能让机器学得更聪明

科技行者 浏览 4509

长沙女子双节返程 发现母亲在大米里藏了1000元现金

潇湘晨报 浏览 6051

陈伟霆何穗官宣当爸妈!圈内仅5位明星送祝福,女方为爱放弃事业

萌神木木 浏览 3839

美军机沿伊朗边界飞行 伊朗寻求外交支持

新华社 浏览 3609

记者:哥伦比亚小将马丁内斯的未来将在几天内敲定

懂球帝 浏览 1687

专家:演习5个区域形成"三面围岛"之势 传递明确信号

环球时报 浏览 25090

交易对价约3.66亿元,华大智造拟收购两大前沿业务

南方都市报 浏览 3336

“小棕鞋”今年春天太流行了!这3双怎么搭都好看

LinkFashion 浏览 2663

将于3月10日首发 奔驰VLE国内测试车曝光

车质网 浏览 3398

卡拉菲奥里:我不想看世界杯比赛;希望在阿森纳继续赢下去

懂球帝 浏览 725
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1