关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者3333人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

男子强奸大嫂出狱再杀人案启动再审 高院披露详情

南国今报 浏览 15270

经济观察报:深圳4-4卓尔涉5000万的假球,没赢是李铁不想输

懂球帝 浏览 4533

又一位难得的好演员,突然走了

独立鱼 浏览 4225

斯基拉:法比安即将与巴黎续约至2029年,交易已敲定并确认

懂球帝 浏览 3396

女子被丈夫掐脖致偏瘫:他曾嫌女儿吵闹用烟头烫她胳膊

极目新闻 浏览 10700

一篇搞懂:飞书多维表格、n8n、Dify 等自动化工作流里的 Webhook 到底是个啥

钛媒体APP 浏览 4512

尹锡悦宣布戒严当晚 金建希与其争吵:因为你全搞砸了

每日经济新闻 浏览 19731

让男人上头的“伟哥”,遭遇大败退

花朵财经 浏览 4427

赵露思这段戏火了,陈伟霆当初没说错

刘蕳爱下厨 浏览 4931

突发!特斯拉美国要求禁用中国产零部件;离谱!曝多益网络创始人有300个孩子,公司回应;苹果CEO库克被曝或于明年卸任丨雷峰早报

雷峰网 浏览 4281

“十五五”规划建议:共有15个部分、61条,分为三大板块

国是直通车 浏览 4465

可惜了,这世界第一美少年

独立鱼 浏览 4477

彩虹-7高空高速隐身无人机成功首飞 实现重大突破

新京报 浏览 9532

美国否决加沙停火决议草案后 以美代表亲切握手

看看新闻Knews 浏览 5212

OPPO刘作虎:无法承诺全年不涨价

观察者网 浏览 1696

一款车就给吓成那样?某全球车企掌门人:比亚迪,是个巨大的威胁

小李车评李建红 浏览 4515

淘宝闪购参战、AI化改造加速,第17个双11,天猫有了新方向

电商在线 浏览 4575

小米、小鹏拿证,多家车企晒L3自动驾驶牌照!司机离解放双手还有多远?

时代周报 浏览 3730

黄子韬婚礼险翻车!许艺洋喊错男朋友

林木体育解说 浏览 4660

放下偶像包袱 大众安徽开始“听劝”

网易汽车 浏览 722

特朗普:对委军事行动使用了空中、陆地和海上力量

极目新闻 浏览 3646
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1