关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者3331人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

大普微浸没式液冷版蛟容5企业级固态硬盘实现正式应用落地

IT之家 浏览 3968

不愧牛市!证券公司赚疯了,有人利润翻5倍

说财猫 浏览 3434

普京:若乌方不愿和平解决 俄方就打到问题解决

国际在线 浏览 3696

刘欢,早已走上另一条大道

奥字侃剧 浏览 3604

李湘高调炫富再传噩耗,隐私被扒洗不白

生命之泉的奥秘 浏览 3427

美国欲“夺岛”,俄罗斯正“吞地”,中国应做什么?

浏览 27724

石破天惊,日本电影新浪潮的开山大师名作!

幕味儿 浏览 4597

特朗普不解"为什么伊朗还不投降" 伊朗外长回应

CCTV4 浏览 2693

SHEIN新加坡公司财务真相调查:去年增收不增利,过去3年纳税约4亿美元

红星资本局 浏览 4745

中国第42次南极考察启航

环球网资讯 浏览 4303

罗永浩炮轰电信宽带缩水:再不解决,就要在网上发疯了

观察者网 浏览 3865

美国驻卡塔尔乌代德空军基地部分人员被建议周三晚前离开

环球网资讯 浏览 3538

业主反映多户顶楼业主违规加盖房屋 持续多年无法拆除

红星新闻 浏览 8309

女人不管年纪多大,衣柜里都要准备几件衬衫,百搭耐穿又简约

静儿时尚达人 浏览 1269

广汽传祺1月交付新车 终端销量逆势双增长

网易汽车 浏览 3367

2025年,他们集齐了十二枚臂章

我们的太空 浏览 2928

AI改变金融系统,周小川、肖远企发声

中国基金报 浏览 4389

对话 vivo OS 产品副总裁:AI 不会产生新的需求,通往远方是马车还是蒸汽机是产品形式问题

爱范儿 浏览 4597

"烟花秀"事件后始祖鸟遇"三连挫":大中华区总经理离职

每日经济新闻 浏览 10410

宁德时代再出手!1月内从弃控到增资,深度绑定富临精工磷酸铁锂版图

时代周报 浏览 3320

全球首个飞行汽车量产工厂试产,何小鹏官宣:期望在2026年量产机器人

商用车头条 浏览 4344
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1