关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者3328人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

今年第三次!53万的理想MEGA烧了,奶爸:不敢想象

说财猫 浏览 4381

VOGUE大合照太势利:影后只能站角落?

娱乐圈笔娱君 浏览 4493

17年的双十一底层逻辑变了?“小时达”来了,AI帮你选品

时代周报 浏览 4341

亚马逊CEO安迪·贾西:AWS到2027年底将实现电力容量翻倍

IT之家 浏览 1965

被预制菜笼罩,商场餐饮大撤退?

餐饮老板内参 浏览 3767

美伊协议核心条款曝光:伊朗石油出口即刻解禁,核项目维持现状,海峡重启仍存变数

华尔街见闻官方 浏览 109

民事诉讼牵出5年纠纷!迅雷再诉前CEO陈磊损害公司利益,知情人:追索金额达2亿元

红星资本局 浏览 3440

魏晨一家三口合体,妻子抱着儿子看他演唱会

柠檬有娱乐 浏览 4262

乌方公布视频:无人机命中俄方两架安-26运输机

环球网资讯 浏览 4419

美国宇航局成功验证太空识别GPS干扰源能力

IT之家 浏览 699

伊朗外长在敏感时刻访问中国 美国最不愿看到局面发生

军武咖 浏览 14748

董璇张维依三亚带娃,这才是家庭最舒服的样子

吴霶爱体育 浏览 2968

周星驰罕见发声!盛赞吴宜泽夺冠

今古深日报 浏览 1360

机器狗浇花、机器人越野:这比赛比综艺还好看

36氪 浏览 3118

奇才129-126逆转雄鹿,麦科勒姆28分,KPJ空砍30分

懂球帝 浏览 4047

强硬夺权、父子决裂!84岁“鞋王”何以至此?

无冕财经 浏览 3498

乌克兰一地遭俄军无人机密集袭击 基辅实施紧急停电

每日经济新闻 浏览 3458

余嘉豪:扣完篮肾上腺素就上来了,但得马上冷静继续投入比赛

懂球帝 浏览 4239

特朗普上台后,美国的“狗腿子”要小心了!

浏览 27888

阿斯:卡马文加要去看牙医,因此缺席出战赫塔费

懂球帝 浏览 2891

太子集团创始人陈志被遣送回国 外交部回应

财联社 浏览 14006
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1