关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者4364人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

输球后被球迷辱骂,标准列日前锋:大街上也这么跟我说话试试

懂球帝 浏览 3929

“军国主义”为何能在日本存续下来

国际在线 浏览 4038

久尔杰维奇谈击败沙特U21:本想争取更多进球;赢球最重要

懂球帝 浏览 570

翻车舞台!张远魔改《夜的第七章》,拉垮黄霄云

黔乡小姊妹 浏览 3777

苏格兰11月世预赛大名单:麦克托米奈、罗伯逊领衔

懂球帝 浏览 4294

特朗普:美对贩毒集团陆地打击行动可覆盖墨西哥等地区

上观新闻 浏览 3460

上海海港三场亚冠比赛仅拿1分,进1球丢6球

懂球帝 浏览 4537

范雨林:实力硬汉却不红,娶普通人低调过日子

失宠的小野猪 浏览 3507

曝小米汽车调整销售体系!

电动知家 浏览 5342

徐艺洋三亚美照惊艳

悦君兮君不知 浏览 4171

镰田大地:日本需要加强防守,踢巴拉圭远未达我们的平均水准

懂球帝 浏览 4574

轴距2815mm 全新欧版马自达CX-5新车图解

车质网 浏览 4306

多次被传出轨家暴后,小S公开与许雅钧真实状况

动物奇奇怪怪 浏览 736

观众对白百何的评价,明白了当年宋丹丹那番话

娱乐圈笔娱君 浏览 3443

巴基斯坦和阿富汗同意继续停火 将于11月继续会谈

环球网资讯 浏览 4368

新一代理想L9电池加码体型加大 重夺高端话语权

网易汽车 浏览 3453

范志毅:U23国足半死不活的踢法世界最先进最科学 对手不会踢了

念洲 浏览 3530

卫报:曼苏尔和芬威集团的第三大股东曾成立一家联合投资公司

懂球帝 浏览 4376

i茅台1499元直销飞天茅台“秒空”,每5分钟补货仍遭疯抢

红星资本局 浏览 3634

2026巴黎高定时装周|全世界最美的衣服都在这了

LinkFashion 浏览 3345

伊姐周日热推:电视剧《太平年》;电视剧《暗恋者的救赎》......

伊周潮流 浏览 3464
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1