关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者4365人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

RMC:姆巴佩找到外部专家以检查膝伤,他有望3月中旬回归

懂球帝 浏览 2770

2026春夏八大流行趋势

LinkFashion 浏览 3023

阿富汗称与巴基斯坦在伊斯坦布尔举行第三轮谈判

国际在线 浏览 4262

特朗普政府同意与伊朗在阿曼举行谈判

新华社 浏览 3315

枪手又被黑?塔帅称VAR的解释不对

体坛周报 浏览 3482

母亲被父亲刺28刀死亡 11岁儿子因给父亲开门深深自责

都市报道 浏览 15027

落地“好房子”,龙湖2025年交付近7万套品质房源

YOUNG财经 浏览 3448

是时候考虑购买美国大豆了,为了“拴住”特朗普!

北向财经 浏览 4335

连刷6集,这部新剧太刺激了

来看美剧 浏览 2844

时隔8年,苏农银行终换行长

财经众议院 浏览 4395

太空“4S店”要开张:Starfish验证“单眼”卫星交会PRO操作

IT之家 浏览 3979

记者:切尔西曾询问过范戴克的情况;目前考虑冬窗引进新后卫

懂球帝 浏览 3571

秦岚自曝身体出现情况,治疗结果不尽人意

乡野小珥 浏览 2858

今日起,数字人民币开始计息,这些变化影响你的钱包

红星资本局 浏览 3617

你的卫衣该换了!这4款真的太显土啦!

Yuki女人故事 浏览 4312

俄告知美方将打击基辅 建议人员撤离

第一财经资讯 浏览 680

NASA好奇号从夏普山发回全景图,展示火星崎岖地貌

IT之家 浏览 3623

福建舰已完成多次海试 进度远超预期

央视新闻客户端 浏览 3856

消费降级2年,大家2025年还会买什么?

黎贝卡的异想世界 浏览 4475

售7.29万 第4代帝豪全球400万纪念款新车型上市

网易汽车 浏览 3640

富勒姆出价3500万英镑求购鲍勃

体坛周报 浏览 3476
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1