关闭广告

蚂蚁集团突破性研究:一个视觉"万能钥匙"让AI同时理解和创造图像

科技行者4298人阅读


这项由蚂蚁集团旗下Inclusion AI团队领导的重要研究发表于2025年10月,研究团队包括黄梓源、郑丹丹、邹程等众多研究员。论文题为《Ming-UniVision: Joint Image Understanding and Generation with a Unified Continuous Tokenizer》,感兴趣的读者可以通过arXiv:2510.06590查询完整论文,相关代码和模型已在GitHub、HuggingFace等平台开源。

AI看懂图片和创造图片,原本是两个完全不同的任务,就像一个人既要当翻译官又要当画家。以往的AI系统通常需要分别训练两套完全不同的"大脑"来处理这两种任务。现在,蚂蚁集团的研究团队找到了一种方法,让AI用同一套"视觉语言"既能理解图片内容,又能根据文字描述创造全新的图像。

这个突破性发现的关键在于他们开发

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

果然,51岁钟汉良还是赢了

温柔娱公子 浏览 3123

猜你喜欢拿“嘴替”当情绪解药......

时尚COSMO 浏览 3538

50+女人秋冬穿衣避坑指南:衣不紧身、不花哨,这样穿更高级

静儿时尚达人 浏览 4165

大衣里面穿什么?这件内搭才是今年冬天的“顶流”

LinkFashion 浏览 3392

巴黎小将博利首次代表一线队出场却上半场就伤退,含泪离场

懂球帝 浏览 3786

中美两军在夏威夷见面 中方当场划下两条"红线"

看看新闻Knews 浏览 63066

1200亿天价订单疑云:宁德时代为何押注一家“小公司”?

野马财经 浏览 3510

艾克森晒自己球衣收藏:含国足、广州、海港球衣

懂球帝 浏览 2647

快看!!这个女演员近日暴瘦!!哦,知道了……

时尚COSMO 浏览 1334

小鹏汽车2025年全年交付量达429,445台 同比增长126%

网易汽车 浏览 3737

一架美军MQ-9"死神"无人机坠毁

国际在线 浏览 599

3500亿小红书,到了最危险时刻?

无冕财经 浏览 1279

我永远不会买黄金,更不会投资黄金!

浏览 26531

理想汽车材料科技研发分享会:真自研非“字研”

网易汽车 浏览 3847

辽粤会师全运会半决赛!杨鸣:广东占天时地利人和

体坛周报 浏览 4413

英特尔AI双赛走出的万名开发者,正在弥合AI人才缺口

科技行者 浏览 3440

人道局势持续恶化 加沙停火能否进入第二阶段尚存变数

国际在线 浏览 3590

官方:新疆足球超级联赛5月至7月举办,分为南北区共14支球队

懂球帝 浏览 2822

安踏强势反腐背后 毛利率下滑 营销、采购是重灾区

21世纪经济报道 浏览 5184

今冬高质感穿搭,很有气质!

Yuki女人故事 浏览 3803

iPhone17来了!华强北最新实探

中国基金报 浏览 5248
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1