关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者3328人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美国动武后 外国领导人首次到访委内瑞拉

上观新闻 浏览 1447

4月五菱汽车全球销量11.67万辆 海外出口首破3万

网易汽车 浏览 1309

firefly萤火虫第4万辆交付 售11.98万元起

太平洋汽车 浏览 3555

多给2分钟来背锅?大帝25分钟20+6丢绝杀 马克西才该为失利担责

颜小白的篮球梦 浏览 4441

新年强势开局!AI需求叠加供给趋紧,存储芯片迎来集体反弹

华尔街见闻官方 浏览 3637

美被指向以色列通报对伊朗行动准备进展

每日经济新闻 浏览 3405

朱元璋变脸 研究学者:"鞋拔子脸"异像并非其真实面容

环球网资讯 浏览 21166

第九届人单合一模式引领论坛举行 构建AI时代的智能交互生态

尺度商业 浏览 5434

英伟达正式发布LPU,CPU重磅更新:GPU不再是GTC唯一主角

半导体行业观察 浏览 2574

司晓迪隐藏聊天记录牵扯背后产业链!上不了热搜,一深扒就删帖

萌神木木 浏览 3677

大S墓碑没自己名字,且一个中文都没有,具俊晔立深情人设引热议

扒虾侃娱 浏览 3390

郭爸曝郭碧婷家庭花销全靠她,嫁入"假豪门"?

代军哥哥谈娱乐 浏览 4646

加啥班啊!某车企被曝三点半,员工就陆续下班了

小李车评李建红 浏览 3856

直播间买货更放心了!两大新规封堵虚假宣传、仅退款乱象

贝壳财经 浏览 3251

她是钟小姐的穿搭榜样,从20岁到70岁,每一套都让人想copy

黎贝卡的异想世界 浏览 4393

以军空袭加沙警车致8名警察死亡

国际在线 浏览 2632

阿根廷3-0阿尔及利亚,梅西戴帽+加冕世界杯历史射手王

懂球帝 浏览 129

厦门大学等突破AI自学限制:让计算机为自己量身定制学习计划

科技行者 浏览 3323

变盘?危险的下注开始了

大猫财经Pro 浏览 3375

韩华航空航天公司与挪威签署9.22亿美元火箭发射器供应合同

财闻 浏览 3349

八部门:加快脑机接口等新型终端的产业化、商业化进程

澎湃新闻 浏览 3625
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1