关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者3326人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

保剑锋否认出轨传闻!陈年往事够精彩

凌风的世界观 浏览 3850

孙艺珍最新生图撞脸老公玄彬,43岁显出老态,剪短发装嫩太违和

萌神木木 浏览 4658

蔚来 ES6 汽车将迎里程碑时刻,第 30 万台今年 11 月交付

IT之家 浏览 3708

单眼皮、矮个子、微胖,停止焦虑!普通女孩的美丽指南请收好

Yuki女人故事 浏览 3032

媒体:美航母编队一重要舰种 已经少于中国055大驱

新民周刊 浏览 38153

天猫服饰10月刊:趋势解码·上新日历 | CBNData报告

第一财经商业数据中心 浏览 4527

内塔尼亚胡:以色列将不得不做出"痛苦且重大"让步

环球网资讯 浏览 6651

OPPO Enco Air5 Pro无线蓝牙耳机发布:55dB降噪,329元

IT之家 浏览 2965

李湘要气炸了!王诗龄封面脚被P成“双右脚”,芭莎无回应惹争议

乌娱子酱 浏览 3858

印度建厂失败,大家都说特斯拉躲过一劫?福特20亿美元血本无归

小李车评李建红 浏览 745

刘晓庆回应年龄追问:关你们什么事

期望带来失望 浏览 3232

将于12月5日上市 别克至境世家广州车展发布

网易汽车 浏览 4228

排队200桌,这个地域火锅成了今冬“顶流”

餐饮老板内参 浏览 2888

白宫附近国民警卫队员遭枪击:500名士兵将增派华盛顿

澎湃新闻 浏览 25397

伊朗外长:霍尔木兹海峡实际开放 仅对敌人关闭

国际在线 浏览 2520

梅德维德夫晋级中网男单八强

体坛周报 浏览 5161

关于格陵兰岛 普京表态:与俄罗斯完全无关

极目新闻 浏览 20782

有望2026年亮相 曝法拉利首款纯电动车谍照

车质网 浏览 4557

33.38亿!刘永好实控的新希望拟定增募资用于数智化升级和还债

红星资本局 浏览 3510

储朝晖:应对“入学潮”,推动教育提质增效

环球网资讯 浏览 3894

郎酒发布年度十大图片:“拼”出郎酒的向上征程!

Daily每日财报 浏览 3479
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1