关闭广告

AI大模型"减肥"新突破:MWS AI团队让语言模型变小却更聪明

科技行者915人阅读


这项由MWS AI公司和ITMO大学联合完成的研究发表于2025年10月,论文编号为arXiv:2509.22075v2。研究团队包括来自MWS AI的Dmitriy Shopkhoev、Denis Makhov、Magauiya Zhussip和Stamatios Lefkimmiatis,以及来自ITMO大学的Ammar Ali。有兴趣深入了解的读者可以通过该论文编号查询完整研究报告。

现在的大型语言模型就像一台超级智能的机器,能够回答各种问题、写文章、翻译语言,但有一个大问题:它们实在太"胖"了。这些模型需要占用大量的计算机内存和处理能力,就像一辆装满行李的重型卡车,虽然功能强大,但开起来费油又缓慢。对于想在手机、平板电脑或者小型服务器上运行这些智能助手的人来说,这简直是个噩梦。

为了解决这个问题,研究人员们想出了各种"减肥"方法。最流行的一种方法叫做"低秩分解",可以把它理解为把一个复杂的大拼图拆解成几个简单的小拼图。但是这种方法有个致命缺陷:它假设所有的拼图碎片都必须遵循同一个模式,就像强制要求所有人都穿同一个尺码的衣服一样,结果往往是不合身的。

MWS A

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

柬媒:正式接班洪森的第一天 洪玛奈早起送孩子上学

中国新闻周刊 浏览 88440

利民推出 PA140 SE 双塔风冷:158mm 高双风扇六热管,275W 解热

IT之家 浏览 1022

莫斯科市市长:一无人机坠毁莫斯科商业区附近

界面新闻 浏览 14489

吴恩达:美国芯片出口限制之下,中国仍有创新

观察者网 浏览 12942

"希腊船王"继承人战胜癌症 被虫子咬一口莫名其妙死了

新民晚报 浏览 20154

39岁詹皇雷霆万钧隔扣乔治!伍德捂脸不敢相信 球迷惊讶 阿彪狂笑

颜小白的篮球梦 浏览 13047

中国重点40城,九年间消失了多少企业?

财经十一人官方 浏览 19530

法国宣布推出M51.3潜射弹道导弹 称其为“重大里程碑”

环球网资讯 浏览 795

百亿私募大佬但斌有了"新身份":中国香港居民

每日经济新闻 浏览 1461

拒绝逆转,库里37分3帽&末节连得12分,命中生涯第3500记三分

懂球帝 浏览 12763

李子柒做泡菜遭韩国网友围攻,自诩韩国为泡菜宗主国

趣看热点 浏览 26327

近15年欧冠冠军,曼城论实力排第几,算是最强一档的球队么?

直播吧 浏览 16034

五角大楼:所有F-35战斗机应当在90天内接受翻新

环球时报新闻 浏览 19445

追梦谈落选奥运会名单:很失望&本想拿第三金,我是球队领袖

懂球帝 浏览 12485

看了港星的生活现状,再看内地明星现状,网友直言:都是惯的!

肆季娱乐 浏览 12852

泽连斯基称德国已向乌交付“爱国者”防空导弹系统

环球网资讯 浏览 717

将迎决赛首发?埃迪-豪:这是卡里乌斯重写职业生涯的绝佳机会

直播吧 浏览 19061

以军称袭击黎巴嫩真主党多个军事目标

极目新闻 浏览 902

比特币涨势再添动力!英国为加密货币ETN敞开大门

科创板日报 浏览 11337

荣耀Magic5系列国行发布3999元起:"青海湖"电池+鹰眼相机

网易手机 浏览 19286

营收交付创新高,为何禾赛科技反而赚得更少了?

钛媒体APP 浏览 14775
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1