关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者4390人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

斯帕莱蒂为跑轰尤文注入灵魂,奥彭达被重新“救活”

体坛周报 浏览 3866

郑爽近照曝光星味全无,家中装修豪华惊现儿童玩具,日子并不可怜

不八卦会死星人 浏览 3613

奔驰A级车延至2028年,新车型同步推进

MOTO 浏览 5282

荷兰限制与美国情报共享:我们的情报被政治化了

澎湃新闻 浏览 9969

吊打比亚迪、用“老头乐”狂割美国人,这家车企要赴港上市了

钛媒体APP 浏览 4469

Here we go!罗马诺:安德莱赫特边锋尼尔松-安古洛加盟桑德兰

懂球帝 浏览 3331

谢林汉姆:雅克松经验丰富,切尔西不应该放他离开

懂球帝 浏览 4586

华为“三界”入局 高端MPV混战白热化

汽势传媒 浏览 1959

BBC两高管宣布辞职 特朗普:他们试图"介入总统选举"

红星新闻 浏览 9379

沉默的荣耀大结局前瞻,最惨角色出炉,果然不幸的人各有各的不幸

娱乐圈笔娱君 浏览 4629

长安汽车2026Q1财报:营收327亿元 海外销量大增

网易汽车 浏览 1555

美业数字化再添新助力 成都美博会AI美业工具受追捧丨新经济观察

封面新闻 浏览 4547

购置税新规下的购车选择题,插混车抄底还是等新车?

百姓评车 浏览 4730

全国高校最强国产算力:“致远一号”搭载1024张华为昇腾910B

IT之家 浏览 3864

库克直播间带货 苹果换了打法

北京商报 浏览 4772

带着理想出发:理想汽车携手易烊千玺为时代青年发声

三言科技 浏览 5177

董忠云:保持战略定力,增强必胜信心,A股有望恢复震荡上行趋势

首席经济学家论坛 浏览 4370

极兔速递三季度包裹量76.8亿件,同比增长23.1%

封面新闻 浏览 4727

荣耀Magic8 Pro Air手机线下展出,影像、显示等核心参数公开

IT之家 浏览 3561

阿尔特“AI+数智创造”,汽车设计革命前夜?

禾颜阅车 浏览 3558

财政部:1-8月国有企业利润同比下降2.7%

财政部 浏览 5002
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1