关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者4391人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国公民需谨慎前往日本 四大原因披露

环球网资讯 浏览 43752

塞尔:马竞内部认为之后引进的球员必须在实力上优于离队者

懂球帝 浏览 3497

新兴市场套利狂潮未止!华尔街看好2026年高收益货币前景

智通财经 浏览 3852

30个项目脱颖而出!大赛让AI与实体经济深度“握手”

上游新闻 浏览 4500

第一次见有人被官方认证吹牛!内娱这位“老师”简直让人笑掉大牙

娱乐圈笔娱君 浏览 4191

美拉德失宠了?今年冬天最流行的3个颜色,谁穿谁好看!

LinkFashion 浏览 3613

志愿军"冷枪英雄":用206颗子弹杀敌203人 受金成日接见

极目新闻 浏览 9511

中乌外交部政治磋商在北京举行

界面新闻 浏览 3793

朱丹新年晒全家福,儿女戴眼镜长相很一般

疯说时尚 浏览 3790

卡拉格:曼城表现得很好,阿森纳会在英超冠军争夺中感到紧张

懂球帝 浏览 4204

李金羽:冲超没那么容易,希望球员们勇敢地面对各种情况

懂球帝 浏览 5156

弗赖堡vs汉堡:金特尔、格里福首发,法比奥-维埃拉、洛孔加出战

懂球帝 浏览 3554

特朗普发起新一轮无差别攻击 外媒:中国巴西受益最大

澎湃新闻 浏览 39006

这些才是真正接地气的穿搭!裤子基础、外套保暖,简单又自然

静儿时尚达人 浏览 3598

胡塞武装称若加沙停火破裂将恢复袭击以色列

极目新闻 浏览 4335

伊朗船只逼近美航母 美连开数炮全打空

每日经济新闻 浏览 2535

Space X的护城河

华尔街见闻官方 浏览 3859

美军称在东太平洋打击一“贩毒船” 致4人死亡

极目新闻 浏览 3906

英伟达RTX Spark芯片细节:10x Cortex-X925+10x Cortex-A725核

IT之家 浏览 606

LV高管空降泡泡玛特,年薪300万港元

YOUNG财经 浏览 3840

体图:格纳布里愿意接受较低薪资,拜仁可能和他续约两年

懂球帝 浏览 4484
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1