关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者4392人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

21载热血传承!2025肯德基三人篮球赛燃动青春赛场

中国商报 浏览 3928

青年创新的“破卷”之道:在无人区里找答案|2025浦江创新论坛

上观新闻 浏览 5453

特斯拉全面下架Model Y现车

电动知家 浏览 2456

Robotaxi发生伤人事故 哈啰出行自动驾驶业务暂停运营

界面新闻 浏览 21670

合资品牌的“下一程”,为什么要从CR-V谈起

汽车预言家 浏览 3851

中国汽车出海,插混和增程将是巨大的“机会点”

汽车公社 浏览 3552

本轮欧冠仅国米取胜,本赛季意甲欧战积分跌落至第8位

懂球帝 浏览 4395

不确定的时代里,亚马逊广告如何重构确定性?

有数DataVision 浏览 3824

搭第四代MBUX系统 奔驰纯电GLC亮相2026 CES

车质网 浏览 3581

加冕荷兰射手王+助攻王!德佩:又一破纪录时刻,而且远未结束

懂球帝 浏览 4594

对话Memories.ai:“人的记忆本质上是视觉,AI也该如此”

硅星人 浏览 4128

“大空头”伯里:英伟达“GPU战略”或使中国在AI竞赛中领先美国

IT之家 浏览 3797

与AI机器人同行,中山万人徒步共迎新年

南方都市报 浏览 3691

5年20款新50万辆野心:现代汽车在内卷中寻找"确定性"

网易汽车 浏览 1536

iQOO 15 / Neo11 手机全版本标配 2K 屏,自带 AR 增透消反保护膜

IT之家 浏览 4601

股价连跌6天,但泡泡玛特却在全球狂飙!

正解局 浏览 4563

全网泪目!《马踏樱花》一夜刷屏

手工制作阿歼 浏览 3983

在桃浦,解锁未来发展无限可能

上观新闻 浏览 3764

芯迈半导体二度递表,专利超300项!获国家级资本加持|港E声

时代周报 浏览 3694

首款可折叠iPhone最新消息:或在2026年秋季发布

环球网资讯 浏览 3999

《双轨》空降逻辑混乱,赛车泰拳伪骨科叠加,虞书欣演技难撑人设

不八卦会死星人 浏览 3886
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1