关闭广告

用图片来存储记忆,AI助手可以更聪明地处理长对话了

科技行者3385人阅读


提到人工智能助手,你可能经常遇到一个烦人的问题:当对话越来越长时,AI似乎越来越健忘。为什么会这样呢?这不是因为AI变笨了,而是因为大语言模型有一个硬性限制——它们的"注意力窗口"就像一个大脑的工作记忆,容量是有限的。当信息堆积得太多时,重要的细节就开始模糊,AI开始犯错。

这项由美团、中国科学技术大学和新加坡国立大学的研究团队发表于2026年1月的突破性研究,提出了一个全新的解决方案。他们的论文《MemOCR:用于高效长视野推理的布局感知视觉记忆》(论文编号:arXiv:2601.21468v1)介绍了一种完全不同的思维方式——与其像记笔记一样用文字堆砌信息,不如用图片来存储记忆,让关键信息在视觉上更突出。听起来有点奇怪?不妨跟我一起深入理解这个聪明的创意。

想象一下,你正在做一个很长的采访记录。如果你用普通方式记笔记,你会列出所有信息:姓名、背景、关键观点、补充细节等等,每一条信息都占用同样的空间。但如果你用一个更聪明的方式,你会用大字号标题强调人名,用粗体突出关键观点,用小字体记录辅助信息,这样即使记录被压缩得很小,重要信息仍然清晰可辨。这正是MemOCR所做的事情。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普"闯祸"泄露军事机密:美军要重返阿富汗对付中国

文雅笔墨 浏览 24644

今年TVB已有7位老戏骨离世

萌神木木 浏览 4450

人类会彻底沦为无用阶级吗?

虎嗅APP 浏览 4014

威少:梦想打橄榄球的我从未想过能有如今成就,希望我能激励到其他人

懂球帝 浏览 3723

美再发安全警告 敦促美公民立即离开伊朗

国际在线 浏览 3495

俄外交部:乌方对和平解决冲突“缺乏兴趣”

环球网资讯 浏览 4186

小米、小鹏拿证,多家车企晒L3自动驾驶牌照!司机离解放双手还有多远?

时代周报 浏览 3725

中国机器人组团出征CES,加速进化首日售出数十台,魔法原子海外收入占比过半

红星资本局 浏览 3474

能把埃尔法打下神坛?智界V9申报图曝光 定价50万左右

网易汽车 浏览 3561

亚洲颜值天花板,居然合体了

独立鱼 浏览 3631

抄底许家印,截胡王健林,这个湖北出来的80后为什么能登顶巅峰?

时评人李文君 浏览 1267

沃尔沃中国未来姓沃还是姓吉?

禾颜阅车 浏览 4734

牛弹琴:白宫突然发了张图 伤害性不大侮辱性极强

现代快报 浏览 39453

大巴黎公布24/25赛季财报:营收达8.37亿欧元,创历史新高

懂球帝 浏览 4445

纵贯一整年的精彩:柏林电影节佳作在中国

幕味儿 浏览 3766

阿斯:卡瓦哈尔已具备首发的状态,阿诺德预计周末回归名单

懂球帝 浏览 3353

聚辰半导体冲刺港股:9个月营收9.3亿利润3.1亿陈作涛控制24%股权

雷递 浏览 3497

内德维德:我一直很喜欢加斯佩里尼,罗马有这样的教练是幸运

懂球帝 浏览 4548

与黄晓明离婚后,杨颖背后的男人是有妻女的他

枫尘余往逝 浏览 107

7天吸金36亿,合肥冲击“新能源汽车之都”,汽车产业高速发展伴随“阵痛”

红星资本局 浏览 4436

美海军"林肯"号航母打击群抵达中东地区

环球网资讯 浏览 3345
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1