关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro3577人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

高管“换血”,股东内斗落幕!200亿淳厚基金迎国资入主

独角金融 浏览 3539

国产药械对外授权交易再现新进展,创下多个“首个”

第一财经资讯 浏览 4780

德约领衔ATP阿德莱德站正赛名单

体坛周报 浏览 3862

请“村长”当副总裁、拿下7000台订单,何小鹏:汇天飞行汽车2026年将量产

时代财经 浏览 4566

超越纯视觉模型!不改VLM标准架构,实现像素级深度预测

新智元 浏览 4652

U23国足要夺冠?成功避开死亡半区!或一路杀入决赛+硬撼日本

念洲 浏览 3506

今年春天的半裙,很“牛”!

Yuki女人故事 浏览 2789

特朗普:伊朗即使放弃高浓缩铀也无法获得解除制裁

央视新闻客户端 浏览 23526

刘强东请15万京东外卖全职骑手吃肯德基

网易科技报道 浏览 4417

前女友曝19岁荣梓杉出轨打人,男方评论区沦陷,网友喊话道歉退圈

扒虾侃娱 浏览 4673

克林顿与爱泼斯坦案受害者共浴照片披露:坐在浴缸里

扬子晚报 浏览 3837

第五届意大利繁花电影节圆满落幕!

幕味儿 浏览 4424

拖欠WTO的会费 美国已悄悄补缴

上观新闻 浏览 9871

许传智被查:在中纪委工作超30年 曾任宁夏纪委书记

界面新闻 浏览 9402

闫妮:除非她再拿视后

小椰的奶奶 浏览 4527

法尔克:曼城有意科隆前锋赛义德-马拉,巴黎和国米也在关注

懂球帝 浏览 4487

最强越野车!搭载3.0T V6引擎 涉水深度900mm

隔壁说车老王 浏览 3510

OptiScaler发测试版:抢跑AMD为Vulkan游戏开启FSR 4

IT之家 浏览 2985

女子年初砸60万买黄金国庆后花20万买白银基金:真运气

潇湘晨报 浏览 18710

小米汽车2026年月销稳站3万+台阶

盖世汽车 浏览 612

足球报:海牛资金有困难,但追加奖金第一时间就发到球队手中

懂球帝 浏览 4363
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1