关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro3580人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

上海海港三场亚冠比赛仅拿1分,进1球丢6球

懂球帝 浏览 4538

中国男排主帅海宁现身全运会,称需建立不同于女排的培养体系

懂球帝 浏览 4308

权志龙风波升级!装不懂中文还无视中粉遭暴力对待,挚友被扒辱华

萌神木木 浏览 3821

国亮新材IPO:行业产能过剩、竞争对手强大,未来发展出路在哪里

览富财经网 浏览 4313

文班亚昕就这?前三节仅1分末节刷到7分 生日夜仍被杜锋战略冰封

颜小白的篮球梦 浏览 3820

“大衣+连帽卫衣”才是今年冬天最时髦搭配,减龄又松弛!

LinkFashion 浏览 2911

今年春天最美搭配:针织+裙子,这样穿好看又气质!

LinkFashion 浏览 2508

苹果CEO库克上海两日行:看LABUBU,首次“直播带货”,直言“太爱中国人和中国文化”

澎湃新闻 浏览 4745

时隔一年重要大会在东南沿海大省举办 出现新变化

政知新媒体 浏览 10466

李湘要气炸了!王诗龄封面脚被P成“双右脚”,芭莎无回应惹争议

乌娱子酱 浏览 3858

躲在流量后面的人,被监管点名了

钛媒体APP 浏览 3924

两人偷渡到柬电诈园"赚钱":一天骗五六个人应该差不多

大风新闻 浏览 20723

吕焯毅:我们踢得很团结有韧劲,大家都满意这场比赛

懂球帝 浏览 4440

三季报发布,中国人寿总保费规模创历史同期新高

证券市场周刊 浏览 4599

先L3还是直接L4?国内车企还在争论,特斯拉已经“空车”上路了

Autolab 浏览 3849

闪充加持 新款方程豹豹8申报信息曝光

车质网 浏览 2699

纯电移动"游戏机" 索尼本田合资AFEELA 1亮相CES

网易汽车 浏览 3539

热刺欧战主场近22场17胜5平保持不败,其中12次零封净胜球+47

懂球帝 浏览 4268

台湾一古宅所有正房大门都向着大陆 原因让人动容

都市快报橙柿互动 浏览 10352

长安福特要转让三条电池组装生产线,电动车转型下一步怎么走?

时代周报 浏览 5062

深度搜索如何学会自我监督:来自脑科学的启发

科技行者 浏览 3440
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1