关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻4779人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

98版沙僧刘大刚去世,最后露面曝光

科学发掘 浏览 4318

日本球迷惊呆:中国队4场1球进了4强? 刘建宏:我们愿一直苟着?

风过乡 浏览 3530

奇瑞的2025年,一场教科书级的“协同战”

车评社Auto 浏览 3722

特朗普:格陵兰岛仅靠狗拉雪橇进行防卫

环球网资讯 浏览 3461

随着西班牙3-0 世界杯16强定14席 中国队对手确定 亚洲仅韩国出局

侃球熊弟 浏览 4628

“私募一哥”A股清零,大恒科技再临十字路口

每日资本论 浏览 4839

深圳1900亿央企换将,去年人均薪酬超51万

华美财经 浏览 3963

聚焦第五届上海知识产权创新奖——中国科学院上海微系统与信息技术研究所成果转化处

上观新闻 浏览 4482

考古中秋“顶流”的出道史

时尚COSMO 浏览 6595

解码科创成长层药企2025年成绩单

北京商报 浏览 1383

《不眠日》大结局!墨远致是乌贼

丹妮观 浏览 5236

抖音:近一年优质内容播放时长为普通内容的17倍

封面新闻 浏览 5188

特朗普宣布:美伊协议取得重大进展,暂停“自由计划”!美方:搭载美军的商船遭袭!伊朗:与美国处于战争状态,霍尔木兹海峡已关闭

每日经济新闻 浏览 1310

曾炒到1600元/粒的"中药茅"大跌价 公司市值蒸发1800亿

每日经济新闻 浏览 10214

凌晨3点皇马出战!赢球=8连杀+反超巴萨登顶 姆巴佩冲60球

叶青足球世界 浏览 4526

smart精灵#3艺术特别版上市售18.49万

网易汽车 浏览 3402

韩国很急:在跟中方沟通了 希望最大限度降低韩企损失

澎湃新闻 浏览 8286

开撕了!亲爹是首富,嫡长公主租房住?

Yuki女人故事 浏览 6783

德国央行行长:与中企的竞争 该让所有欧企彻底醒醒了

澎湃新闻 浏览 4599

AMD显卡德国卖爆了!RX 9070 XT一款销量超RTX 50全系

快科技 浏览 4030

腾势汽车12月销售18139辆 全年累计157134辆

网易汽车 浏览 3581
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1