关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻4777人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

张柏芝自曝被大儿子管很凶,教子有方连谢霆锋妈妈都称赞

扒虾侃娱 浏览 4484

开拓者7人上双114-95轻取篮网,阿夫迪亚18+6+5,克林根14+11

懂球帝 浏览 2577

利空突袭!凌晨,全线大跌!

券商中国 浏览 3835

900V架构打造 莲花ForMe将于3月29日上市

车质网 浏览 2647

理想MEGA车主声明: 车辆系突发自燃并非电池包破损

网易汽车 浏览 4425

共享电单车下沉战升级!松果出行递表港股,业务覆盖全国422个市县|港E声

时代周报 浏览 3652

全球研发投入2000强中国占29%:谁在玩命砸钱?钱都花哪了?

澎湃新闻 浏览 3816

省委书记、省长等18位省领导 一下火车直奔企业车间

政知新媒体 浏览 9809

擅自使用军机形象进行宣传 理想汽车回应

澎湃新闻 浏览 5165

鲁媒:瓦科留队已经没有悬念,洛佩斯离队是大概率事件

懂球帝 浏览 3581

吴倩近照曝光变化太大,脖子前伸,脸也胖一圈

翰飞观事 浏览 102

闫学晶首现身再传噩耗,这回真洗不白了

草莓解说体育 浏览 3490

丰田固态电池预计2027年上车 量产车续航或达1200公里

智车情报局 浏览 4235

6000万贱卖总部大楼,“中国催收大王”也被催收了…

深蓝财经 浏览 3856

卖房炒股后,韩国股市快翻倍了

大猫财经Pro 浏览 3450

泽连斯基:与美国的谈判并不容易

新华社 浏览 3892

巴拉圭队身价:恩西索、迭戈-戈麦斯2500万最高,全队1.571亿

懂球帝 浏览 626

库克直播间带货 苹果换了打法

北京商报 浏览 4771

风味IP爆发,快消圈拿到长期增长新船票?

斑马消费 浏览 1769

10天内5省迎新任副省长:两人是70后 两人跨省调整

国是直通车 浏览 69479

秦雯袭警风波升级!新剧开播前四天紧急撤档,上星困难唐嫣被牵连

萌神木木 浏览 4560
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1