关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻964人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

存储芯片需求强劲,佰维存储业绩有望迎来“戴维斯双击”

览富财经网 浏览 10941

新款现代Creta预告图发布,将于1月16日印度上市

天天汽车 浏览 12574

鸿蒙版微信一周年:从“能用”到“好用” 超2000万下载量背后的进化史

快科技 浏览 1007

俄罗斯驻罗马尼亚使馆部分人员应罗方要求离境

央视新闻客户端 浏览 15496

瘦百斤后的贾玲算不算大美女,看看她和张小斐谢楠的合照就知道了

不八卦会死星人 浏览 12619

拼多多跨境电商业务将正式登陆澳洲

网易科技报道 浏览 19709

大众在欧洲开启ID.7电动轿车预售:6.2万美元起,国产版下月开售

IT之家 浏览 13950

马斯克与美国证交会达成协议 将向投资者赔偿4000万美元

财联社 浏览 14431

苏超,明年有新变化!省政府再做部署!

国是直通车 浏览 910

俄反对派人士之死引发轩然大波 英法德元首纷纷发声

环球网资讯 浏览 82426

韩乔生谈梅西:接下来就等着梅老七变梅老八,金球奖实至名归

直播吧 浏览 15483

太阳能电池、锂电池成为2023年青海外贸“新两样”

北青网-北京青年报 浏览 12266

美军花3亿多美元造的加沙码头被冲毁了

观察者网 浏览 11078

赵本山女儿力挺辛巴,是真性情还是情商低

趣看热点 浏览 26428

美计划采购千架无人机遏华,结果出问题

浏览 10745

千亿公司浙商大佬病逝 80后"少东家"面临股票停牌

每日经济新闻 浏览 114509

小白鞋下岗了 这双鞋才是今夏最洋气穿搭!

In风尚 浏览 16954

李雪琴买咖啡被认成杨幂杨幂对李雪琴说杨幂你好

趣看热点 浏览 26717

贾乃亮晒照庆39岁生日,对镜摆剪刀手阳光帅气

深剖娱乐圈 浏览 19595

胡塞武装官员回应遭美英空袭:会惩罚他们

环球网 浏览 12362

香港起火楼栋外围使用竹脚手架引关注 被指便宜易运输

上游新闻 浏览 28100
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1