关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻4778人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

除了阔腿裤,这条裤子今年最流行!

LinkFashion 浏览 2540

皇社球员阿兰布鲁:要把绝杀进球献给经历艰难时刻的委内瑞拉

懂球帝 浏览 3617

真爱大牌 || 这些被抢空的好物又回来了,这次破价100+

黎贝卡的异想世界 浏览 4021

黄慧颐手撕保剑锋 曾黎意外卷入风波

第一娱记 浏览 3527

贺峻霖发文:“但凡有人尊重一下我呢”

韩小娱 浏览 1320

百万人围观,「上下文图谱」火了,万亿美元新机遇?

机器之心Pro 浏览 3672

伊朗计划彻底封锁霍尔木兹海峡 特朗普回应

财联社 浏览 67256

精致詹詹,美媒晒出詹姆斯更衣室座位边摆满护肤品的照片

懂球帝 浏览 4141

吉文:可能我有点老派,看不惯加纳乔走路歪着身子还挂条链子

懂球帝 浏览 4061

讲解员回忆杨振宁95岁来访两弹城:他说这个时代特别需要“两弹一星”精神

封面新闻 浏览 4585

健康活到100岁,科学能做些什么?@U35张汉林试图寻找衰老背后的“隐藏逻辑”

上观新闻 浏览 3654

宝马5系车主揪出汽修店一个"意外疏忽":我气得吐血

1818黄金眼 浏览 7282

特朗普邀请普京加入和平委员会 欧洲官员:实属荒唐

澎湃新闻 浏览 13014

为什么说本田这个“内燃机之王”,在国内被严重低估了

少数派报告Report 浏览 3922

2026款小米SU7即将上市!最高纯电续航902Km

小史谈车 浏览 2575

国防部:中国不参与任何形式的军备竞赛

环球网资讯 浏览 4962

美国喊停"毒计":会就相关问题跟中国谈判

澎湃新闻 浏览 9871

本田全新缩小版“CR-V”上市!限时售价10.99万起,搭载1.5T+CVT

小史谈车 浏览 3539

上海男子出门频频裸露臀部太辣眼睛 女邻居崩溃了

看看新闻Knews 浏览 35828

地区战争风险加剧 哥伦比亚总统重批美国“侵略拉美”

环球网资讯 浏览 4711

比速腾L略小 入门级的全新速腾S将发布

网易汽车 浏览 3540
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1