讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

首页 > 新闻 > IT新闻 > 正文

DeepSeek 团队发布最新开源模型 DeepSeek-OCR

聖光之護

发布： 2025-10-20 18:25:01

原创

427人浏览过

deepseek-ai 团队近日发布了题为《deepseek-ocr：contexts optical compression》的研究论文，提出一种通过视觉模态实现长文本上下文压缩的创新方法。根据 hugging face 页面信息，该模型参数规模为 3b。

开源地址：https://www.php.cn/link/32ce0ec3ee6f3951004c8ebb7511ffc1https://www.php.cn/link/b3f1ba764509b453d6cc48e0969e5cb7

据官方介绍，此次发布的 DeepSeek-OCR 包含两个核心组件：专用编码器 DeepEncoder 和解码器 DeepSeek3B-MoE-A570M。其中，DeepEncoder 针对高分辨率输入进行了优化设计，在确保低计算激活的同时实现高效压缩，有效将视觉 token 数量控制在合理范围内。

实验结果表明，当文本 token 数量不超过视觉 token 的 10 倍（即压缩比低于 10×）时，模型 OCR 准确率可达 97%；即使压缩比提升至 20×，准确率仍能维持在约 60% 的水平，展现出其在历史文档处理、长上下文压缩以及大语言模型记忆机制探索方面的广阔应用前景。同时，DeepSeek-OCR 具备出色的实用价值。

DeepSeek 团队发布最新开源模型 DeepSeek-OCR

在 OmniDocBench 基准测试中，DeepSeek-OCR 仅用 100 个视觉 token 就超越了 GOT-OCR2.0（每页使用 256 个 token），而当视觉 token 不足 800 时，性能已优于 MinerU2.0（平均每页消耗超过 6000 个 token）。

Tellers AI

Tellers AI

Tellers是一款自动视频编辑工具，可以将文本、文章或故事转换为视频。

Tellers AI

136

Tellers AI

在实际部署场景中，DeepSeek-OCR 可在单张 A100-40G 显卡上每日生成逾 20 万页高质量训练数据，适用于大规模视觉语言模型或大语言模型的训练需求。

源码地址：点击下载

以上就是DeepSeek 团队发布最新开源模型 DeepSeek-OCR的详细内容，更多请关注php中文网其它相关文章！

相关标签：

git go github 编码显卡 ai deepseek Token github ocr https 文档处理

大家都在看：

用数据照亮成长之路：PandaCoder Git 统计工具窗口 Git 3.0 有望在 2026 年发布，默认启用更安全的 SHA-256 哈希算法 JetBrains 宣布 DataGrip 面向非商业用途免费 Linus 对 Git 提交信息中“Link:”标签被滥用表达不满开源 IDE 项目 Zed 完成 3200 万美元 B 轮融资

AI工具

AI工具

AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型，支持联网搜索。

来源：php中文网

上一篇：Doris Summit 2025 报名启动！议程全面公开，11 月 5-6 日敬请关注下一篇：遭勒索软件攻击，日本知名线上零售企业暂停接单

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

《天国：拯救2》主笔大胆预测：AI革命或意味着“人类的终结”

2025-12-18 12:36:13
《战地6》稳居25年美国游戏销量榜首！畅销榜公布

2025-12-18 12:39:12
扫地机器人鼻祖 iRobot 宣布破产，将由中国代工厂接手

2025-12-18 12:43:02
Torna 1.35.0 发布，接口文档解决方案

2025-12-18 12:48:02
《艾尔登法环：黑夜君临》新强化BOSS实装高难度安宁者

2025-12-18 12:50:12
小米17 Ultra下周登场！卢伟冰：小米正代高端旗舰全部当年发布

2025-12-18 12:51:07
荣耀Magic8 Mini加速来袭，小屏旗舰赛道迎新玩家

2025-12-18 13:25:02
山海进化录神山十五打法攻略分享

2025-12-18 13:34:02
新三国志曹操传阵营科技系统玩法

2025-12-18 13:36:08
Visual Studio Code 1.107 发布

2025-12-18 13:45:12

最新问题

悄然颳起沙漠风暴资料中心如何解渴AI时代用水危机随着人工智能技术应用的迅猛发展，全球正迎来新一轮数据中心建设热潮，其中以美国尤为突出。据市场统计，截至今年，全球已投入运行的数据中心数量达6,111座；而展望2030年前，还将有逾2,000座新数据中心陆续启用。外界普遍聚焦于其对电网负荷带来的巨大压力，却往往忽视了另一项更为紧迫且日益紧缺的战略资源——淡水。研究机构VeriskMaplecroft指出，一座中型数据中心平均每日需消耗约140万升淡水，主要用于服务器散热降温；而随着全球气温持续攀升，此类用水需求势必进一步加剧。NatureFina

2025-12-19 10:01:55

988

火山引擎总裁谭待：大模型市场未来将迎十倍增长今日，火山引擎在FORCE原动力大会期间正式宣布：截至今年12月，豆包大模型的日均Tokens调用量已突破50万亿，稳居中国首位、全球第三。截至目前，已有超100家企业依托火山引擎平台，累计Tokens使用量迈过一万亿大关。在被问及豆包大模型本年度整体表现时，火山引擎总裁谭待回应称，整体成果值得肯定，尤其在国内市场优势显著；但放眼全球，OpenAI与Gemini等头部模型同样实力强劲，因此我们仍需持续加码投入。值得指出的是，火山引擎自研的Seedance与Seedream

2025-12-18 20:28:02

642

蚂蚁开源 AEnvironment，面向 Agentic RL 的统一环境平台蚂蚁集团百灵大模型团队正式开源AEnvironment——一个专为AgenticRL时代打造的统一环境平台，秉持“万物皆可为环境（EverythingasEnvironment）”的核心理念。该平台基于标准化MCP协议进行深度扩展，面向环境提供商、算法研究人员及Agent开发者，提供即开即用的底层基础设施，大幅降低环境构建门槛，助力各方聚焦于Agent核心能力的研发与优化。AEnvironment核心特性包括：超强规模承载能力：已验证支持万亿参数级大模型训练，可在超长上下文场景下高效执行Agen

2025-12-18 20:26:02

226

智能知识管理系统 SKC V0.1.5 发布（支持推荐阅读） SKC智能知识库：致力于打造高性能的知识管理与智能检索平台，深度融合人工智能技术，显著提升信息组织、理解与获取效率，广泛适配教育机构、科研单位及各类企业场景。依托大语言模型与结构化知识管理体系的协同演进，为用户提供从知识生成到精准检索的一站式智能服务。V0.1.5新增“智能推荐阅读”功能重构首页界面布局，支持用户自主配置外部应用入口，实现个性化应用集成。上线“推荐阅读”模块，可在首页指定区域展示带跳转链接的图文组合内容。新增“最新知识”快捷入口区，便于用户即时触达最新入库内容。新增“常用知识”快

2025-12-18 20:15:07

998

字节跳动正式发布豆包大模型1.8 在今日举办的火山引擎Force原动力大会上，字节跳动正式推出全新升级的豆包大模型1.8版本。多项权威评测结果表明，该模型在多模态理解与生成、智能体（Agent）能力等关键维度上，已跻身行业第一梯队。据悉，豆包大模型1.8（Doubao-Seed-1.8）专为多模态智能体应用场景深度优化。其工具调用精准度、复杂指令解析与执行能力，以及操作系统级Agent（OSAgent）功能均实现显著跃升，极大强化了模型在高阶任务中的自主规划与协同执行能力。在多项主流公开基准测试中，豆包1.8于视觉推理、通用视觉

2025-12-18 20:12:08

1017

商汤旗下大晓机器人发布 ACE 具身研发范式、开悟世界模型 3.0 等商汤科技旗下大晓机器人正式推出ACE具身智能研发范式、业界首个开源并已实现商业落地的开悟世界模型3.0（Kairos3.0），以及具身超级大脑模组A1。据官方介绍，ACE具身研发范式坚持“以人为中心（Human-centric）”理念，其核心——环境式数据采集能力，可在一年内完成千万小时级真实交互数据积累；而开悟世界模型3.0则持续释放真实数据潜能，等效支撑上亿小时规模的数据训练效果。以环境式数据采集为驱动引擎，ACE构建起覆盖“环境式数据采集—开悟世界模型3.0—具身交互”的端到端技术闭环。

2025-12-18 19:27:07

912

Adobe 被诉用盗版书籍训练 AI 模型，SlimLM 陷版权风波俄勒冈州作家伊丽莎白·莱昂（ElizabethLyon）已对Adobe公司发起集体诉讼，指控其在训练名为SlimLM的轻量级语言模型过程中，非法使用了含有其受版权保护作品的盗版数据集。SlimLM是Adobe推出的一套面向移动端文档处理场景（包括文本摘要、内容重写与智能问答等）优化的小型语言模型。据Adobe官方披露，该模型基于SlimPajama-627B数据集完成预训练——该语料库由AI芯片企业Cerebras于2023年6月开源发布，标榜为“去重、多源整合、公开可用”的训练资源。

2025-12-18 19:23:02

661

Meta：不限制员工使用 Gemini 和 GPT 等三方 AI 模型据BusinessInsider报道，Meta正在放宽内部限制，扩大员工对Google、OpenAI等竞品AI工具的使用权限。内部文件及公司内部通讯显示，Meta正大力推动将人工智能工具深度融入日常工作的各个环节，并全面推行“AI优先”战略。目前，Meta员工已被授权接入并使用包括Google的Gemini3Pro、OpenAI的GPT-5在内的多个第三方大模型，以提升工作效率。与此同时，Meta已将其核心办公套件迁移至GoogleWorkspace，旨在“释放

2025-12-18 18:50:04

177

腾讯回应 “元宝” 身份质疑：一个完全由 AI 生成内容的助手腾讯旗下AI助手“元宝”近日引发用户广泛讨论，不少人在互动中反复追问：“你到底是AI还是人？”对此，腾讯官方正式回应，明确指出元宝是一款完全基于人工智能技术构建的助手，所有内容均由模型自主生成，全程无人工干预或后台润色。根据官方说明，元宝被定位为具备高感知力与高情商的智能体，不仅能高效理解语义，还能兼顾语气、分寸与情感表达，从而实现自然流畅的对话体验。正因回复质量接近甚至超越部分真人水平，反而触发了用户的“真实性怀疑”——有人调侃式发问：“元宝你回尿床吗？”元宝仅以一个“？”作答；也有人试探性别

2025-12-18 18:49:14

171

OpenAI 开放 ChatGPT 第三方应用提交通道 OpenAI正式启用第三方应用入驻ChatGPT的提交通道，面向全球开发者开放。经平台审核通过后，基于OpenAI模型开发的工具可直接集成至ChatGPT，无需用户手动下载或安装。该机制融合自动化检测与人工复核流程，审核达标的应用将原生嵌入ChatGPT界面，实现“即点即用”。当前重点招募方向涵盖生产力增强类、学术研究支持类、创意生成辅助类及垂直行业智能体等应用场景，致力于构建以自然语言对话为交互核心的AI应用生态体系。在ChatGPT的“应用（BETA）”专区中，OpenAI已

2025-12-18 18:49:02

743

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

Git 教程

20223次学习
收藏
Git版本控制工具

14834次学习
收藏
Git中文开发手册

0次学习
收藏

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部