opendatalab 联合钉钉基于 mineru 推出了一款专为企事业单位打造的文档智能解析工具——dlu(document language understanding)。

MinerU 是由上海人工智能实验室(上海 AI 实验室)OpenDataLab 发布的高效文档解析引擎,凭借其出色的解析精度和广泛的格式支持,广受开发者欢迎,已在 GitHub 上收获超过 4 万星标。

DLU 在 MinerU 的核心技术基础上构建,即将面向全球开源。该工具具备强大的文件格式兼容能力,深入的内容语义理解能力,以及高精度的结构化数据输出功能。不仅全面支持常见的 Office 文档、PDF、Markdown 和各类代码文件,还特别适配钉钉生态中的文档、表格及 AI 表格等专有格式;同时可提取纯文本内容,并精准识别图表、数学公式、插图以及化学分子式等专业领域复杂元素,将其转化为适用于大模型训练的高质量结构化语料。
源码地址:点击下载
以上就是OpenDataLab 与钉钉联手推出面向企业用户的文档解析工具 DLU的详细内容,更多请关注php中文网其它相关文章!
 
                        
                        每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
 
                Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号