刚刚！DeepSeek官宣V3、R1核心细节：训练架构、数据规模、性能基准全公开-手机新闻-PHP中文网

刚刚！DeepSeek官宣V3、R1核心细节：训练架构、数据规模、性能基准全公开

P粉602998670

发布： 2025-09-03 14:48:51

原创

1009人浏览过

随着网信办《人工智能生成合成内容标识办法》于今日正式生效，国内ai领域迅速做出反应。deepseek公司第一时间发布公告，宣布将严格遵守新规，对其所有ai生成的内容添加清晰的“ai生成”标识。

在公告中，DeepSeek郑重提醒用户，严禁恶意删除、篡改或隐匿相关标识，更不允许利用AI技术制作和传播虚假信息。更引人注目的是，在响应监管的同时，DeepSeek还主动发布了一份《模型原理与训练方法说明》，向公众“交底”其V3/R1大模型的核心技术路径。

DeepSeek在技术说明中，将其大模型的训练过程主要分为“预训练”和“优化训练”（即微调）两个核心阶段。

预训练阶段：这个阶段的目标是让模型通过学习海量的文本数据，掌握通用的语言理解和知识关联能力。预训练完成后，模型能够生成连贯的文本，但还无法精准地执行特定指令。

优化训练阶段：在预训练的基础上，利用特定任务的数据（如高质量问答对）对模型进行微调。通过监督微调（SFT）、强化学习（RL）等方法，教会模型如何遵循人类指令，使其回答更符合人类的偏好和价值观，并激发其在特定领域的专业能力。

文心智能体平台

百度推出的基于文心大模型的Agent智能体平台，已上架2000+AI智能体

模型的强大能力建立在高质量、大规模的数据之上。在预训练阶段，DeepSeek主要使用互联网公开信息以及经许可的第三方数据，并通过技术手段过滤不当内容和尽力移除可能偶然包含的个人信息。在优化训练阶段，数据主要由研究团队构造，其中少部分可能基于用户输入。

针对用户最关心的隐私问题，DeepSeek做出了明确承诺：如需利用用户输入构造训练数据，会进行严格的去标识化和匿名化处理，确保数据无法关联到任何特定个人，并为用户提供了选择退出的权利。

DeepSeek坦诚，当前AI技术仍处于早期阶段，存在“幻觉”（生成错误或不实信息）等固有局限性。对此，公司正通过优化数据质量、改进对齐策略等方式努力降低幻觉率，并会在产品界面添加显著提示，提醒用户AI生成内容仅供参考。

对于技术滥用可能带来的风险，DeepSeek表示高度重视。公司已建立贯穿模型研发、训练到部署全生命周期的风险管理体系，包括开展安全性评估、红队测试等，以确保技术的安全、可靠和向善。同时，公司也强调了其模型开源的承诺，希望通过社区的力量共同推动AI技术的健康发展。

以上就是刚刚！DeepSeek官宣V3、R1核心细节：训练架构、数据规模、性能基准全公开的详细内容，更多请关注php中文网其它相关文章！

大家都在看：