DeepSeek 模型家族大揭秘：各成员关系与成长历程

在人工智能的广阔天地里，DeepSeek 模型家族宛如一颗耀眼的星辰，散发着独特的魅力。今天，就让我们一同深入探究这个神秘家族内部错综复杂的关系网，以及各成员从诞生到成长的精彩历程。

JaggerZhang21

1237人浏览 · 2025-02-14 07:00:00

JaggerZhang21 · 2025-02-14 07:00:00 发布

大家好，我是同学小张，+v: jasper_8017 一起交流，持续学习AI大模型应用实战案例，持续分享，欢迎大家点赞+关注，订阅我的大模型专栏，共同学习和进步。

在这里插入图片描述

一、家族起源：DeepSeek - V3 基础模型

DeepSeek - V3 是整个家族的根基，它在大规模语料库上进行预训练，积累了海量的知识与经验，为后续家族成员的诞生奠定了坚实的基础。这就好比一位博学多才的先辈，为后代子孙留下了宝贵的财富。

二、强化学习之路：从 V3 到 R1 - Zero

从 DeepSeek - V3 出发，通过强化学习（GRPO 算法），历经约 10K 次强化学习步骤，不依赖冷启动或监督微调（SFT），诞生了 DeepSeek - R1 - Zero。这一过程犹如一位勇士在没有地图和向导的情况下独自闯荡江湖，凭借自身的实力不断成长。DeepSeek - R1 - Zero 在 AIME 2024 上取得了 71.0% 的通过率，展现出了不俗的实力。

在这里插入图片描述

三、多元训练：从 R1 - Zero 到 R1

DeepSeek - R1 - Zero 之后，家族迎来了新的发展阶段。首先，通过收集约 1000 个精心策划的思维链（CoT）数据，为模型提供了高质量的推理示例，提升了其推理的可读性与一致性。接着，在约 800K 个样本上进行监督微调（SFT），涵盖写作、问答、编码、角色扮演等多个领域，历经 2 个周期的微调，让模型的技能得到了全方位的提升。最后，再次通过约 10K 次强化学习步骤以及偏好训练，DeepSeek - R1 诞生了。它在 AIME 2024 上取得了 79.8% 的通过率，性能优于 OpenAI - o1 - mini，成为了家族中的佼佼者。

四、传承与创新：从 R1 到蒸馏模型Qwen/Llama

为了将家族的智慧传承下去，DeepSeek - R1 通过蒸馏过程，将核心推理技能迁移到了基于 Qwen 和 Llama 的较小模型中。这些蒸馏后的模型（1.5B - 7B）虽然身材小巧，但却继承了强大的推理能力，成为了高效且实用的版本，并且开源用于研究，为人工智能的研究与发展注入了新的活力。

DeepSeek 模型家族的各成员之间，从基础模型到强化学习模型，再到经过多元训练的最终模型，以及传承核心技能的蒸馏模型，相互关联，共同构成了一个庞大而精妙的体系。它们在人工智能领域的精彩表现，不仅展现了家族的强大实力，也让我们对未来充满了无限的期待。相信在不久的将来，DeepSeek 模型家族将会继续发展壮大，为人类的科技进步贡献更多的力量。

如果觉得本文对你有帮助，麻烦点个赞和关注呗 ~~~

大家好，我是 同学小张，持续学习C++进阶、OpenGL、WebGL知识和AI大模型应用实战案例

欢迎 点赞 + 关注 👏，持续学习，持续干货输出。

+v: jasper_8017 一起交流💬，一起进步💪。

微信公众号搜【同学小张】 🙏

私信免费领取AI、C++等相关资料，持续收集更新中！ 包括但不限于：

清华大学104页《DeepSeek：从入门到精通》.pdf

DeepSeek指导手册(24页).pdf

《如何向 ChatGPT 提问以获得高质量答案：提示技巧工程完全指南》

《OpenAI：GPT 最佳实践（大白话编译解读版）》

人工智能精选电子书

天启AI社区

GitCode 天启AI是一款由 GitCode 团队打造的智能助手，基于先进的LLM（大语言模型）与多智能体 Agent 技术构建，致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话，还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力，真正做到“一句话，让 Al帮你完成复杂任务”。

更多推荐