DeepSeek-R1 发布,性能对标 OpenAI o1 正式版

2025年1月20日,杭州深度求索人工智能基础技术研究有限公司正式发布了 DeepSeek-R1 模型,并同步开源了模型权重。此次发布标志着该公司在人工智能领域迈出了重要一步,旨在推动技术社区的交流与创新协作。

DeepSeek-R1 遵循 MIT License,允许用户通过蒸馏技术借助 R1 训练其他模型。同时,DeepSeek-R1 的 API 已上线,对用户开放思维链输出,用户可以通过设置 model='deepseek-reasoner' 来调用该模型。此外,DeepSeek 官网与 App 也于即日起同步更新上线。

性能对齐 OpenAI o1 正式版

DeepSeek-R1 在后训练阶段大规模应用了强化学习技术,即便在仅有极少标注数据的情况下,也极大地提升了模型的推理能力。在数学、代码、自然语言推理等任务上,DeepSeek-R1 的性能已与 OpenAI o1 正式版相当。相关技术细节已在论文中公开,论文链接为:DeepSeek_R1.pdf。

蒸馏小模型超越 OpenAI o1-mini

在开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时,该公司还通过 DeepSeek-R1 的输出蒸馏了 6 个小模型,并将其开源给社区。其中,32B 和 70B 模型在多项能力上实现了与 OpenAI o1-mini 的对标效果。相关模型可在 HuggingFace 查看,链接为:HuggingFace - DeepSeek-AI。

开放的许可证和用户协议

为了推动开源社区和行业生态的发展,DeepSeek 在协议授权层面进行了如下调整:

模型开源 License 统一使用 MIT:此前,该公司曾引入 DeepSeek License 为开源社区提供授权,但实践表明,非标准的开源 License 可能增加开发者的理解成本。因此,此次开源仓库(包括模型权重)统一采用标准化、宽松的 MIT License,完全开源,不限制商用,无需申请。

产品协议明确支持“模型蒸馏”:为了进一步促进技术的开源和共享,DeepSeek 更新了线上产品的用户协议,明确允许用户利用模型输出通过模型蒸馏等方式训练其他模型。

App 与网页端体验

用户可以通过登录 DeepSeek 官网或官方 App,打开“深度思考”模式,调用最新版 DeepSeek-R1 完成各类推理任务。详细的 API 调用指南可在官方文档中查阅。

API 及定价

DeepSeek-R1 API 服务的定价为:每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元。该定价策略旨在为用户提供高效、经济的推理服务,同时推动模型的广泛应用。