DeepSeek-R1 发布,性能对标 OpenAI o1 正式版
DeepSeek 正式发布了 DeepSeek-R1 模型,该模型在数学、代码、自然语言推理等任务上性能对标 OpenAI o1 正式版。DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,极大提升了模型推理能力。DeepSeek 不仅开源了模型权重,还提供了 API 服务,允许用户通过设置 model='deepseek-reasoner'
调用思维链输出。此外,DeepSeek 还通过蒸馏技术训练了多个小模型,其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。为了推动开源社区和行业生态的发展,DeepSeek 统一使用 MIT License,并明确允许用户进行模型蒸馏。DeepSeek-R1 的 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元。