DeepSeek 正式发布了两款具有里程碑意义的大语言模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。DeepSeek-V3.2 旨在平衡卓越推理能力与高效输出长度,特别适用于日常问答和通用 Agent 任务,在公开推理 Benchmark 中已达到 GPT-5 水平,且相比同类模型显著降低了计算开销和用户等待时间。DeepSeek-V3.2-Speciale 则将开源模型的推理能力推向极致,通过结合 DeepSeek-Math-V2 的定理证明能力,在数学、代码与通用领域评测集上表现媲美 Gemini-3.0-Pro,并成功斩获多项国际奥赛金牌。文章重点强调了 DeepSeek-V3.2 的一项创新:首次将思考模式与工具调用深度融合,通过大规模 Agent 训练数据合成方法,大幅提升了模型在复杂任务上的泛化能力,使其在智能体评测中达到开源模型的最高水平。两款模型均已开源,并通过官方网页端、App 和 API 提供服务,V3.2-Speciale 还提供了临时 API 服务供社区评测与研究。
