文章

DeepSeek-V3.2-Exp 发布,训练推理提效,API 同步降价
DeepSeek
09-29
955 字 (约 4 分钟)
AI 评分: 93
⭐⭐⭐⭐⭐

深度求索正式发布实验性模型 DeepSeek-V3.2-Exp,其核心创新是引入了 DeepSeek Sparse Attention(DSA)稀疏注意力机制。该机制在不显著影响模型输出效果的前提下,大幅提升了长文本场景下的训练和推理效率。文章指出,V3.2-Exp 在公开评测集上的表现与前一代 V3.1-Terminus 基本持平。为推动技术普惠和社区发展,DeepSeek 同步大幅下调 API 价格超过 50%,同时开源了 V3.2-Exp 模型、相关研究论文以及创新的 TileLang 与 CUDA GPU 算子。官方鼓励广大用户对新模型进行对比测试并提供反馈,以进一步验证其在真实应用场景中的表现。

人工智能中文大语言模型稀疏注意力模型优化长文本处理API降价
没有更多文章了