文章深入探讨了 DeepSeek V3.2 模型在 Agentic 能力上实现 40%显著提升的关键技术——“交错思维链”(Interleaved Thinking)。该技术旨在解决大模型在复杂多轮交互中出现的“状态漂移”问题,即模型在执行长链路任务时遗忘早期指令或规划。文章指出,传统的 ReAct 范式存在“隐式推理”的诅咒,模型在工具调用后难以保持思维的连续性。“交错思维链”通过让模型在推理和工具调用之间交替进行,并显式记录和复用每一轮的思考状态,如同为 Agent 安装了“海马体”,从而实现稳定、可累积的长程规划。MiniMax M2 模型的数据显示,该机制在低扰动环境(如 SWE-Bench)中带来温和提升,但在高扰动环境(如 BrowseComp 和 Tau²)中,性能提升高达 40%和 36%,表明其在对抗环境扰动方面的强大能力。文章进一步阐述,Agent 的真正泛化能力并非简单地增加工具数量,而是适应任务轨迹中各种扰动的能力。“交错思维链”通过自我修正机制,使模型能更好地适应不同环境和工具返回格式。MiniMax 作为该技术的推动者,积极改造开源基础设施,促使“交错思维链”的 API 协议从私有扩展走向事实标准。DeepSeek V3.2 和 Kimi K2 Thinking 的加入,进一步验证了“显式的、交错的、持久化的思考”已成为 AI 智能体进化的行业共识。

