本文深入探讨了 AI 智能体在执行耗时数小时甚至数天的“长跑”复杂任务时,因上下文窗口限制和会话间“失忆”而面临的挑战。为了解决这一核心难题,Anthropic 开发了一套双重解决方案,使 Claude Agent SDK 能够跨越多个上下文窗口高效工作。该方案包括一个“初始化智能体”负责搭建初始环境,以及一个“编程智能体”负责在后续会话中取得增量进展并留下清晰的交接文档。文章详细介绍了环境管理的几个关键组件,包括功能列表、循序渐进的开发模式、以及通过浏览器自动化工具进行的端到端测试。这些实践借鉴了人类软件工程师的工作习惯,如利用 Git 历史和进度文件快速了解工作状态,并确保每个会话结束后环境处于“干净状态”。文章最后总结了智能体常见的失败模式及其解决方案,并展望了未来多智能体架构和跨领域推广的可能性。整体方案旨在提升 AI 智能体在复杂、长时间任务中的鲁棒性和效率。
