跳转到主要内容
精选推送

BestBlogs.dev 第 81 期:长周期智能体

大家好!欢迎阅读 BestBlogs.dev 第 81 期 AI 精选文章推荐。

本周的关键词是 长周期智能体 。当我们谈论 AI 智能体时,演示里几分钟完成的任务总是很惊艳,但真正进入生产环境,需要的是能跨越数小时甚至数天、可靠完成复杂任务的能力。Cursor 和 Anthropic 分别给出了多智能体协作和记忆连续性两条路径。最近两周基础模型层面相对平静,行业的注意力正从「更大的模型」转向「更可靠的智能体」。

以下是本周最值得关注的 10 个精彩亮点:

🤖 Cursor 用「规划者-工作者-裁判」的多智能体架构实现了百万行代码的跨周开发,Anthropic 则通过外化 Git 历史和工作日志让单个智能体在多个上下文窗口间保持记忆连续性。两条路径,同一个目标:让 Agent 可靠地完成长周期任务

📁 LangChain 创始人 Harrison Chase 在 Sequoia 的访谈中提出了一个关键洞察:当 Agent 运行时间足够长,系统的非确定性让传统的「代码即真理」失效 ,链路追踪成为了新的事实来源,上下文工程正在从可选变为必选。

📝 想让 Agent 执行复杂任务?先学会写 Spec。Addy 的博客提出了「始终/询问/从不」的三层约束系统,以及将复杂任务模块化以避免「指令诅咒」的实用技巧。规约说明正在成为 AI 时代的核心交付物。

🧩 MCP 像 USB 协议提供统一接口,Skills 像应用程序提供具体能力。宝玉老师指出了 MCP 的一个隐患:单个服务可能消耗数万 Tokens,上下文窗口爆炸问题让 Skills 的渐进式披露方案更具吸引力。

💡 Martin Fowler 与团队的这场对话值得反复阅读。核心观点:编程的挑战不是把需求翻译成语法,而是构建能应对变化的系统 。LLM 应该被视为翻译层而非架构师,真正的竞争力在于通过抽象管理复杂性。

🛠️ 从 Vibe Coding 的直觉驱动到 Vibe Engineering 的规范约束,这是范式演进的必经之路。AI 压缩了技术实现的偶然复杂性,但业务逻辑的本质复杂性仍需通过领域建模和规约驱动开发来治理。

🖥️ MiniMax Agent Desktop 展示了桌面 Agent 的实战能力:自动整理 400 本电子书、封装文学翻译 SOP、构建小红书内容流水线。核心价值在于将个人经验转化为可复用的数字资产。

⚡ 扣子 2.0 的 Agent Plan 功能让智能体可以自主执行长周期任务并主动反馈进度。从工具到伙伴的身份转变,是 Agent 产品进化的共同方向。

🎯 妙鸭创始人张月光的观点很犀利:妙鸭并非真正的 AI Native 产品,只是 AI 增强的互联网产品。他认为 AI 时代的范式已从「流程驱动」转变为「上下文驱动」 ,产品经理的职责正从设计确定性路径转向优化不确定性的交互边界。

📈 a16z 将 AI 视为继 PC、云计算和移动互联网之后的第四次平台浪潮。在 AI 降低开发门槛的今天,持久的护城河已从代码实现转向对完整工作流的占领和闭环数据的积累。现在确实是构建 AI 应用的黄金时代。

希望本期的推荐能为您带来新的启发。保持好奇,我们下周见!

Elevate
addyo.substack.com
01-19
7093 字 · 约 29 分钟
93
如何为 AI 智能体编写高质量的规格说明书 (Spec)

本文为开发者提供了一套为 AI 编程助手编写高质量规格说明(Specs)的实战框架。核心原则包括:从高层愿景出发并让 AI 细化方案、采用结构化的 PRD 模式(涵盖命令、测试、代码风格及边界)、将复杂任务模块化以避免「指令诅咒」,以及建立「始终/询问/从不」的三层约束系统。文章不仅介绍了如何利用 MCP 和计划模式提升协作可靠性,还强调了规格说明作为「活文档」在迭代中的核心地位。对于希望在复杂项目场景中提升 AI 产出质量的工程师来说,这是一份极具参考价值的指南。

Sequoia Capital
youtube.com
01-21
8008 字 · 约 33 分钟
93
迈向长程 AI 的上下文工程:LangChain 创始人 Harrison Chase 访谈录

在本期访谈中,LangChain 联合创始人 Harrison Chase 深入探讨了 AI 智能体从简单的脚手架向复杂治理架构演进的范式转移。他提出了一个核心论点:在构建长周期智能体时,由于系统的非确定性,传统的「代码即真理」已不再适用,取而代之的是「链路追踪」成为了事实来源。文章详细解析了上下文工程、文件系统的重要性以及初稿型应用场景的爆发。

宝玉的分享
baoyu.io
01-21
4657 字 · 约 19 分钟
92
MCP 和 Skills 到底什么区别?一篇文章说清楚

这篇文章深入探讨了 AI Agent 领域两个核心概念:MCP 与 Skills。作者将 MCP 比作统一接口的 USB 协议,而将 Skills 比作具体的应用程序或操作手册。文章重点分析了 MCP 在处理复杂工具集成时导致的上下文窗口爆炸问题(单个服务可能消耗数万 Tokens),并对比了 Skills 如何通过渐进式披露和本地脚本执行来极大地优化成本与准确性。

阿里云开发者
mp.weixin.qq.com
01-22
2459 字 · 约 10 分钟
92
别再手写提示词!需求澄清 + 50 多专业提示词框架自动匹配,效率提升 10 倍!

这篇文章深入探讨了如何利用 Claude Skills 和 AI Coding 工具构建一个专业的提示词优化专家。针对用户在撰写 Prompt 时表达不清、缺乏框架等痛点,作者提出了基于 50 多个顶尖框架的自动化优化方案,并详细展示了从 Skill 规范编写到 Chrome 插件 生成的完整实战流程。文章核心观点在于:在 AI 时代,执行的成本已大幅降低,思考与任务拆解能力正成为核心竞争力。

腾讯云开发者
mp.weixin.qq.com
01-21
13559 字 · 约 55 分钟
93
反思软件工程,超越 Vibe Coding

本文深度剖析了软件开发从人写代码向意图驱动的范式转移。作者系统性地梳理了从 Vibe Coding 的直觉驱动到 Vibe Engineering 的规范约束这一演进路径。文章结合经典的本质复杂性与偶然复杂性理论,指出 AI 虽极大地压缩了技术实现的偶然复杂性,但业务逻辑的本质复杂性仍需通过领域建模和规约驱动开发来治理。

Founder Park
mp.weixin.qq.com
01-20
5746 字 · 约 23 分钟
92
怎么做 Long-running Agents,Cursor、Anthropic 给了两种截然不同的思路

本文深入对比了 Cursor 与 Anthropic 在构建长程运行 Agent 上的工程实践。Cursor 采用多 Agent 并行协作模式,通过{规划者-工作者-裁判}的层级结构,成功实现了百万行代码的跨周开发;而 Anthropic 则侧重于解决单个 Agent 的记忆连续性,通过外化 Git 历史和工作日志,让 Agent 在跨越多个上下文窗口时仍能精准推进任务。文章不仅揭示了两家公司的技术细节,还总结了 Agent 在复杂任务中常见的失败模式,是了解 AI 编程工具未来走向的必读干货。

Martin Fowler
martinfowler.com
01-21
3235 字 · 约 13 分钟
94

这篇对话记录了 Unmesh、Martin Fowler 和 Rebecca Parsons 对编程本质的深刻反思。文章指出,编程的核心挑战并非将需求翻译为语法,而是构建能够应对变化的系统。通过管理认知负荷、将「做什么」(意图)与「怎么做」(实现)视为持续的反馈环,以及运用 TDD 作为设计策略,开发者可以构建出稳定的领域模型。文章重点讨论了 LLM 在这一过程中的角色,认为它应被视作「翻译层」而非架构师。对于希望在 AI 浪潮中保持核心竞争力的开发者来说,理解如何通过抽象来管理复杂性至关重要。

Founder Park
mp.weixin.qq.com
01-21
4822 字 · 约 20 分钟
93
MiniMax Agent 开年更新,好的 AI 产品,需要让工具来适应人了

本文深入探讨了 2026 年初席卷技术圈的桌面 Agent 趋势,重点测评了 MiniMax Agent Desktop。作者通过三个实战案例——自动化整理 400 本电子书、封装文学翻译 SOP 以及构建小红书内容流水线,展示了 AI 如何通过接入本地上下文实现从咨询到执行的飞跃。文章指出,Expert Agents 的核心价值在于将个人经验转化为可复用的数字资产。

字节跳动技术团队
mp.weixin.qq.com
01-19
2682 字 · 约 11 分钟
92
扣子 2.0,让 Agent 更进一步

本文详细介绍了字节跳动旗下 AI 平台「扣子」2.0 的全面升级。Coze 2.0 实现了从工具向伙伴的身份转变,核心亮点包括:Agent Skills 将行业最佳实践工具化;Agent Plan 允许智能体自主执行长周期任务并主动反馈;扣子编程 则通过 Vibe Coding 降低了应用开发门槛。此外,平台在视频创作与深度职场洞察方面也展现了更强的实用性。

十字路口Crossing
xiaoyuzhoufm.com
01-18
2684 字 · 约 11 分钟
92
偏执、野心,与一副 AI 眼镜:顶级产品经理的底层燃料|对谈理想 SVP 范皓宇

理想汽车高级副总裁范皓宇深入分享了理想首款 AI 硬件 Livis 眼镜背后的逻辑。不同于主流的 AR 方案,Livis 选择了极度克制的硬件路径:36g 超轻重量、无屏幕设计、自研 RTOS 与低功耗 MCU 架构,旨在打造一个高可用的全天候伙伴。范皓宇还分享了「两手沾泥」的产品方法论及 6211 时间分配法,探讨了理想如何从汽车这一岛屿向 AI 终端的大陆扩张。

Smashing Magazine
smashingmagazine.com
01-22
3913 字 · 约 16 分钟
92
超越生成式:AI 智能体的兴起与以用户为中心的设计

随着 AI 从生成式向智能体演进,UX 设计正面临从可用性到信任与问责的范式转移。本文深入探讨了 AI Agent 的核心特质——自主推理与规划,并提出了一套包含四个自治层级的分类法:观察建议、计划提议、确认执行及完全自主。作者为开发者和产品经理提供了一份实用的研究指南,涵盖心理模型访谈、路径映射及模拟故障测试等方法。通过建立干预率和回滚率等量化指标,本文为构建可控、透明且具备职业道德的 AI 系统提供了清晰的路线图,非常适合正在探索 AI 自动化边界的技术决策者阅读。

130. 张月光创业两年首次访谈:妙鸭不是 AI Native 产品、流程到上下文设计、One Way Door 和乙女游戏

本期播客深度访谈了妙鸭相机创始人张月光。他复盘了从字节、阿里大厂离职后的创业心路,并提出了一个振聋发聩的观点:妙鸭并非真正的 AI Native 产品,而只是 AI 增强的互联网产品。他指出,AI 时代的范式已从流程驱动转变为上下文驱动”,产品经理的职责正从设计确定性路径转向优化不确定性的交互边界。访谈还涵盖了「单向门」产品哲学,以及他在 AI 乙女游戏与 Agent 工具上的实践。

a16z
youtube.com
01-19
7250 字 · 约 29 分钟
92
为什么现在是构建 AI 应用的黄金时代

本文深入探讨了 a16z AI Apps 团队对当前 AI 应用周期的核心洞察。文章将 AI 视为继 PC、云计算和移动互联网之后的第四次重大平台浪潮,并详细拆解了三个关键投资主题:传统软件的 AI 原生化、软件替代劳动力,以及基于专有数据的「围墙花园」。通过 Eve(法律)和 Salient(债务催收)等深度案例,作者强调在 AI 降低开发门槛的今天,持久的护城河已从单纯的代码实现转向对完整工作流的占领和闭环数据的积累。

Lenny's Podcast
youtube.com
01-18
7323 字 · 约 30 分钟
92
Meta 产品经理 Zevi Arnovitz:如何在不编写代码的情况下交付产品

非技术背景如何独立发布产品?Meta 产品经理 Zevi Arnovitz 演示了基于 Cursor 和 Claude Code 的高效工作流。通过定义斜杠命令实现从任务规划到代码执行的自动化,并利用多模型互审攻克了非技术人员无法 Code Review 的难题。这是一份面向产品经理的 AI 时代实战手册,强调「头衔正在崩塌,每个人都将成为构建者」。

All-In Podcast
youtube.com
01-21
8750 字 · 约 35 分钟
92
萨提亚·纳德拉谈 AI 商业革命:SaaS、OpenAI 和微软的未来将如何?

微软 CEO Satya Nadella 在本期 All-In 播客中,深入探讨了 AI 如何重塑微软的经营逻辑与全球商业版图。他提出了「宏观授权,微观操控」的新管理范式,并揭秘了微软如何在员工数持平的情况下实现营收翻倍。对话涵盖了 AI Agent 的演进路径、与 OpenAI 合作的底层逻辑,以及美国科技栈在全球市场的扩散战略。

    BestBlogs.dev 第 81 期:长周期智能体 | BestBlogs.dev