精选推送

BestBlogs.dev 第 80 期：从对话到行动

大家好！欢迎阅读 BestBlogs.dev 第 80 期 AI 精选文章推荐。

本周的关键词是从对话到行动。

清华 AGI-Next 前沿峰会上，智谱唐杰一语道破：DeepSeek 横空出世后，Chat 这一代问题基本结束了，下一步是走向做事。杨植麟用 Agentic 智能时代概括这场范式迁移的终点，模型将从被动响应的文本生成工具，进化为主动规划、自主决策的智能代理。

这不是概念炒作。本周千问 App 接入 400 多个阿里系服务，一句话完成外卖、机票、社保全流程；Claude Cowork 把 Agent 能力带到桌面端；Cursor 和 Claude 官方同步发布 Agent 最佳实践。从基座模型到应用产品，整个行业都在回答同一个问题：AI 怎么真正帮人把事办了。

以下是本周最值得关注的 10 个精彩亮点：

🎤 清华 AGI-Next 峰会汇聚中国 AI 核心力量，堪称年度最高密度的技术对话。唐杰复盘智谱从认知智能到 Agent 的十年路径，提出 Intelligence Efficiency 将成为下一阶段竞争焦点；杨植麟首次深度分享 Kimi 技术蓝图，核心指向 Token Efficiency 与 Long Context 两大主线，并公开了 Muon 优化器和 KimiLinear 架构的关键细节；林俊旸坦言中国反超概率约 20%，但穷则思变，软硬结合或是突破口；姚顺雨远程连线，指出 toB 与 toC 正在明显分化，模型智能越高、生产力价值越大。

📊 一篇读完 200 篇论文的年度 AI 复盘，将 2025 定义为 Scaling Law 暴力美学时代的终结。技术重心已转向流体推理、长期记忆、空间智能和元学习四大领域。

🔍 Qwen 团队发布 Qwen3-VL-Embedding 与 Reranker 系列，填补开源社区在高性能多模态检索工具上的空白。双塔召回加单塔精排的两阶段流程，在 MMEB-v2 等榜单刷新开源纪录，构建多模态 RAG 系统的开发者值得关注。

🤖 千问 App 迎来史诗级更新，集成淘宝、飞猪等 400 多个阿里系服务转型全能 Agent。一句话完成外卖点单、订机票酒店、查社保，凭借 Qwen3-Max 和 MCP 协议率先实现全链路办事能力。Simon Willison 则实测了 Anthropic 的 Claude Cowork ，展示其在桌面端自动化工作流中的巨大潜力，同时提醒用户警惕提示注入风险。

🛠️ Cursor 官方发布 Agent 最佳实践，打破直接输入提示词的初级用法，提出先计划再编码的核心策略，详解 .cursor/rules 全局规则、SKILL.md 动态能力和 Hooks 自动化循环。阿里云开发者则深入探讨 Claude Skills ，厘清 Skill 与 MCP 的本质区别，提供从官方最佳实践到真实案例的完整进阶手册。

🧩 LangChain 深入对比四种多智能体架构模式：子智能体、技能、移交和路由。通过量化分析模型调用次数、延迟和 Token 消耗，为开发者提供清晰的决策框架。核心建议是在面临明确的规模瓶颈前优先采用简单的单智能体设计。

📐 字节 Trae 技术专家从第一性原理剖析 Agentic Coding，核心观点是提升 AI 协作效率的关键并非无限上下文，而是短对话模式与复利工程。腾讯团队则复盘 speckit 三个月实战，提出基于上下文工程与复合工程的新架构，通过 Agent 与 Skill 解耦实现知识自动沉淀与检索。

🎬 火爆全网的**《卢浮宫小猫》** AI 视频创作万字心得，两位主创毫无保留分享全流程：从概念构思、角色选择、分镜设计到美术风格把控。核心洞察是前期人工规划如手绘分镜至关重要，AI 是放大器而非替代品。

💼 OpenAI 和 Google 工程师分享 50 多个 AI 产品部署经验，聚焦非确定性带来的挑战。核心框架是代理权与控制权的权衡：从低代理高控制的 V1 版本起步，通过持续校准逐步演进。痛苦是新的护城河，这句话值得所有从原型走向生产的团队深思。

🎙️ 两期播客从不同视角探讨 AI 时代的价值重构。绿洲资本张津剑复盘 All in AI 三年投资历程，提出未来十年最核心的命题是主体性的构建，在 AI 放大个体特质的时代，活出自己不再是感性建议而是唯一的生存策略。另一期聚焦 AI Coding 带来的变革：软件从高价值资产变为低成本消耗品，商业壁垒将从能造出什么转向谁拥有渠道与信任。

从对话到行动，从 Chat 到 Agent，2026 年开年的信号已经足够清晰。模型公司在卷智能效率，应用层在卷落地场景，而真正的竞争才刚刚开始。保持好奇，我们下周见！

立即订阅

1多模态检索新标杆，Qwen3-VL-Embedding&Reranker 开源！
25 亿美元融资之后，杨植麟首次深度分享 Kimi 的技术重点（含演讲全文）
3读完 200 篇论文，看 DeepMind、Meta、DeepSeek ，中美巨头都在描述哪种 AGI 叙事｜2025 AI 年度复盘
4用第一性原理拆解 Agentic Coding：从理论到实操
5认知重建：Speckit 用了三个月，我放弃了——走出工具很强但用不好的困境
6选择正确的多智能体架构
7极速开发出一个高质量 Claude Agent Skills 最佳实践
8Cursor Agent 最佳实践
9Claude Cowork 初体验：Anthropic 的通用智能体
10AI 开始“动手”了，全世界第一个带头的是阿里千问
11OpenAI 和 Google 工程师在生产环境中部署 50 多个 AI 产品的经验总结
12火爆全网的《卢浮宫小猫》AI 视频万字创作心得分享，这可能是他们最毫无保留的一次。
13姚顺雨对着唐杰杨植麟林俊旸贴大脸开讲！基模四杰中关村论英雄
14All in AI 的第一个三年｜对谈绿洲资本合伙人张津剑
15AI Coding 言出法随，未来什么还会值钱？

多模态检索新标杆，Qwen3-VL-Embedding&Reranker 开源！

通义大模型

mp.weixin.qq.com

01-08

1978 字 · 约 8 分钟

多模态检索新标杆，Qwen3-VL-Embedding&Reranker 开源！

Qwen 团队正式发布了 Qwen3-VL-Embedding 与 Qwen3-VL-Reranker 模型系列，填补了开源社区在高性能多模态检索工具上的空白。该系列基于 Qwen3-VL 构建，支持文本、图像、视频及可视化文档（如架构图、UI）的统一语义空间表示。通过「双塔架构 Embedding 快速召回 + 单塔架构 Reranker 精细排序」的两阶段流程，该模型在 MMEB-v2 等权威榜单中刷新了开源纪录。对于正在构建多模态 RAG 系统或处理复杂图文检索任务的开发者来说，非常值得关注。

5 亿美元融资之后，杨植麟首次深度分享 Kimi 的技术重点（含演讲全文）

腾讯科技

mp.weixin.qq.com

01-10

6254 字 · 约 26 分钟

月之暗面创始人杨植麟在最新演讲中揭示了 Kimi 的 2025 技术蓝图，核心指向 Agentic 智能时代。他指出，在 Scaling Law 的基础上，提升 Token 效率与长上下文能力是进化为主动规划型 Agent 的关键。技术亮点包括：研发出能将 Token 效率提升两倍的新型二阶优化器，以及攻克了线性注意力机制长程性能下降难题的 KimiLinear 架构。此外，杨植麟分享了其技术品味哲学，认为 AGI 是提升人类文明上限的钥匙。

读完 200 篇论文，看 DeepMind、Meta、DeepSeek ，中美巨头都在描述哪种 AGI 叙事｜2025 AI 年度复盘

腾讯科技

mp.weixin.qq.com

01-12

18539 字 · 约 75 分钟

读完 200 篇论文，看 DeepMind、Meta、DeepSeek ，中美巨头都在描述哪种 AGI 叙事｜2025 AI 年度复盘

本文是一份关于 2025 年人工智能技术演进的深度回顾与 2026 年展望。作者提出 2025 年标志着单纯依靠 Scaling Law 的「暴力美学」时代终结，技术重心已转向流体推理、长期记忆、空间智能和元学习四大核心领域。通过对 Test-Time Compute (TTC)、Titans 架构以及世界模型等前沿论文的详尽分析，文章揭示了 AI 如何从「博学」向「睿智」进化。无论你是关注强化学习 RL 算法的工程优化，还是对下一代非冻结模型架构感兴趣，本文提供的系统化视角和海量参考文献都极具参考价值。

用第一性原理拆解 Agentic Coding：从理论到实操

字节跳动技术团队

mp.weixin.qq.com

01-12

18348 字 · 约 74 分钟

这篇由 Trae 技术专家撰写的深度文章，从第一性原理出发，系统地剖析了编程智能体的底层逻辑与实践指南。文章核心观点认为，提升 AI 协作效率的关键并非追求无限的上下文，而是通过短对话模式与复利工程来优化人机协作。作者详尽讨论了 LLM 的自回归本质、注意力机制的局限以及强化学习如何驱动 Agent 执行任务，并给出了极具实操性的工程建议：如通过配置文件沉淀项目知识、优化开发者体验以同步提升 AI 表现。无论你是 AI 编程的初学者还是希望构建自动化工作流的架构师，本文都能为你提供从理论到工具设计的全方位启发。

认知重建：Speckit 用了三个月，我放弃了——走出工具很强但用不好的困境

腾讯技术工程

mp.weixin.qq.com

01-09

20445 字 · 约 82 分钟

这篇文章深入探讨了从规范驱动开发向更先进的 AI 工程化范式的转变。作者通过复盘 speckit 和 openspec 在复杂企业环境中的实战局限，提出了基于上下文工程与复合工程的新架构。其核心在于通过 Agent 与 Skill 的解耦，实现知识的自动化沉淀与检索，从而打破 AI 编程中边际成本恒定的困境，实现研发效率的复利增长。

选择正确的多智能体架构

LangChain Blog

blog.langchain.com

01-14

1552 字 · 约 7 分钟

本文深入探讨了 AI 应用从单代理向多代理架构演进的路径，详细对比了四种核心模式：子代理 (Subagents)、技能 (Skills)、移交 (Handoffs) 和路由 (Router)。文章通过量化分析模型调用次数、延迟和 Token 消耗，为开发者提供了一套清晰的决策框架。作者强调，多代理架构能有效解决上下文管理和分布式开发中的难题，但在面临明确的规模瓶颈前，开发者应优先采用简单的单代理设计。这对于希望构建可扩展、生产级 AI 系统的架构师来说是极具价值的参考指南。

极速开发出一个高质量 Claude Agent Skills 最佳实践

阿里云开发者

mp.weixin.qq.com

01-16

4767 字 · 约 20 分钟

本文深入探讨了 Anthropic 最新推出的 Skill 功能，并为开发者提供了一套完整的实战指南。作者通过对比明确了 Skill（逻辑/经验封装）与 MCP（工具/接口连接）的本质区别，提出了「渐进式加载」和「AI 驱动开发」的核心方法论。文章不仅涵盖了官方最佳实践的总结，还通过一个真实的提示词优化器案例，展示了如何利用上下文工程快速生成高质量的技能。对于希望在 Claude 桌面、Claude Code 或 API 中提升 Agent 自主能力的开发者来说，这是一份极具参考价值的进阶手册。

Cursor Agent 最佳实践

宝玉的分享

baoyu.io

01-12

5014 字 · 约 21 分钟

来自 Cursor 官方团队的深度指南，系统性地总结了与编程 Agent 协作的最佳实践。文章打破了「直接输入提示词」的初级用法，提出了「先计划、再编码」的核心策略，并详细介绍了如何利用 .cursor/rules 设定全局规则、通过 SKILL.md 自定义动态能力，以及使用钩子（Hooks）构建自动化循环。此外，文中还探讨了多 Agent 并行开发、云端 Agent 托管以及针对复杂 Bug 的调试模式。

Claude Cowork 初体验：Anthropic 的通用智能体

Simon Willison's Weblog

simonwillison.net

01-12

1158 字 · 约 5 分钟

Anthropic 推出的 Claude Cowork 将强大的 Agent 能力引入桌面端，支持在沙盒中处理本地文件与执行网络搜索。作者 Simon Willison 通过实测证明了其在自动化工作流中的巨大潜力，同时也发出警示：尽管有安全沙盒，用户仍需警惕提示注入带来的数据风险。

AI 开始“动手”了，全世界第一个带头的是阿里千问

量子位

qbitai.com

01-15

4751 字 · 约 20 分钟

阿里千问 App 迎来史诗级更新，集成淘宝、飞猪等 400+ 阿里系服务，转型为全能 Agent。用户只需通过语音或文字指令，即可一键完成外卖点单、定机票酒店、查社保等复杂流程。凭借 Qwen3-Max 模型与全新的 MCP 协议架构，千问打破了 App 间的壁垒，率先实现了 AI 在真实物理世界的全链路办事能力。

OpenAI 和 Google 工程师在生产环境中部署 50 多个 AI 产品的经验总结

Lenny's Podcast

youtube.com

01-11

10596 字 · 约 43 分钟

OpenAI 和 Google 工程师在生产环境中部署 50 多个 AI 产品的经验总结

本期内容深度探讨了 AI 产品开发与传统软件的本质区别，核心聚焦于非确定性带来的挑战。两位专家基于在 OpenAI 和 Google 的实战经验，提出了代理权与控制权的权衡理论，建议开发者从「低代理、高控制」的 V1 版本起步，通过持续校准、持续开发框架逐步演进。文章不仅提供了从客服智能体到代码助手的迭代路径，还揭示了「痛苦是新的护城河」这一行业真相，非常适合正在从实验室原型向生产环境迁移的产品经理与架构师。

火爆全网的《卢浮宫小猫》AI 视频万字创作心得分享，这可能是他们最毫无保留的一次。

数字生命卡兹克

mp.weixin.qq.com

01-16

9620 字 · 约 39 分钟

火爆全网的《卢浮宫小猫》AI 视频万字创作心得分享，这可能是他们最毫无保留的一次。

本文详细分享了《卢浮宫小猫》AI 视频创作的全流程和心得，由两位主创海辛和阿文阐述。文章涵盖了从项目最初的概念构思、角色选择（为何最终确定白猫和橘猫）、影片调性设定、音乐制作（利用 Suno AI 生成及变奏）、分镜设计（强调信息量、节奏感和情绪递进），到美术风格把控（伊斯兰艺术风格的应用、AI 模型选择 Nano Banana Pro、提示词工程），以及复杂场景的迭代和实景合成技巧。两位创作者强调了在 AI 辅助创作中，前期的人工规划如手绘分镜的重要性，以及对 AI 工具的精细化使用，例如如何针对性地利用不同 AI 功能优化工作流，减少不必要的提示词长度，并通过 AI 高效迭代和修正错误，最终实现高质量视觉效果。文章不仅分享技术细节，也透露了艺术创作的思考过程。

姚顺雨对着唐杰杨植麟林俊旸贴大脸开讲！基模四杰中关村论英雄

量子位

qbitai.com

01-11

39241 字 · 约 157 分钟

这篇深度综述全景式呈现了中国 AI 核心力量在清华 AGI-Next 峰会上的集体发声。文章汇聚了智谱唐杰、Kimi 杨植麟、阿里林俊旸等领军人物的最新思考，重点探讨了从对话转向做事的 Agent 范式迁移。内容不仅涵盖了 Muon 优化器、线性注意力机制等底层架构革新，还深入分析了中国在算力受限背景下通过技术创新提升 Scaling 效率的突围路径。对于想要洞察 2025 年大模型演进逻辑、行业分化趋势及中美竞争态势的技术从业者和产品人，这是极具信息密度的必读指南。

All in AI 的第一个三年｜对谈绿洲资本合伙人张津剑

42章经

xiaoyuzhoufm.com

01-10

1129 字 · 约 5 分钟

在本期播客中，绿洲资本合伙人张津剑深度复盘了 AI 浪潮自 2023 年爆发以来的三年投资历程。对话围绕智谱与 MiniMax 上市这一里程碑事件展开，不仅探讨了具身智能与大模型汇合于 AGI 的「南坡北坡」技术路线，更提出了未来十年最核心的命题——主体性的构建。张津剑从硬核的算力分配逻辑转向深刻的人生哲学，指出在 AI 放大个体特质的时代，「活出自己」已不再是感性的建议，而是唯一的生存策略。

AI Coding 言出法随，未来什么还会值钱？

AI炼金术

xiaoyuzhoufm.com

01-15

1726 字 · 约 7 分钟

播客深入探讨了 AI 编程带来的变革：软件正从高价值资产转变为低成本消耗品。核心观点认为，AI 将使组织小型化（3-5 人团队），中间层管理将因「对话即代码」而消失。在生产力过剩的未来，商业壁垒将从「能造出什么」转向「谁拥有渠道与信任」。

BestBlogs.dev 第 80 期：从对话到行动

目录