跳转到主要内容
精选推送

BestBlogs.dev 第 80 期:从对话到行动

大家好!欢迎阅读 BestBlogs.dev 第 80 期 AI 精选文章推荐。

本周的关键词是 从对话到行动

清华 AGI-Next 前沿峰会上,智谱唐杰一语道破:DeepSeek 横空出世后,Chat 这一代问题基本结束了,下一步是走向做事。杨植麟用 Agentic 智能时代概括这场范式迁移的终点,模型将从被动响应的文本生成工具,进化为主动规划、自主决策的智能代理。

这不是概念炒作。本周千问 App 接入 400 多个阿里系服务,一句话完成外卖、机票、社保全流程;Claude Cowork 把 Agent 能力带到桌面端;Cursor 和 Claude 官方同步发布 Agent 最佳实践。从基座模型到应用产品,整个行业都在回答同一个问题:AI 怎么真正帮人把事办了。

以下是本周最值得关注的 10 个精彩亮点:

🎤 清华 AGI-Next 峰会 汇聚中国 AI 核心力量,堪称年度最高密度的技术对话。唐杰复盘智谱从认知智能到 Agent 的十年路径,提出 Intelligence Efficiency 将成为下一阶段竞争焦点;杨植麟首次深度分享 Kimi 技术蓝图,核心指向 Token Efficiency 与 Long Context 两大主线,并公开了 Muon 优化器和 KimiLinear 架构的关键细节;林俊旸坦言中国反超概率约 20%,但穷则思变,软硬结合或是突破口;姚顺雨远程连线,指出 toB 与 toC 正在明显分化,模型智能越高、生产力价值越大。

📊 一篇读完 200 篇论文的年度 AI 复盘 ,将 2025 定义为 Scaling Law 暴力美学时代的终结。技术重心已转向流体推理、长期记忆、空间智能和元学习四大领域。

🔍 Qwen 团队发布 Qwen3-VL-Embedding 与 Reranker 系列,填补开源社区在高性能多模态检索工具上的空白。双塔召回加单塔精排的两阶段流程,在 MMEB-v2 等榜单刷新开源纪录,构建多模态 RAG 系统的开发者值得关注。

🤖 千问 App 迎来史诗级更新,集成淘宝、飞猪等 400 多个阿里系服务转型全能 Agent。一句话完成外卖点单、订机票酒店、查社保,凭借 Qwen3-Max 和 MCP 协议率先实现全链路办事能力。Simon Willison 则实测了 Anthropic 的 Claude Cowork ,展示其在桌面端自动化工作流中的巨大潜力,同时提醒用户警惕提示注入风险。

🛠️ Cursor 官方发布 Agent 最佳实践,打破直接输入提示词的初级用法,提出先计划再编码的核心策略,详解 .cursor/rules 全局规则、SKILL.md 动态能力和 Hooks 自动化循环。阿里云开发者则深入探讨 Claude Skills ,厘清 Skill 与 MCP 的本质区别,提供从官方最佳实践到真实案例的完整进阶手册。

🧩 LangChain 深入对比四种多智能体架构模式:子智能体、技能、移交和路由。通过量化分析模型调用次数、延迟和 Token 消耗,为开发者提供清晰的决策框架。核心建议是在面临明确的规模瓶颈前优先采用简单的单智能体设计。

📐 字节 Trae 技术专家从第一性原理剖析 Agentic Coding,核心观点是提升 AI 协作效率的关键并非无限上下文,而是短对话模式与复利工程。腾讯团队则复盘 speckit 三个月实战,提出基于上下文工程与复合工程的新架构,通过 Agent 与 Skill 解耦实现知识自动沉淀与检索。

🎬 火爆全网的**《卢浮宫小猫》** AI 视频创作万字心得,两位主创毫无保留分享全流程:从概念构思、角色选择、分镜设计到美术风格把控。核心洞察是前期人工规划如手绘分镜至关重要,AI 是放大器而非替代品。

💼 OpenAI 和 Google 工程师 分享 50 多个 AI 产品部署经验,聚焦非确定性带来的挑战。核心框架是代理权与控制权的权衡:从低代理高控制的 V1 版本起步,通过持续校准逐步演进。痛苦是新的护城河,这句话值得所有从原型走向生产的团队深思。

🎙️ 两期播客从不同视角探讨 AI 时代的价值重构。绿洲资本张津剑复盘 All in AI 三年 投资历程,提出未来十年最核心的命题是主体性的构建,在 AI 放大个体特质的时代,活出自己不再是感性建议而是唯一的生存策略。另一期聚焦 AI Coding 带来的变革:软件从高价值资产变为低成本消耗品,商业壁垒将从能造出什么转向谁拥有渠道与信任。

从对话到行动,从 Chat 到 Agent,2026 年开年的信号已经足够清晰。模型公司在卷智能效率,应用层在卷落地场景,而真正的竞争才刚刚开始。保持好奇,我们下周见!

通义大模型
mp.weixin.qq.com
01-08
1978 字 · 约 8 分钟
92
多模态检索新标杆,Qwen3-VL-Embedding&Reranker 开源!

Qwen 团队正式发布了 Qwen3-VL-Embedding 与 Qwen3-VL-Reranker 模型系列,填补了开源社区在高性能多模态检索工具上的空白。该系列基于 Qwen3-VL 构建,支持文本、图像、视频及可视化文档(如架构图、UI)的统一语义空间表示。通过「双塔架构 Embedding 快速召回 + 单塔架构 Reranker 精细排序」的两阶段流程,该模型在 MMEB-v2 等权威榜单中刷新了开源纪录。对于正在构建多模态 RAG 系统或处理复杂图文检索任务的开发者来说,非常值得关注。

腾讯科技
mp.weixin.qq.com
01-10
6254 字 · 约 26 分钟
93
5 亿美元融资之后,杨植麟首次深度分享 Kimi 的技术重点(含演讲全文)

月之暗面创始人杨植麟在最新演讲中揭示了 Kimi 的 2025 技术蓝图,核心指向 Agentic 智能时代。他指出,在 Scaling Law 的基础上,提升 Token 效率与长上下文能力是进化为主动规划型 Agent 的关键。技术亮点包括:研发出能将 Token 效率提升两倍的新型二阶优化器,以及攻克了线性注意力机制长程性能下降难题的 KimiLinear 架构。此外,杨植麟分享了其技术品味哲学,认为 AGI 是提升人类文明上限的钥匙。

腾讯科技
mp.weixin.qq.com
01-12
18539 字 · 约 75 分钟
93
读完 200 篇论文,看 DeepMind、Meta、DeepSeek ,中美巨头都在描述哪种 AGI 叙事|2025 AI 年度复盘

本文是一份关于 2025 年人工智能技术演进的深度回顾与 2026 年展望。作者提出 2025 年标志着单纯依靠 Scaling Law 的「暴力美学」时代终结,技术重心已转向流体推理、长期记忆、空间智能和元学习四大核心领域。通过对 Test-Time Compute (TTC)、Titans 架构以及世界模型等前沿论文的详尽分析,文章揭示了 AI 如何从「博学」向「睿智」进化。无论你是关注强化学习 RL 算法的工程优化,还是对下一代非冻结模型架构感兴趣,本文提供的系统化视角和海量参考文献都极具参考价值。

字节跳动技术团队
mp.weixin.qq.com
01-12
18348 字 · 约 74 分钟
93
用第一性原理拆解 Agentic Coding:从理论到实操

这篇由 Trae 技术专家撰写的深度文章,从第一性原理出发,系统地剖析了编程智能体 的底层逻辑与实践指南。文章核心观点认为,提升 AI 协作效率的关键并非追求无限的上下文,而是通过短对话模式与复利工程来优化人机协作。作者详尽讨论了 LLM 的自回归本质、注意力机制的局限以及强化学习如何驱动 Agent 执行任务,并给出了极具实操性的工程建议:如通过配置文件沉淀项目知识、优化开发者体验以同步提升 AI 表现。无论你是 AI 编程的初学者还是希望构建自动化工作流的架构师,本文都能为你提供从理论到工具设计的全方位启发。

腾讯技术工程
mp.weixin.qq.com
01-09
20445 字 · 约 82 分钟
93
认知重建:Speckit 用了三个月,我放弃了——走出工具很强但用不好的困境

这篇文章深入探讨了从规范驱动开发向更先进的 AI 工程化范式的转变。作者通过复盘 speckit 和 openspec 在复杂企业环境中的实战局限,提出了基于上下文工程与复合工程的新架构。其核心在于通过 Agent 与 Skill 的解耦,实现知识的自动化沉淀与检索,从而打破 AI 编程中边际成本恒定的困境,实现研发效率的复利增长。

LangChain Blog
blog.langchain.com
01-14
1552 字 · 约 7 分钟
93
选择正确的多智能体架构

本文深入探讨了 AI 应用从单代理向多代理架构演进的路径,详细对比了四种核心模式:子代理 (Subagents)、技能 (Skills)、移交 (Handoffs) 和路由 (Router)。文章通过量化分析模型调用次数、延迟和 Token 消耗,为开发者提供了一套清晰的决策框架。作者强调,多代理架构能有效解决上下文管理和分布式开发中的难题,但在面临明确的规模瓶颈前,开发者应优先采用简单的单代理设计。这对于希望构建可扩展、生产级 AI 系统的架构师来说是极具价值的参考指南。

阿里云开发者
mp.weixin.qq.com
01-16
4767 字 · 约 20 分钟
93
极速开发出一个高质量 Claude Agent Skills 最佳实践

本文深入探讨了 Anthropic 最新推出的 Skill 功能,并为开发者提供了一套完整的实战指南。作者通过对比明确了 Skill(逻辑/经验封装)与 MCP(工具/接口连接)的本质区别,提出了「渐进式加载」和「AI 驱动开发」的核心方法论。文章不仅涵盖了官方最佳实践的总结,还通过一个真实的提示词优化器案例,展示了如何利用上下文工程快速生成高质量的技能。对于希望在 Claude 桌面、Claude Code 或 API 中提升 Agent 自主能力的开发者来说,这是一份极具参考价值的进阶手册。

宝玉的分享
baoyu.io
01-12
5014 字 · 约 21 分钟
92
Cursor Agent 最佳实践

来自 Cursor 官方团队的深度指南,系统性地总结了与编程 Agent 协作的最佳实践。文章打破了「直接输入提示词」的初级用法,提出了「先计划、再编码」的核心策略,并详细介绍了如何利用 .cursor/rules 设定全局规则、通过 SKILL.md 自定义动态能力,以及使用钩子(Hooks)构建自动化循环。此外,文中还探讨了多 Agent 并行开发、云端 Agent 托管以及针对复杂 Bug 的调试模式。

量子位
qbitai.com
01-15
4751 字 · 约 20 分钟
92
AI 开始“动手”了,全世界第一个带头的是阿里千问

阿里千问 App 迎来史诗级更新,集成淘宝、飞猪等 400+ 阿里系服务,转型为全能 Agent。用户只需通过语音或文字指令,即可一键完成外卖点单、定机票酒店、查社保等复杂流程。凭借 Qwen3-Max 模型与全新的 MCP 协议架构,千问打破了 App 间的壁垒,率先实现了 AI 在真实物理世界的全链路办事能力。

Lenny's Podcast
youtube.com
01-11
10596 字 · 约 43 分钟
92
OpenAI 和 Google 工程师在生产环境中部署 50 多个 AI 产品的经验总结

本期内容深度探讨了 AI 产品开发与传统软件的本质区别,核心聚焦于非确定性带来的挑战。两位专家基于在 OpenAI 和 Google 的实战经验,提出了代理权与控制权的权衡理论,建议开发者从「低代理、高控制」的 V1 版本起步,通过持续校准、持续开发框架逐步演进。文章不仅提供了从客服智能体到代码助手的迭代路径,还揭示了「痛苦是新的护城河」这一行业真相,非常适合正在从实验室原型向生产环境迁移的产品经理与架构师。

数字生命卡兹克
mp.weixin.qq.com
01-16
9620 字 · 约 39 分钟
93
火爆全网的《卢浮宫小猫》AI 视频万字创作心得分享,这可能是他们最毫无保留的一次。

本文详细分享了《卢浮宫小猫》AI 视频创作的全流程和心得,由两位主创海辛和阿文阐述。文章涵盖了从项目最初的概念构思、角色选择(为何最终确定白猫和橘猫)、影片调性设定、音乐制作(利用 Suno AI 生成及变奏)、分镜设计(强调信息量、节奏感和情绪递进),到美术风格把控(伊斯兰艺术风格的应用、AI 模型选择 Nano Banana Pro、提示词工程),以及复杂场景的迭代和实景合成技巧。两位创作者强调了在 AI 辅助创作中,前期的人工规划如手绘分镜的重要性,以及对 AI 工具的精细化使用,例如如何针对性地利用不同 AI 功能优化工作流,减少不必要的提示词长度,并通过 AI 高效迭代和修正错误,最终实现高质量视觉效果。文章不仅分享技术细节,也透露了艺术创作的思考过程。

量子位
qbitai.com
01-11
39241 字 · 约 157 分钟
93
姚顺雨对着唐杰杨植麟林俊旸贴大脸开讲!基模四杰中关村论英雄

这篇深度综述全景式呈现了中国 AI 核心力量在清华 AGI-Next 峰会上的集体发声。文章汇聚了智谱唐杰、Kimi 杨植麟、阿里林俊旸等领军人物的最新思考,重点探讨了从对话转向做事的 Agent 范式迁移。内容不仅涵盖了 Muon 优化器、线性注意力机制等底层架构革新,还深入分析了中国在算力受限背景下通过技术创新提升 Scaling 效率的突围路径。对于想要洞察 2025 年大模型演进逻辑、行业分化趋势及中美竞争态势的技术从业者和产品人,这是极具信息密度的必读指南。

42章经
xiaoyuzhoufm.com
01-10
1129 字 · 约 5 分钟
93
All in AI 的第一个三年|对谈绿洲资本合伙人张津剑

在本期播客中,绿洲资本合伙人张津剑深度复盘了 AI 浪潮自 2023 年爆发以来的三年投资历程。对话围绕智谱与 MiniMax 上市这一里程碑事件展开,不仅探讨了具身智能与大模型汇合于 AGI 的「南坡北坡」技术路线,更提出了未来十年最核心的命题——主体性的构建。张津剑从硬核的算力分配逻辑转向深刻的人生哲学,指出在 AI 放大个体特质的时代,「活出自己」已不再是感性的建议,而是唯一的生存策略。

AI炼金术
xiaoyuzhoufm.com
01-15
1726 字 · 约 7 分钟
93
AI Coding 言出法随,未来什么还会值钱?

播客深入探讨了 AI 编程带来的变革:软件正从高价值资产转变为低成本消耗品。核心观点认为,AI 将使组织小型化(3-5 人团队),中间层管理将因「对话即代码」而消失。在生产力过剩的未来,商业壁垒将从「能造出什么」转向「谁拥有渠道与信任」。