精选推送

BestBlogs.dev 第 78 期：无限大脑

大家好！欢迎阅读 BestBlogs.dev 第 78 期 AI 精选文章推荐。

这是 2025 年的最后一期，本周的关键词是无限大脑。

Notion 创始人 Ivan Zhao 的一篇文章为这一年画了一个恰当的句号。他把 AI 类比为继蒸汽和钢铁之后的第三次革命性力量：蒸汽机释放了体力的边界，钢铁加固了建筑的高度，而 AI 正在成为「无限大脑」，突破认知的边界。他提出了一个核心观点：我们需要停止将 AI 仅视为「副驾驶」，而应重新想象整个工作方式。

数据印证了这个判断。Lenny 与 Figma 联合发布的 1750 人调研显示，超过一半的从业者每周因 AI 节省至少半天时间。工程师正从 GitHub Copilot 转向 Cursor 和 Claude Code，PM 开始用 AI 跨界完成原型设计。更有意思的是，创业者获益最高，而设计师感知最弱，AI 的渗透呈现出明显的职能差异。

但这一年也让我们看到了理想与现实的差距。Berkeley 和 DeepMind 的研究显示，68% 的 Agent 限制在 10 步以内，多 Agent 协作面临「协调税」和错误放大。一位前端团队的复盘更是坦承：技术成功不等于产品成功，80/20 瓶颈让用户宁可手动修改也不愿使用 Agent。他们的结论是「Skill 优于独立 Agent」，把能力融入通用工具，而非造一个新轮子。

这或许就是 2025 年的真实写照：AI 确实在重塑工作方式，但这个过程比想象中更复杂、更务实、也更需要耐心。当我们从「AI 能做什么」的狂热走向「AI 该怎么做」的深耕，真正的变革才刚刚开始。

以下是本周最值得关注的 10 个精彩亮点：

🧠 Notion 创始人 Ivan Zhao 从历史维度解读 AI 变革，将其类比为**「无限大脑」** 。个人层面，程序员从 10 倍跃升为 30-40 倍；组织层面，AI 帮助突破传统沟通瓶颈；经济体层面，知识经济将从「佛罗伦萨」演进为「东京」般的超级都市。核心观点：别把 AI 当副驾驶，重新想象整个工作方式。

📊 Lenny 与 Figma 联合发布的 AI 职场搭档调研基于 1750 份样本，揭示 AI 的真实投资回报：超半数从业者每周省半天。创业者获益最高，设计师感知最弱；工程师正从 Copilot 转向 Cursor 和 Claude Code；AI 的机会点正在从内容生产向战略思考迁移。

🤖 三篇论文写清楚了 Agent 元年的困境：68% 限制在 10 步以内，多 Agent 存在协调税和错误放大，增加预算无法线性提升性能。真正的突破需要工具管理、验证能力和通信协议的系统性进化。做 Agent 项目的团队必读。

💡 一篇来自前端团队的真实复盘：技术上成功，产品上失败。用户习惯阻力、80/20 瓶颈、流程割裂导致上线后无人使用。核心教训：技术成功≠产品成功，Skill 融入通用工具优于独立 Agent 。踩过坑的经验最珍贵。

🔧 MCP 与 Agent Skills 的对比分析：前者解决连接性，后者封装领域知识和操作流程。Skills 的「渐进式披露」机制通过三层架构按需加载信息，有效缓解上下文爆炸。文章提出 MCP + Skills 的分层混合架构，是 Agent 开发的重要参考。

📈 LangChain 发布的年度报告显示，57% 的企业已将 Agent 投入生产。客服和研发分析是两大核心场景，最大挑战是输出质量而非成本。可观测性追踪已成标配，多模型混合架构成为趋势。有数据支撑的行业基线。

🎯 Google DeepMind 三位负责人罕见同台：Flash 已达上代 Pro 水平，Pro 的主要作用变成蒸馏 Flash；后训练是最大突破空间；延迟和速度的价值被严重低估。代码、推理、数学已基本击穿，下一步是开放式任务和持续学习。

🚀 国产开源模型本周迎来重磅更新。智谱 GLM-4.7 编程能力达开源 SOTA，SWE-bench 73.8%，Code Arena 盲测超 GPT-5.2；MiniMax M2.1 主打多语言编程，测试超越 Claude Sonnet 4.5，同时开源 VIBE 全栈评测基准。

🎤 通义开源端到端语音模型 Fun-Audio-Chat 8B ，跳过 ASR+LLM+TTS 拼接流程，延迟更低。亮点是情绪感知能力和 Speech Function Call 支持，用自然语音完成复杂任务调用。代码和权重全部开放。

🌐 Y Combinator 合伙人复盘 2025 年 AI 五大意外：YC 创业公司的模型偏好已从 OpenAI 转向 Anthropic；初创公司通过模型编排层实现多模型套利；单人独角兽仍未成为现实。另一期年度对谈则提出：这不是 AI 泡沫，这是 AI 战争；Online Learning 将成为第三个核弹级范式。

2025 年，AI 从工具变成了伙伴，而我们还在学习如何与它共事。感谢各位读者这一年的陪伴。保持好奇，2026 年见！

立即订阅

1GLM-4.7 上线并开源：更强的编码
2MiniMax M2.1：多语言编程 SOTA，为真实世界复杂任务而生
3📢 我们发布了新一代端到端语音交互模型 Fun-Audio-Chat！
4三篇论文，写清楚了 Agent 元年的困境｜Hao 好聊趋势
5【生成式人工智慧與機器學習導論 2025】第 10 講：語音語言模型發展史 (本課程前段內容為歷史回顧，2025 年的技術從 1:42:00 開始)
6从 Arc 到 Dia：构建 AI 浏览器的心得 – Samir Mody， The Browser Company of New York
7可解释 AI Agent：使用 Spring AI 捕获 LLM 工具调用决策逻辑
8从失败中重生：一个 AI Agent 前端落地的真实复盘
9别再造 Agent 了！关于 Agent Skills 的详细总结来了
10从 RAG 到 Context：2025 年 RAG 技术年终总结
11构建 AI 驱动产品十年：来自 Trello 产品副总裁的经验教训
12LangChain Agent 年度报告：输出质量仍是 Agent 最大障碍，客服、研究是最快落地场景
13我豪掷 1 万美元测评 100+ AI 工具，这 11 款是你的必备之选
14Vol.92｜对话语核科技翟星吉：离钱最近的 Agent，才是 AI to B 的唯一出路？
15【早阅】谁才是你的 AI 职场搭档？这份数据告诉你答案
16蒸汽、钢铁与无限的大脑
17Gemini 负责人：Pro 的主要作用是蒸馏 Flash！最大突破空间在后训练；Noam、Jeff Dean：持续学习是重要改进方向
18谷歌今年最成功的两款 AI 应用，都出自他手
19127. 大模型季报跨年对谈：和广密预言 AI War 的两大联盟、第三范式 Online Learning
202025 年的 AI 领域：五大意外发现

GLM-4.7 上线并开源：更强的编码

智谱

mp.weixin.qq.com

12-23

2610 字 · 约 11 分钟

智谱 AI 开源 GLM-4.7，编程能力达到开源 SOTA 水平。模型在 SWE-bench 获得 73.8%，LiveCodeBench V6 达到 84.9%，Code Arena 盲测超越 GPT-5.2。新增三种思考模式提升复杂任务稳定性，前端生成和工具调用能力同步增强。已开放 API 和完整开源代码。

MiniMax M2.1：多语言编程 SOTA，为真实世界复杂任务而生

MiniMax 稀宇科技

mp.weixin.qq.com

12-23

3828 字 · 约 16 分钟

MiniMax M2.1 主打多编程语言 SOTA 能力，在代码生成、移动开发和办公自动化场景表现优异。测试结果显示超越 Claude Sonnet 4.5，并开源了全新的 VIBE 全栈应用评测基准。

📢 我们发布了新一代端到端语音交互模型 Fun-Audio-Chat！

通义大模型

mp.weixin.qq.com

12-23

438 字 · 约 2 分钟

Fun-Audio-Chat 8B 是一款端到端语音对话模型，无需传统的 ASR+LLM+TTS 拼接，延迟更低、效率更高。亮点在于情绪感知能力和 Speech Function Call 支持，能通过自然语音完成复杂任务。模型权重和代码已全部开源，值得语音交互方向的开发者关注。

三篇论文，写清楚了 Agent 元年的困境｜Hao 好聊趋势

腾讯科技

mp.weixin.qq.com

12-24

4627 字 · 约 19 分钟

基于 Berkeley 调研和 DeepMind 实验，揭示 Agent 生产环境真相：68% 限制在 10 步以内，多 Agent 存在协调税和错误放大，增加预算无法线性提升性能。真正突破需要工具管理、验证能力和通信协议的进化。

【生成式人工智慧與機器學習導論 2025】第 10 講：語音語言模型發展史 (本課程前段內容為歷史回顧，2025 年的技術從 1:42:00 開始)

Hung-yi Lee

youtube.com

12-22

4440 字 · 约 18 分钟

【生成式人工智慧與機器學習導論 2025】第 10 講：語音語言模型發展史 (本課程前段內容為歷史回顧，2025 年的技術從 1:42:00 開始)

李宏毅教授课程，一文纵览语音语言模型（SLM）技术演进。核心涵盖：端到端与级联方案博弈、利用文本 LLM 解决语音语义缺失、以及 TASTE/STITCH 架构如何实现零延迟的「边说边想」推理。适合希望理解 GPT-4o 等语音模式底层逻辑的技术读者。

从 Arc 到 Dia：构建 AI 浏览器的心得 – Samir Mody， The Browser Company of New York

AI Engineer

youtube.com

12-19

5123 字 · 约 21 分钟

从 Arc 到 Dia：构建 AI 浏览器的心得 – Samir Mody， The Browser Company of New York

The Browser Company 的 AI 工程主管 Samir Mody 讨论了他们从 Arc 浏览器到 AI 原生浏览器 Dia 的历程。关键见解包括优化工具和流程以实现快速迭代，将模型行为视为一门专门技艺，并将 AI 安全作为产品涌现属性加以解决。Mody 详细阐述了他们的工程文化、原型策略和团队结构如何演变，以应对构建一个能够进行推理、规划和执行操作的界面的挑战。他强调了内部工具对于快速原型设计和评估的重要性，介绍了 JEPA 用于自动化提示词优化，并强调了在敏感操作中嵌入 AI 安全措施（如用户确认）的必要性，以减轻提示词注入风险，并以 Dia 的自动填充、日程安排和邮件功能为例。演讲最后强调了公司必须全面拥抱技术变革。

可解释 AI Agent：使用 Spring AI 捕获 LLM 工具调用决策逻辑

Spring Blog

spring.io

12-23

1896 字 · 约 8 分钟

可解释 AI Agent：使用 Spring AI 捕获 LLM 工具调用决策逻辑

Spring AI 的工具参数增强器让 LLM 在调用工具时能够"说出"自己的思考过程。通过动态注入额外字段（如推理步骤、置信度），开发者可以捕获完整的决策逻辑，而无需修改工具代码。这项功能显著提升了 AI Agent 的可解释性和可观测性，支持构建具备长期记忆、自我反思能力的智能系统。

从失败中重生：一个 AI Agent 前端落地的真实复盘

宝玉的分享

baoyu.io

12-20

2698 字 · 约 11 分钟

本文深入复盘了一个企业级前端 AI Agent 从技术突破到产品遇冷，最终通过思维变革实现破局的真实案例。作者分享了如何基于 Claude Agent SDK 快速构建原型，并解决私有组件库训练、本地文件系统模拟及自动化质量闭环等核心技术挑战。文章最宝贵的价值在于其对 Agent 孤岛现象的深刻反思：技术成功并不等同于产品成功。作者提出，真正的 AI 落地应从构建独立 Agent 转向封装通用 Skill，并融入开发者既有的工作流（如 Cursor/Claude Code）。

别再造 Agent 了！关于 Agent Skills 的详细总结来了

Datawhale

mp.weixin.qq.com

12-22

6693 字 · 约 27 分钟

本文详细探讨了 AI Agent 领域中 MCP（Model Context Protocol）和 Agent Skills 两种核心概念。文章指出，MCP 主要解决 Agent 与外部工具/资源的连接性问题，而 Agent Skills 则专注于封装领域知识和操作流程，解决 Agent“知道如何使用”工具的能力问题。核心亮点在于 Agent Skills 引入的“渐进式披露”机制，通过三层架构（元数据、技能主体、附加资源）按需加载信息，有效缓解了传统 MCP 因工具 JSON Schema 过大导致的上下文爆炸和成本高昂问题。文章强调 MCP 和 Skills 是互补而非竞争关系，提出了一种结合两者的分层混合架构，能优化成本、提高可维护性和复用性。最后，文章详细介绍了 SKILL.md 规范、编写高质量 Skills 的原则，并展望了行业标准化、生态系统构建和自动化能力发现的未来趋势，同时也警示了安全性和碎片化等潜在风险。

从 RAG 到 Context：2025 年 RAG 技术年终总结

InfoQ 中文

mp.weixin.qq.com

12-21

15533 字 · 约 63 分钟

文章对 2025 年 RAG 技术的发展进行了年终总结，指出尽管面临长上下文和 Agent 分流的质疑，RAG 仍在企业级 AI 落地中展现出不可替代的数据基础设施地位。文章详细探讨了 RAG 的技术改进，包括将检索解耦为“搜索”与“检索”两阶段、TreeRAG 与 GraphRAG 的融合，以应对传统 RAG 在处理复杂查询时的痛点。文章强调了 RAG 从知识库向通用 Agent 数据基座演进的趋势，并引入“上下文工程”概念，分析了领域知识、工具数据和会话状态数据在 Agent 上下文组装中的关键作用，最终提出 RAG 将升级为“上下文引擎”或“上下文平台”的未来展望。同时，文章也审视了多模态 RAG 的进展及其工程化挑战。

构建 AI 驱动产品十年：来自 Trello 产品副总裁的经验教训

Product School

youtube.com

12-24

8817 字 · 约 36 分钟

Trello 产品负责人分享 AI 产品化的 10 大教训：重点关注如何跨越 AI 价值的负增长初期，通过可解释性设计（如星级化、工具提示）建立用户信任。核心观点指出，产品经理的新使命已转向 AI 系统调试与评估集的构建，需通过修正路由逻辑防止用户利用系统漏洞，最终实现从通用功能到极致个性化体验的跨越。

LangChain Agent 年度报告：输出质量仍是 Agent 最大障碍，客服、研究是最快落地场景

Founder Park

mp.weixin.qq.com

12-22

3394 字 · 约 14 分钟

LangChain Agent 年度报告：输出质量仍是 Agent 最大障碍，客服、研究是最快落地场景

LangChain 最新调研显示，2026 年 AI Agent 已进入实战期，57% 的企业已正式投产。客户服务和研发分析是两大核心场景。当前落地的最大挑战是质量而非成本。技术趋势上，可观测性追踪已成标配，多模型混合架构取代了单一模型依赖。编程类 Agent 仍是目前渗透率最高、最成熟的日常工具。

我豪掷 1 万美元测评 100+ AI 工具，这 11 款是你的必备之选

Silicon Valley Girl

youtube.com

12-23

6383 字 · 约 26 分钟

视频精选 2025 年必不可少的 11 款 AI 神器，涵盖从基础模型（Claude， Perplexity）到自动化流（Zapier， n8n），再到垂直领域（Notion， Gamma， HeyGen）的全能布局。核心逻辑在于利用 AI 浏览器（Comet/Atlas）和自动化集成减少重复劳动。一句话总结：别盲目付费，先用这 11 款工具把你的工作流「系统化」。

Vol.92｜对话语核科技翟星吉：离钱最近的 Agent，才是 AI to B 的唯一出路？

开始连接LinkStart

xiaoyuzhoufm.com

12-26

941 字 · 约 4 分钟

Vol.92｜对话语核科技翟星吉：离钱最近的 Agent，才是 AI to B 的唯一出路？

96 年创业者翟星吉讲述如何用 AI Agent 重构企业销售流程，核心是按增量价值收费而非按人力成本收费。通过售前解决方案自动生成，帮助客户提升 20% 成交率。强调选择企业核心业务痛点、确保技术可实现性，以及创业者需要快速迭代和果断决策的能力。

【早阅】谁才是你的 AI 职场搭档？这份数据告诉你答案

前端早读课

mp.weixin.qq.com

12-26

4628 字 · 约 19 分钟

这份由 Lenny 与 Figma AI 洞察经理联合发布的调研报告，通过 1750 份样本揭示了 AI 的真实投资回报：超过一半的从业者每周节省至少半天时间。核心洞察包括：创业者获益最高，设计师感知最弱；工程师正从 GitHub Copilot 转向 Cursor 和 Claude Code；PM 开始利用 AI 跨界完成原型设计。报告明确指出，未来 AI 的机会点在于从内容生产向前期探索和战略思考迁移。

蒸汽、钢铁与无限的大脑

宝玉的分享

baoyu.io

12-24

3840 字 · 约 16 分钟

Notion 创始人 Ivan Zhao 从历史维度解读 AI 变革。文章将 AI 类比为继蒸汽和钢铁之后的"无限大脑"，从个人、组织和经济体三个层面分析其影响。在个人层面，AI 智能体让程序员从"10 倍工程师"跃升为"30-40 倍工程师"，但普及到通用知识工作需解决上下文碎片化和可验证性难题。在组织层面，AI 如同钢铁般加固组织架构，如蒸汽机般释放生产力，帮助企业突破传统沟通瓶颈实现真正的规模化。在经济体层面，知识经济将从"人类尺度"的佛罗伦萨演进为"超级都市"般的东京，形成跨时区、高密度运作的新模式。文章核心观点：我们需要停止将 AI 仅视为"副驾驶"，而应重新想象整个工作方式。

Gemini 负责人：Pro 的主要作用是蒸馏 Flash！最大突破空间在后训练；Noam、Jeff Dean：持续学习是重要改进方向

51CTO技术栈

mp.weixin.qq.com

12-21

11072 字 · 约 45 分钟

Gemini 负责人：Pro 的主要作用是蒸馏 Flash！最大突破空间在后训练；Noam、Jeff Dean：持续学习是重要改进方向

Google DeepMind 三位 Gemini 联合技术负责人罕见同台对话，深度揭秘 Gemini 3 背后的技术哲学。访谈透露了几个关键信息：Flash 模型已能达到甚至超越上一代 Pro 水平，Pro 的主要作用变成了蒸馏 Flash；后训练被认为是当前最大的突破空间；延迟和速度的价值被严重低估，在实际应用中甚至比绝对智能更重要。团队还强调，代码、推理、数学领域已基本击穿，下一步重点是开放式任务和持续学习能力。

谷歌今年最成功的两款 AI 应用，都出自他手

Founder Park

mp.weixin.qq.com

12-24

6340 字 · 约 26 分钟

文章聚焦谷歌 Gemini 应用负责人 Josh Woodward，揭秘他如何带领团队在 8 个月内实现用户数翻倍。核心观点包括：通过 5-7 人的极小团队实现快速迭代；建立 block 系统突破大公司官僚障碍；将 AI 从搜索引擎进化为深度理解用户私有数据的内容容器；并预言 AI 交互将从对话框演变为动态生成的交互界面。

127. 大模型季报跨年对谈：和广密预言 AI War 的两大联盟、第三范式 Online Learning

张小珺Jùn｜商业访谈录

xiaoyuzhoufm.com

12-24

1776 字 · 约 8 分钟

127. 大模型季报跨年对谈：和广密预言 AI War 的两大联盟、第三范式 Online Learning

这期年度对谈是理解 2025 年全球 AI 竞争格局的必听内容。广密提出了一个关键判断：这不是 AI 泡沫，而是 AI 战争——一场科技巨头和国家都输不起的军备竞赛。播客深度解析了英伟达 GPU 和谷歌 TPU 两大阵营的竞争态势，揭示了 OpenAI、Anthropic、Google 三家领先模型交替领先的底层原因。最重要的是，他们预判 Online Learning 将成为继预训练和强化学习之后的第三个核弹级范式，并提出了从集中到分散的投资组合调整策略。对于关注 AI 投资和技术趋势的从业者来说，这期播客提供了难得的一线洞察。

2025 年的 AI 领域：五大意外发现

Y Combinator

youtube.com

12-22

7728 字 · 约 31 分钟

Y Combinator 合伙人深度复盘 2025 年 AI 领域的意外转折。数据显示，YC 创业公司的模型偏好已从 OpenAI 转向 Anthropic，后者在代码相关任务上表现更优。更值得关注的是，初创公司正通过模型编排层实现套利，针对不同任务动态选择最优模型。播客还探讨了 AI 经济企稳的信号、基础设施投资的长期价值，以及为何单人独角兽仍未成为现实。

BestBlogs.dev 第 78 期：无限大脑

目录