跳转到主要内容
精选推送

BestBlogs.dev 第 78 期:无限大脑

大家好!欢迎阅读 BestBlogs.dev 第 78 期 AI 精选文章推荐。

这是 2025 年的最后一期,本周的关键词是 无限大脑

Notion 创始人 Ivan Zhao 的一篇文章为这一年画了一个恰当的句号。他把 AI 类比为继蒸汽和钢铁之后的第三次革命性力量:蒸汽机释放了体力的边界,钢铁加固了建筑的高度,而 AI 正在成为「无限大脑」,突破认知的边界。他提出了一个核心观点:我们需要停止将 AI 仅视为「副驾驶」,而应重新想象整个工作方式。

数据印证了这个判断。Lenny 与 Figma 联合发布的 1750 人调研显示,超过一半的从业者每周因 AI 节省至少半天时间。工程师正从 GitHub Copilot 转向 Cursor 和 Claude Code,PM 开始用 AI 跨界完成原型设计。更有意思的是,创业者获益最高,而设计师感知最弱,AI 的渗透呈现出明显的职能差异。

但这一年也让我们看到了理想与现实的差距。Berkeley 和 DeepMind 的研究显示,68% 的 Agent 限制在 10 步以内,多 Agent 协作面临「协调税」和错误放大。一位前端团队的复盘更是坦承:技术成功不等于产品成功,80/20 瓶颈让用户宁可手动修改也不愿使用 Agent。他们的结论是「Skill 优于独立 Agent」,把能力融入通用工具,而非造一个新轮子。

这或许就是 2025 年的真实写照:AI 确实在重塑工作方式,但这个过程比想象中更复杂、更务实、也更需要耐心。当我们从「AI 能做什么」的狂热走向「AI 该怎么做」的深耕,真正的变革才刚刚开始。

以下是本周最值得关注的 10 个精彩亮点:

🧠 Notion 创始人 Ivan Zhao 从历史维度解读 AI 变革,将其类比为**「无限大脑」** 。个人层面,程序员从 10 倍跃升为 30-40 倍;组织层面,AI 帮助突破传统沟通瓶颈;经济体层面,知识经济将从「佛罗伦萨」演进为「东京」般的超级都市。核心观点:别把 AI 当副驾驶,重新想象整个工作方式。

📊 Lenny 与 Figma 联合发布的 AI 职场搭档调研 基于 1750 份样本,揭示 AI 的真实投资回报:超半数从业者每周省半天。创业者获益最高,设计师感知最弱;工程师正从 Copilot 转向 Cursor 和 Claude Code;AI 的机会点正在从内容生产向战略思考迁移。

🤖 三篇论文写清楚了 Agent 元年的困境 :68% 限制在 10 步以内,多 Agent 存在协调税和错误放大,增加预算无法线性提升性能。真正的突破需要工具管理、验证能力和通信协议的系统性进化。做 Agent 项目的团队必读。

💡 一篇来自前端团队的真实复盘 :技术上成功,产品上失败。用户习惯阻力、80/20 瓶颈、流程割裂导致上线后无人使用。核心教训:技术成功≠产品成功,Skill 融入通用工具优于独立 Agent 。踩过坑的经验最珍贵。

🔧 MCP 与 Agent Skills 的对比分析:前者解决连接性,后者封装领域知识和操作流程。Skills 的「渐进式披露」机制通过三层架构按需加载信息,有效缓解上下文爆炸。文章提出 MCP + Skills 的分层混合架构,是 Agent 开发的重要参考。

📈 LangChain 发布的 年度报告 显示,57% 的企业已将 Agent 投入生产。客服和研发分析是两大核心场景,最大挑战是输出质量而非成本。可观测性追踪已成标配,多模型混合架构成为趋势。有数据支撑的行业基线。

🎯 Google DeepMind 三位负责人罕见同台:Flash 已达上代 Pro 水平,Pro 的主要作用变成蒸馏 Flash;后训练是最大突破空间;延迟和速度的价值被严重低估。代码、推理、数学已基本击穿,下一步是开放式任务和持续学习。

🚀 国产开源模型本周迎来重磅更新。智谱 GLM-4.7 编程能力达开源 SOTA,SWE-bench 73.8%,Code Arena 盲测超 GPT-5.2;MiniMax M2.1 主打多语言编程,测试超越 Claude Sonnet 4.5,同时开源 VIBE 全栈评测基准。

🎤 通义开源端到端语音模型 Fun-Audio-Chat 8B ,跳过 ASR+LLM+TTS 拼接流程,延迟更低。亮点是情绪感知能力和 Speech Function Call 支持,用自然语音完成复杂任务调用。代码和权重全部开放。

🌐 Y Combinator 合伙人复盘 2025 年 AI 五大意外 :YC 创业公司的模型偏好已从 OpenAI 转向 Anthropic;初创公司通过模型编排层实现多模型套利;单人独角兽仍未成为现实。另一期年度对谈则提出:这不是 AI 泡沫,这是 AI 战争;Online Learning 将成为第三个核弹级范式。

2025 年,AI 从工具变成了伙伴,而我们还在学习如何与它共事。感谢各位读者这一年的陪伴。保持好奇,2026 年见!

智谱
mp.weixin.qq.com
12-23
2610 字 · 约 11 分钟
94
GLM-4.7 上线并开源:更强的编码

智谱 AI 开源 GLM-4.7,编程能力达到开源 SOTA 水平。模型在 SWE-bench 获得 73.8%,LiveCodeBench V6 达到 84.9%,Code Arena 盲测超越 GPT-5.2。新增三种思考模式提升复杂任务稳定性,前端生成和工具调用能力同步增强。已开放 API 和完整开源代码。

Hung-yi Lee
youtube.com
12-22
4440 字 · 约 18 分钟
92
【生成式人工智慧與機器學習導論 2025】第 10 講:語音語言模型發展史 (本課程前段內容為歷史回顧,2025 年的技術從 1:42:00 開始)

李宏毅教授课程,一文纵览语音语言模型(SLM)技术演进。核心涵盖:端到端与级联方案博弈、利用文本 LLM 解决语音语义缺失、以及 TASTE/STITCH 架构如何实现零延迟的「边说边想」推理。适合希望理解 GPT-4o 等语音模式底层逻辑的技术读者。

AI Engineer
youtube.com
12-19
5123 字 · 约 21 分钟
93
从 Arc 到 Dia:构建 AI 浏览器的心得 – Samir Mody, The Browser Company of New York

The Browser Company 的 AI 工程主管 Samir Mody 讨论了他们从 Arc 浏览器到 AI 原生浏览器 Dia 的历程。关键见解包括优化工具和流程以实现快速迭代,将模型行为视为一门专门技艺,并将 AI 安全作为产品涌现属性加以解决。Mody 详细阐述了他们的工程文化、原型策略和团队结构如何演变,以应对构建一个能够进行推理、规划和执行操作的界面的挑战。他强调了内部工具对于快速原型设计和评估的重要性,介绍了 JEPA 用于自动化提示词优化,并强调了在敏感操作中嵌入 AI 安全措施(如用户确认)的必要性,以减轻提示词注入风险,并以 Dia 的自动填充、日程安排和邮件功能为例。演讲最后强调了公司必须全面拥抱技术变革。

Spring Blog
spring.io
12-23
1896 字 · 约 8 分钟
94
可解释 AI Agent:使用 Spring AI 捕获 LLM 工具调用决策逻辑

Spring AI 的工具参数增强器让 LLM 在调用工具时能够"说出"自己的思考过程。通过动态注入额外字段(如推理步骤、置信度),开发者可以捕获完整的决策逻辑,而无需修改工具代码。这项功能显著提升了 AI Agent 的可解释性和可观测性,支持构建具备长期记忆、自我反思能力的智能系统。

宝玉的分享
baoyu.io
12-20
2698 字 · 约 11 分钟
93
从失败中重生:一个 AI Agent 前端落地的真实复盘

本文深入复盘了一个企业级前端 AI Agent 从技术突破到产品遇冷,最终通过思维变革实现破局的真实案例。作者分享了如何基于 Claude Agent SDK 快速构建原型,并解决私有组件库训练、本地文件系统模拟及自动化质量闭环等核心技术挑战。文章最宝贵的价值在于其对 Agent 孤岛现象的深刻反思:技术成功并不等同于产品成功。作者提出,真正的 AI 落地应从构建独立 Agent 转向封装通用 Skill,并融入开发者既有的工作流(如 Cursor/Claude Code)。

Datawhale
mp.weixin.qq.com
12-22
6693 字 · 约 27 分钟
92
别再造 Agent 了!关于 Agent Skills 的详细总结来了

本文详细探讨了 AI Agent 领域中 MCP(Model Context Protocol)和 Agent Skills 两种核心概念。文章指出,MCP 主要解决 Agent 与外部工具/资源的连接性问题,而 Agent Skills 则专注于封装领域知识和操作流程,解决 Agent“知道如何使用”工具的能力问题。核心亮点在于 Agent Skills 引入的“渐进式披露”机制,通过三层架构(元数据、技能主体、附加资源)按需加载信息,有效缓解了传统 MCP 因工具 JSON Schema 过大导致的上下文爆炸和成本高昂问题。文章强调 MCP 和 Skills 是互补而非竞争关系,提出了一种结合两者的分层混合架构,能优化成本、提高可维护性和复用性。最后,文章详细介绍了 SKILL.md 规范、编写高质量 Skills 的原则,并展望了行业标准化、生态系统构建和自动化能力发现的未来趋势,同时也警示了安全性和碎片化等潜在风险。

InfoQ 中文
mp.weixin.qq.com
12-21
15533 字 · 约 63 分钟
92
从 RAG 到 Context:2025 年 RAG 技术年终总结

文章对 2025 年 RAG 技术的发展进行了年终总结,指出尽管面临长上下文和 Agent 分流的质疑,RAG 仍在企业级 AI 落地中展现出不可替代的数据基础设施地位。文章详细探讨了 RAG 的技术改进,包括将检索解耦为“搜索”与“检索”两阶段、TreeRAG 与 GraphRAG 的融合,以应对传统 RAG 在处理复杂查询时的痛点。文章强调了 RAG 从知识库向通用 Agent 数据基座演进的趋势,并引入“上下文工程”概念,分析了领域知识、工具数据和会话状态数据在 Agent 上下文组装中的关键作用,最终提出 RAG 将升级为“上下文引擎”或“上下文平台”的未来展望。同时,文章也审视了多模态 RAG 的进展及其工程化挑战。

Product School
youtube.com
12-24
8817 字 · 约 36 分钟
92
构建 AI 驱动产品十年:来自 Trello 产品副总裁的经验教训

Trello 产品负责人分享 AI 产品化的 10 大教训:重点关注如何跨越 AI 价值的负增长初期,通过可解释性设计(如星级化、工具提示)建立用户信任。核心观点指出,产品经理的新使命已转向 AI 系统调试与评估集的构建,需通过修正路由逻辑防止用户利用系统漏洞,最终实现从通用功能到极致个性化体验的跨越。

Founder Park
mp.weixin.qq.com
12-22
3394 字 · 约 14 分钟
93
LangChain Agent 年度报告:输出质量仍是 Agent 最大障碍,客服、研究是最快落地场景

LangChain 最新调研显示,2026 年 AI Agent 已进入实战期,57% 的企业已正式投产。客户服务和研发分析是两大核心场景。当前落地的最大挑战是质量而非成本。技术趋势上,可观测性追踪已成标配,多模型混合架构取代了单一模型依赖。编程类 Agent 仍是目前渗透率最高、最成熟的日常工具。

Silicon Valley Girl
youtube.com
12-23
6383 字 · 约 26 分钟
92
我豪掷 1 万美元测评 100+ AI 工具,这 11 款是你的必备之选

视频精选 2025 年必不可少的 11 款 AI 神器,涵盖从基础模型(Claude, Perplexity)到自动化流(Zapier, n8n),再到垂直领域(Notion, Gamma, HeyGen)的全能布局。核心逻辑在于利用 AI 浏览器(Comet/Atlas)和自动化集成减少重复劳动。一句话总结:别盲目付费,先用这 11 款工具把你的工作流「系统化」。

开始连接LinkStart
xiaoyuzhoufm.com
12-26
941 字 · 约 4 分钟
92
Vol.92|对话语核科技翟星吉:离钱最近的 Agent,才是 AI to B 的唯一出路?

96 年创业者翟星吉讲述如何用 AI Agent 重构企业销售流程,核心是按增量价值收费而非按人力成本收费。通过售前解决方案自动生成,帮助客户提升 20% 成交率。强调选择企业核心业务痛点、确保技术可实现性,以及创业者需要快速迭代和果断决策的能力。

前端早读课
mp.weixin.qq.com
12-26
4628 字 · 约 19 分钟
92
【早阅】谁才是你的 AI 职场搭档?这份数据告诉你答案

这份由 Lenny 与 Figma AI 洞察经理联合发布的调研报告,通过 1750 份样本揭示了 AI 的真实投资回报:超过一半的从业者每周节省至少半天时间。核心洞察包括:创业者获益最高,设计师感知最弱;工程师正从 GitHub Copilot 转向 Cursor 和 Claude Code;PM 开始利用 AI 跨界完成原型设计。报告明确指出,未来 AI 的机会点在于从内容生产向前期探索和战略思考迁移。

宝玉的分享
baoyu.io
12-24
3840 字 · 约 16 分钟
93
蒸汽、钢铁与无限的大脑

Notion 创始人 Ivan Zhao 从历史维度解读 AI 变革。文章将 AI 类比为继蒸汽和钢铁之后的"无限大脑",从个人、组织和经济体三个层面分析其影响。在个人层面,AI 智能体让程序员从"10 倍工程师"跃升为"30-40 倍工程师",但普及到通用知识工作需解决上下文碎片化和可验证性难题。在组织层面,AI 如同钢铁般加固组织架构,如蒸汽机般释放生产力,帮助企业突破传统沟通瓶颈实现真正的规模化。在经济体层面,知识经济将从"人类尺度"的佛罗伦萨演进为"超级都市"般的东京,形成跨时区、高密度运作的新模式。文章核心观点:我们需要停止将 AI 仅视为"副驾驶",而应重新想象整个工作方式。

51CTO技术栈
mp.weixin.qq.com
12-21
11072 字 · 约 45 分钟
93
Gemini 负责人:Pro 的主要作用是蒸馏 Flash!最大突破空间在后训练;Noam、Jeff Dean:持续学习是重要改进方向

Google DeepMind 三位 Gemini 联合技术负责人罕见同台对话,深度揭秘 Gemini 3 背后的技术哲学。访谈透露了几个关键信息:Flash 模型已能达到甚至超越上一代 Pro 水平,Pro 的主要作用变成了蒸馏 Flash;后训练被认为是当前最大的突破空间;延迟和速度的价值被严重低估,在实际应用中甚至比绝对智能更重要。团队还强调,代码、推理、数学领域已基本击穿,下一步重点是开放式任务和持续学习能力。

Founder Park
mp.weixin.qq.com
12-24
6340 字 · 约 26 分钟
92
谷歌今年最成功的两款 AI 应用,都出自他手

文章聚焦谷歌 Gemini 应用负责人 Josh Woodward,揭秘他如何带领团队在 8 个月内实现用户数翻倍。核心观点包括:通过 5-7 人的极小团队实现快速迭代;建立 block 系统突破大公司官僚障碍;将 AI 从搜索引擎进化为深度理解用户私有数据的内容容器;并预言 AI 交互将从对话框演变为动态生成的交互界面。

127. 大模型季报跨年对谈:和广密预言 AI War 的两大联盟、第三范式 Online Learning

这期年度对谈是理解 2025 年全球 AI 竞争格局的必听内容。广密提出了一个关键判断:这不是 AI 泡沫,而是 AI 战争——一场科技巨头和国家都输不起的军备竞赛。播客深度解析了英伟达 GPU 和谷歌 TPU 两大阵营的竞争态势,揭示了 OpenAI、Anthropic、Google 三家领先模型交替领先的底层原因。最重要的是,他们预判 Online Learning 将成为继预训练和强化学习之后的第三个核弹级范式,并提出了从集中到分散的投资组合调整策略。对于关注 AI 投资和技术趋势的从业者来说,这期播客提供了难得的一线洞察。

Y Combinator
youtube.com
12-22
7728 字 · 约 31 分钟
92
2025 年的 AI 领域:五大意外发现

Y Combinator 合伙人深度复盘 2025 年 AI 领域的意外转折。数据显示,YC 创业公司的模型偏好已从 OpenAI 转向 Anthropic,后者在代码相关任务上表现更优。更值得关注的是,初创公司正通过模型编排层实现套利,针对不同任务动态选择最优模型。播客还探讨了 AI 经济企稳的信号、基础设施投资的长期价值,以及为何单人独角兽仍未成为现实。

    BestBlogs.dev 第 78 期:无限大脑 | BestBlogs.dev