BestBlogs.dev 精选文章第 52 期

大家好！欢迎查收 BestBlogs.dev 为您准备的第 52 期 AI 精选。本周 AI 领域的风向标，正从模型层悄然转向开发范式与应用架构。Andrej Karpathy 提出的软件 3.0 概念为行业带来深刻启发，将提示词定义为新时代的程序；与此同时，围绕多智能体系统的构建方法论，OpenAI 、Anthropic 等多家机构也分享了宝贵的一线经验。这场关于 AI 如何重塑软件的讨论，正在全面展开！

🚀 模型与研究亮点：

💥 国内大模型开源竞赛升温，MiniMax 发布支持百万上下文的 M1 模型，而月之暗面则推出刷新编程榜单 SOTA 的 Kimi-Dev-72B 模型。
✨ Google 更新 Gemini 2.5 模型系列，Gemini 2.5 Pro 与 Flash 进入稳定版，并推出专为高吞吐量任务设计的预览版 Gemini 2.5 Flash-Lite 。
☁️ 华为云发布盘古大模型 5.5 ，通过 Pangu DeepDiver 技术提升搜索增强效果，并展示其在工业场景的深度落地应用。
🔬 如何打开大模型的“黑箱”？文章深入探讨了 AI 可解释性的四大技术路径，包括自动化解释、特征可视化和机制可解释性等前沿研究。
🧠 OpenAI 研究员 Noam Brown 提出 AI 规模化的下一个前沿：测试时计算，即在推理时投入更多算力以显著提升模型能力。
🎓 MIT 工程师整理的 50 个 LLM 面试题走红，为技术爱好者提供了系统性理解 LLM 核心架构与关键技术的结构化框架。

🛠️ 开发与工具精粹：

🔄 Andrej Karpathy 提出软件 3.0 新范式，将提示词视为程序，并探讨了 LLM 表现出的心理学特性与系统性提示词学习的必要性。
🤝 OpenAI 发布构建 AI 智能体实用指南，详细阐述了模型、工具和指令三大基石，并提出了从单一智能体到多智能体系统的演进路径。
🔥 Anthropic 公开其基于 Claude 构建多智能体系统的经验，揭示了 token 消耗是性能的关键驱动力，并分享了有效的提示工程与评估方法。
🔗 LangChain 博客探讨了构建多智能体系统的时机与方法，强调了上下文工程的重要性以及使用 LangGraph 和 LangSmith 等工具应对工程挑战。
💡 从实习生视角看 RAG 与 Agent，腾讯技术工程文章以幽默笔触分享了从零到一的实战经验，详解了优化 RAG 和构建高性能 Agent 的关键环节。
📜 万字长文解读 LLM 应用的十大生存法则，为开发者构建可靠、高效、可扩展的 LLM 应用提供了全面的系统设计和工程实践指南。

💡 产品与设计洞见：

🌐 为什么通用 Agent 的下一站是 Agentic Browser ？深度分析认为，浏览器因其能获取跨应用的全链路上下文，是通用 Agent 的天然载体。
🖱️ AI 原生浏览器 Dia 全方位实测，其无需插件即可与网页直接对话交互的体验，在信息整合与内容创作方面展示了强大潜力。
✍️ AI 会议纪要工具赛道新星 Granola 崭露头角，其独特之处在于用 AI 辅助和增强人工笔记，而非完全替代人类思考。
🚀 对话探讨 Agent 的真问题与真机会，深入剖析了从 Copilot 到 Agent 的务实成长路径、评估标准及创新的商业模式。
🏆 斩获苹果设计奖的 Capwords 等多款 AI 英语学习 App 脑洞大开，展示了 AI 如何通过具象化记忆等方式重塑语言学习体验。
📊 实测证明 MiniMax Agent 在制作 PPT 方面表现出色，通过精细的任务拆解和多模态搜索能力，能生成可直接交付的高质量内容。

📰 资讯与报告前瞻：

🗣️ Sam Altman 最新万字访谈，展望未来理想的硬件形态是无处不在的 AI 伴侣，并强调构建完整AI 工厂供应链的重要性。
🌍 李飞飞深度解读创办 World Labs 的初衷：无所畏惧地解决空间智能问题，因为没有空间智能，AI 将是不完整的。
📈 播客热议 2025 年中 AI 行业共识，指出 Agent、浏览器战场化已成定局，并分析了合成数据、模型互评等技术新趋势与投资机会。
👓 智能眼镜公司 Rokid 创始人祝铭明分享十一年硬件创业历程，阐述了 AR 眼镜作为 AI 时代理想硬件载体的底层逻辑与未来形态。
▶️ Google 又行了？播客圈深度探讨 Google 如何凭借 Gemini 2.5 Pro 和 Veo3 视频模型等技术突破，成功扭转行业印象，实现王者归来。
🤔 《人类简史》作者尤瓦尔·赫拉利怒怼硅谷，警示智能不等于真理，AI 的变革速度远超社会适应能力，呼吁重建社会信任以引导 AI 发展。

希望本期的精选内容能为您带来启发。我们下周再见！

本期播客围绕近期谷歌 IO 大会进行深度探讨，评估谷歌在 AI 领域的最新进展及其对行业格局的影响。嘉宾们一致认为，谷歌通过此次大会成功扭转了此前在 AI 赛道上的“落后”印象，凭借 Gemini 2.5 Pro、Veo3 视频生成模型等技术突破，以及将 AI 深度整合进搜索、Gmail、Chrome 等核心产品生态的战略，展现了其强大的技术实力和产品创新能力，实现了“王者归来”。讨论分析了 Veo3 模型在视频生成（特别是原生音频方面）的颠覆性进展及其对内容创作和后期制作的影响。同时，播客探讨了 AI 技术对传统搜索模式的冲击，谷歌如何在保持核心优势的同时进行自我革新。嘉宾们还对比了中美在 AI 大模型技术（如推理模型）研发路径上的差异和相互影响，并对 AI 时代的技术趋势（Agent、Coding、多模态）和创业方向（硬件入口、细分场景应用、服务化）进行了分析和展望，强调了适应技术变革和产品化能力的重要性。整期播客呈现了对谷歌 AI 战略、前沿技术应用及未来行业发展的全面、深入且专业的探讨。

BestBlogs.dev 精选文章第 52 期

🚀 模型与研究亮点：

🛠️ 开发与工具精粹：

💡 产品与设计洞见：

📰 资讯与报告前瞻：

📑 目录

同一天开源新模型，一推理一编程，MiniMax 和月之暗面开卷了｜机器之心

Gemini 2.5：我们的思维模型系列更新

拿了火星图片的华为云盘古大模型，这样在地球落地

从黑箱到显微镜：大模型可解释性的现状与未来

将测试时间计算规模化至多智能体文明：Noam Brown

信息过载时代，如何真正「懂」LLM？从 MIT 分享的 50 个面试题开始｜机器之心

Andrej Karpathy 谈软件 3.0：AI 时代的软件

多智能体在「燃烧」Token！Anthropic 公开发现的一切｜机器之心

OpenAI: 构建 AI 智能体实用指南

如何以及何时构建多智能体系统

鹅厂实习生血泪贴：Agent/RAG 黑科技，真相竟是这样！

深度拆解：为什么通用 Agent 的下一站是 Agentic Browser？

全方位实测首个 AI 原生浏览器！618 比价、写高考作文…网友：再见 Chrome

Granola：ChatGPT、Notion 都入场的 AI 纪要，能真正沉淀工作流吗？

张鹏对谈李广密：Agent 的真问题与真机会，究竟藏在哪里？

他为女儿做的 AI 应用拿到了苹果设计奖，我还挖出了这些脑洞清奇的英语 App

我用 MiniMax Agent 做 PPT，实在太爽了

Sam Altman 最新万字对谈：理想硬件形态是 AI 伴侣，就业冲击没那么可怕

深度｜李飞飞：创办 World Labs 的初衷，就是想无所畏惧地解决空间智能问题，没有空间智能，AI 将是不完整的

Vol.64 40 页 PPT 记录 2025 年中 AI 行业共识

104. 和 Rokid 祝铭明聊，吴妈、阿里、硬件创业黑森林的第 11 年

Vol.65 AI 新时代，Google 又行了？

《人类简史》作者怒怼硅谷：智能≠真理，AI 正在走偏！

BestBlogs.dev 精选文章 第 52 期

🚀 模型与研究亮点：

🛠️ 开发与工具精粹：

💡 产品与设计洞见：

📰 资讯与报告前瞻：

📑 目录

BestBlogs.dev 精选文章第 52 期