BestBlogs.dev 精选文章 第 52 期

大家好!欢迎查收 BestBlogs.dev 为您准备的第 52 期 AI 精选。本周 AI 领域的风向标,正从模型层悄然转向开发范式与应用架构。Andrej Karpathy 提出的 软件 3.0 概念为行业带来深刻启发,将提示词定义为新时代的程序;与此同时,围绕多智能体系统的构建方法论,OpenAIAnthropic 等多家机构也分享了宝贵的一线经验。这场关于 AI 如何重塑软件的讨论,正在全面展开!

🚀 模型与研究亮点:

  • 💥 国内大模型开源竞赛升温,MiniMax 发布支持百万上下文的 M1 模型,而月之暗面则推出刷新编程榜单 SOTA 的 Kimi-Dev-72B 模型。
  • Google 更新 Gemini 2.5 模型系列,Gemini 2.5 ProFlash 进入稳定版,并推出专为高吞吐量任务设计的预览版 Gemini 2.5 Flash-Lite
  • ☁️ 华为云发布 盘古大模型 5.5 ,通过 Pangu DeepDiver 技术提升搜索增强效果,并展示其在工业场景的深度落地应用。
  • 🔬 如何打开大模型的“黑箱”?文章深入探讨了 AI 可解释性的四大技术路径,包括自动化解释、特征可视化和机制可解释性等前沿研究。
  • 🧠 OpenAI 研究员 Noam Brown 提出 AI 规模化的下一个前沿:测试时计算,即在推理时投入更多算力以显著提升模型能力。
  • 🎓 MIT 工程师整理的 50 个 LLM 面试题走红,为技术爱好者提供了系统性理解 LLM 核心架构与关键技术的结构化框架。

🛠️ 开发与工具精粹:

  • 🔄 Andrej Karpathy 提出 软件 3.0 新范式,将提示词视为程序,并探讨了 LLM 表现出的心理学特性与系统性提示词学习的必要性。
  • 🤝 OpenAI 发布构建 AI 智能体实用指南,详细阐述了模型、工具和指令三大基石,并提出了从单一智能体到多智能体系统的演进路径。
  • 🔥 Anthropic 公开其基于 Claude 构建多智能体系统的经验,揭示了 token 消耗是性能的关键驱动力,并分享了有效的提示工程与评估方法。
  • 🔗 LangChain 博客探讨了构建多智能体系统的时机与方法,强调了上下文工程的重要性以及使用 LangGraphLangSmith 等工具应对工程挑战。
  • 💡 从实习生视角看 RAG 与 Agent,腾讯技术工程文章以幽默笔触分享了从零到一的实战经验,详解了优化 RAG 和构建高性能 Agent 的关键环节。
  • 📜 万字长文解读 LLM 应用的十大生存法则,为开发者构建可靠、高效、可扩展的 LLM 应用提供了全面的系统设计和工程实践指南。

💡 产品与设计洞见:

  • 🌐 为什么通用 Agent 的下一站是 Agentic Browser ?深度分析认为,浏览器因其能获取跨应用的全链路上下文,是通用 Agent 的天然载体。
  • 🖱️ AI 原生浏览器 Dia 全方位实测,其无需插件即可与网页直接对话交互的体验,在信息整合与内容创作方面展示了强大潜力。
  • ✍️ AI 会议纪要工具赛道新星 Granola 崭露头角,其独特之处在于用 AI 辅助和增强人工笔记,而非完全替代人类思考。
  • 🚀 对话探讨 Agent 的真问题与真机会,深入剖析了从 CopilotAgent 的务实成长路径、评估标准及创新的商业模式。
  • 🏆 斩获苹果设计奖的 Capwords 等多款 AI 英语学习 App 脑洞大开,展示了 AI 如何通过具象化记忆等方式重塑语言学习体验。
  • 📊 实测证明 MiniMax Agent 在制作 PPT 方面表现出色,通过精细的任务拆解和多模态搜索能力,能生成可直接交付的高质量内容。

📰 资讯与报告前瞻:

  • 🗣️ Sam Altman 最新万字访谈,展望未来理想的硬件形态是无处不在的 AI 伴侣,并强调构建完整AI 工厂供应链的重要性。
  • 🌍 李飞飞 深度解读创办 World Labs 的初衷:无所畏惧地解决空间智能问题,因为没有空间智能,AI 将是不完整的。
  • 📈 播客热议 2025 年中 AI 行业共识,指出 Agent、浏览器战场化已成定局,并分析了合成数据、模型互评等技术新趋势与投资机会。
  • 👓 智能眼镜公司 Rokid 创始人祝铭明分享十一年硬件创业历程,阐述了 AR 眼镜作为 AI 时代理想硬件载体的底层逻辑与未来形态。
  • ▶️ Google 又行了?播客圈深度探讨 Google 如何凭借 Gemini 2.5 ProVeo3 视频模型等技术突破,成功扭转行业印象,实现王者归来。
  • 🤔 《人类简史》作者尤瓦尔·赫拉利怒怼硅谷,警示智能不等于真理,AI 的变革速度远超社会适应能力,呼吁重建社会信任以引导 AI 发展。

希望本期的精选内容能为您带来启发。我们下周再见!

1

同一天开源新模型,一推理一编程,MiniMax 和月之暗面开卷了 | 机器之心

机器之心jiqizhixin.com06-174044 字 (约 17 分钟)AI 评分: 93 🌟🌟🌟🌟🌟
同一天开源新模型,一推理一编程,MiniMax 和月之暗面开卷了 | 机器之心

文章报道了国内 AI 领域两大厂商 MiniMax 和月之暗面在同一天分别开源了各自的新模型。MiniMax 开源了长上下文推理 LLM MiniMax-M1,该模型支持全球最长的 100 万 token 上下文输入和 8 万 token 输出,并声称具有开源模型中最强的智能体工具使用能力。文章详细介绍了其基于 MoE 与闪电注意力机制的架构、创新的 CISPO 强化学习算法及在编程、长上下文等基准测试中的优异表现。月之暗面则发布了专注于编程的开源大模型 Kimi-Dev-72B,该模型在代码生成基准 SWE-bench Verified 上刷新了开源模型的 SOTA 记录。文章阐述了其 BugFixer 与 TestWriter 协作机制、中期训练及基于结果的强化学习、测试时自博弈等技术细节。文末通过一个代码实测案例对比了两模型的初步表现,并提供了各自的开源地址及未来计划。

2

Gemini 2.5:我们的思维模型系列更新

Google DeepMind Blogdeepmind.google06-17677 字 (约 3 分钟)AI 评分: 94 🌟🌟🌟🌟🌟
Gemini 2.5:我们的思维模型系列更新

本文详细介绍了 Google Gemini 2.5 模型系列的最新更新。文章宣布 Gemini 2.5 Pro 和 Gemini 2.5 Flash 已全面可用且稳定,并指出与最近的预览版相比没有变化。新模型 Gemini 2.5 Flash-Lite 以预览版形式推出,提供最低延迟和成本,专为分类和摘要等高吞吐量任务设计。文章解释了将 Gemini 2.5 模型视为具有可调思维预算的“思维模型”的概念。文章还概述了 Gemini 2.5 Flash 的更新定价,并强调了 Gemini 2.5 Pro 的巨大需求和使用量,特别是在编码和智能体任务方面,展示了其与流行开发者工具的集成。文章提供了较旧预览模型的弃用日期,以指导用户迁移。

3

拿了火星图片的华为云盘古大模型,这样在地球落地

量子位qbitai.com06-203718 字 (约 15 分钟)AI 评分: 92 🌟🌟🌟🌟🌟
拿了火星图片的华为云盘古大模型,这样在地球落地

文章详细介绍了华为云在 HDC 2025 大会上发布的盘古大模型 5.5 系列升级,涵盖 NLP、多模态、预测、科学计算和 CV 五大基础模型。重点阐述了盘古 NLP 模型的两项核心技术:提升搜索增强效果的 Pangu DeepDiver(基于 SIS 技术)和创新的多层次幻觉防御及闭环质量保证体系。此外,文章还介绍了全新盘古多模态世界模型在 4D 空间生成方面的能力,以及盘古预测模型(Triplet Transformer 架构)和盘古 CV 模型(MoE 架构)的升级。最后,通过农业科学发现大模型、海螺集团水泥生产优化、中国石油装备制造缺陷识别等多个具体案例,展示了盘古大模型在实际工业场景中的深度应用和取得的显著成效,并提及华为云 ModelArts Studio 平台提供的端到端开发工具链,旨在帮助企业高效实现行业智能化。

4

从黑箱到显微镜:大模型可解释性的现状与未来

腾讯研究院mp.weixin.qq.com06-179061 字 (约 37 分钟)AI 评分: 91 🌟🌟🌟🌟🌟
从黑箱到显微镜:大模型可解释性的现状与未来

文章深入探讨了在当前大模型能力飞速提升背景下,提升 AI 可解释性所面临的挑战及重要性。由于大模型的“黑箱”特性,理解其决策机制异常困难,这带来了价值偏离、不良行为、滥用风险等问题。文章详细介绍了当前破解“黑箱”的四大技术路径:自动化解释(如 GPT-4 解释 GPT-2 神经元)、特征可视化(稀疏自编码器提取抽象概念)、思维链监控(事后追踪推理过程)和机制可解释性(“AI 显微镜”动态复原电路)。同时,文章也指出了神经元多重语义、解释普适性不足、人类认知局限等技术瓶颈。文章强调,人们正处于可解释性研究与模型智能发展之间的竞赛中,必须加快脚步。最后,文章对未来 AI 核磁共振、标准化评估体系、个性化解释等趋势进行了展望,呼吁加强研究投入并采取审慎的监管策略。

5

将测试时间计算规模化至多智能体文明:Noam Brown

Latent Spacelatent.space06-1921084 字 (约 85 分钟)AI 评分: 91 🌟🌟🌟🌟🌟
将测试时间计算规模化至多智能体文明:Noam Brown

本文重点介绍了 OpenAI 首席研究员 Noam Brown 的播客访谈要点,该访谈聚焦于 AI 规模化的下一个前沿。Brown 认为,随着像 GPT-4 这样的模型出现,该领域现在正处于测试时间规模化的时代,在此阶段,在推理过程中投入更多计算资源能够显著提升推理能力。他讨论了推理如何改善 AI 对齐,以及如何泛化到超出具有易于可验证奖励的任务之外的场景。访谈还深入探讨了多智能体系统,将其与人类文明通过合作与竞争发展的方式进行类比,表明 AI 遵循类似路径可能带来远超当前限制的能力。Brown 强调,他们在多智能体系统方面的方法遵循‘苦涩的教训’(Bitter Lesson) 原则,即侧重于规模化而非启发式方法。最后,文章探讨了规模化测试时间计算的挑战(成本、实际时间),并对比了自博弈在简单零和博弈与复杂开放式环境中的有效性,强调需要新的范式,而不仅仅是规模化现有方法。

6

信息过载时代,如何真正「懂」LLM?从 MIT 分享的 50 个面试题开始 | 机器之心

机器之心jiqizhixin.com06-188946 字 (约 36 分钟)AI 评分: 92 🌟🌟🌟🌟🌟
信息过载时代,如何真正「懂」LLM?从 MIT 分享的 50 个面试题开始 | 机器之心

文章基于 MIT CSAIL 工程师 Hao Hoang 整理的 50 个大语言模型(LLM)面试问题,为专业人士和 AI 爱好者 提供了系统性学习和理解 LLM 的结构化框架。内容涵盖 LLM 的核心架构、训练与微调方法、文本生成与推理技术、数学原理、高级模型以及面临的挑战与伦理问题。通过问答形式,文章清晰地解释了 tokenization、注意力机制、PEFT、RAG、CoT 等关键概念,并为每个主题推荐了经典论文作为延伸阅读,旨在帮助技术从业者建立对 LLM 的全面认知。

7

Andrej Karpathy 谈软件 3.0:AI 时代的软件

Latent Spacelatent.space06-171413 字 (约 6 分钟)AI 评分: 95 🌟🌟🌟🌟🌟
Andrej Karpathy 谈软件 3.0:AI 时代的软件

本文综合了 Andrej Karpathy 最近在 YC AI Startup School 关于软件 3.0 的演讲观点,由作者根据可获得的推文和笔记整理而成。它更新了软件 2.0 的概念,提出软件 3.0(其中提示词是使用 LLM 的程序)正在显著影响和取代早期的范式。文章探讨了 LLM 的类比(实用程序、算力工厂、操作系统),并深入研究了它们涌现出的“心理学”,重点介绍了诸如“锯齿状智能”和“顺行性遗忘”等问题。文章提出“系统提示词学习”作为 LLM 获取问题解决知识的潜在解决方案。此外,文章讨论了 AI 产品 中需要“自主性滑块”,并强调软件开发(包括文档)必须发展以适应 AI 智能体 作为一类新的数字信息消费者,从而弥合演示和可靠产品之间的差距。

8

多智能体在「燃烧」Token!Anthropic 公开发现的一切 | 机器之心

机器之心jiqizhixin.com06-146766 字 (约 28 分钟)AI 评分: 94 🌟🌟🌟🌟🌟
多智能体在「燃烧」Token!Anthropic 公开发现的一切 | 机器之心

文章深入探讨了 Anthropic 基于 Claude 模型构建多智能体研究系统的方法和经验。核心采用“协调者-执行者”架构,主导智能体分配任务给并行运行的子智能体,以应对复杂、开放式研究问题。研究表明,token 消耗是智能体性能的关键驱动因素,多智能体系统通过并行消耗 token 显著提升了处理能力,但成本也随之增加。文章详细分享了有效的提示词工程原则(如分工、分级投入、工具设计)和评估方法(从小样本、LLM 评审官、人工评估),并讨论了有状态智能体的调试、部署和同步/异步执行等工程挑战。总结强调了将原型转化为可靠生产系统所需的工程投入。

9

OpenAI: 构建 AI 智能体实用指南

宝玉的分享baoyu.io06-1713786 字 (约 56 分钟)AI 评分: 94 🌟🌟🌟🌟🌟
OpenAI: 构建 AI 智能体实用指南

文章深度分析了 OpenAI 发布的《构建 AI 智能体实用指南》,首先明确了 AI 智能体作为能够自主代理用户完成任务的新型软件范式,区别于传统工具。接着,详细论述了最适合应用智能体的三类复杂场景:复杂决策、难以维护的规则系统及非结构化数据处理。文章的核心部分阐述了智能体的三大基石:模型(LLM 作为大脑)、工具(连接外部世界的双手)和指令(行为准则),并强调了它们之间的关注点分离优势。在架构与编排方面,推荐从简单的单一智能体入手,根据需求逐步演进至多智能体系统,并介绍了主管模式和去中心化模式。最后,重点强调了生产级智能体的安全可靠性,提出了分层防御体系(如分类器、过滤器、工具风险评估)和必要的人工监督干预(HITL)机制。整篇文章结构清晰,为技术从业者提供了构建实用 AI 智能体的全面方法论。

10

如何以及何时构建多智能体系统

LangChain Blogblog.langchain.dev06-161523 字 (约 7 分钟)AI 评分: 93 🌟🌟🌟🌟🌟
如何以及何时构建多智能体系统

本文探讨了 Cognition 和 Anthropic 近期博文关于构建多智能体系统的见解。它强调了两个核心要点:上下文工程在协调智能体中的关键重要性 和 难度,以及观察到专注于“读取”任务的多智能体系统比专注于“写入”任务的系统在管理上固有地更简单,这归因于并行化 和 输出合并的挑战。此外,文章讨论了复杂智能体系统共有的重要的生产可靠性 和 工程挑战,包括持久化执行、错误处理、调试、可观测性 和 评估。它表明需要专用工具来解决这些通用问题,并引用了 LangGraph(用于编排)和 LangSmith(用于调试 和 评估)等框架。文章总结认为,多智能体系统对于涉及广度优先查询、高并行化、大上下文窗口 和 高价值的任务特别有效,在这些任务中它们能够证明增加的复杂性 和 成本是合理的。

11

鹅厂实习生血泪贴:Agent/RAG 黑科技,真相竟是这样!

腾讯技术工程mp.weixin.qq.com06-1614106 字 (约 57 分钟)AI 评分: 93 🌟🌟🌟🌟🌟
鹅厂实习生血泪贴:Agent/RAG 黑科技,真相竟是这样!

本文结合鹅厂实习生的亲身实践经验,以“血泪史”的幽默笔触,深入浅出地介绍了检索增强生成(RAG)和智能体(Agent)两大 AI 前沿技术。文章首先剖析了 RAG 如何解决大语言模型(LLM)的“幻觉”问题,详细解释了 RAG 的工作流程、评估指标(召回率、忠实度)及其优化策略(知识库、检索、生成)。接着,文章引入了智能体(Agent)的概念,梳理了其历史演进和 OpenAI 的五级分类,并重点阐述了基于大模型的 Agent 的核心原理、组成部分(LLM、工具调用、规划、记忆)和工作流程。文中结合实际案例(如 RAGAS 评估框架、PDF 文档解析工具对比、记忆机制的实现)提供了可操作的实践参考,并强调了规划(如 ReAct, Reflexion 框架)和记忆(如 MIPS, HNSW)在构建高性能 Agent 中的重要性。整体内容旨在帮助技术从业者理解并快速应用 Agent 和 RAG,特别从实战角度分享了经验。

12

深度拆解:为什么通用 Agent 的下一站是 Agentic Browser?

Founder Parkmp.weixin.qq.com06-149358 字 (约 38 分钟)AI 评分: 93 🌟🌟🌟🌟🌟
深度拆解:为什么通用 Agent 的下一站是 Agentic Browser?

文章探讨了 Agentic Browser 作为通用 AI Agent 下一站的可能性。指出当前操作系统和传统浏览器通过生态霸权和数据壁垒限制了通用 Agent 的发展和能力发挥,如 Perplexity 遭遇的困境所示。作者区分了通用 Agent、AI 搜索、AI 浏览器和 Agentic Browser,强调 Agentic Browser 的核心在于“代替用户行动”而非仅仅“辅助浏览”。详细阐述了浏览器在获取用户跨应用、全链路上下文(深度和广度)方面的独特优势,以及通过与本地操作系统深度集成实现资源控制和复杂工作流自动化的潜力。文章认为,浏览器因其内容通用性、用户习惯和跨应用能力,是通用 Agent 的天然载体,并展望 Agentic Browser 未来可能演进为 AI 操作系统(AIOS)甚至催生定制化硬件生态,具备挑战现有巨头的潜力。最后预测 OpenAI 可能推出自己的 Agentic Browser。

13

全方位实测首个 AI 原生浏览器!618 比价、写高考作文…网友:再见 Chrome

量子位qbitai.com06-153108 字 (约 13 分钟)AI 评分: 92 🌟🌟🌟🌟🌟
全方位实测首个 AI 原生浏览器!618 比价、写高考作文…网友:再见 Chrome

本文深度实测了由 The Browser Company 推出的首个 AI 原生浏览器 Dia。其核心亮点在于无需额外插件或复制粘贴,AI 能自动获取网页上下文,用户可直接与网页进行对话、提问和指令交互。文章通过比价、旅行规划、高考作文写作、视频总结等多个实际场景演示了 Dia 在信息整合、跨页对比和内容创作方面的强大能力和流畅体验,并提及了其前身 Arc 浏览器及其设计理念的转变。文章分析了 Dia 易于上手的特点,但也指出了当前测试版本中存在的如时间戳不稳定等小问题,且目前仅支持 MacOS。最后介绍了开发公司及其创始人的背景和愿景,认为 Dia 代表了未来浏览器的发展方向。

14

Granola:ChatGPT、Notion 都入场的 AI 纪要,能真正沉淀工作流吗?

海外独角兽mp.weixin.qq.com06-1710429 字 (约 42 分钟)AI 评分: 91 🌟🌟🌟🌟🌟
Granola:ChatGPT、Notion 都入场的 AI 纪要,能真正沉淀工作流吗?

文章深入分析了当前快速发展的 AI 会议纪要工具市场。指出会议对话是 LLM 和 Agent 所需的高价值上下文,推动了大量 AI 纪要工具的兴起。文章对现有市场玩家进行了分类,包括公司自建、上下游软件内置、第三方软件和硬件,并对比了它们的功能和优劣势。重点介绍了后起之秀 Granola,其核心创新在于提供 AI 补充人工笔记的功能,区别于多数产品的 AI 直接生成模式,强调 AI 应增强而非替代人类思考。文章探讨了用户对 AI 纪要工具最看重的集成性和准确性,并深入分析了 Granola 的独特产品理念、用户拓展策略和经营现状。同时,也指出了 Granola 面临的主要挑战,如用户工作流习惯、技术壁垒相对较低以及来自 OpenAI 等通用模型巨头的竞争。总体而言,文章对 AI 纪要赛道和 Granola 进行了全面且有深度的分析。

15

张鹏对谈李广密:Agent 的真问题与真机会,究竟藏在哪里?

Founder Parkmp.weixin.qq.com06-1412915 字 (约 52 分钟)AI 评分: 92 🌟🌟🌟🌟🌟
张鹏对谈李广密:Agent 的真问题与真机会,究竟藏在哪里?

本文是一篇关于 AI Agent 的深度对谈,邀请拾象科技创始人李广密和 AI Research Lead 钟凯祺,共同剖析 Agent 热潮下的真问题与真机会。讨论覆盖 Agent 的产品形态(通用与垂直、Model as Agent)、务实成长路径(从 Copilot 到 Agent,以 Cursor 为例)、Coding 作为通往 AGI 关键试炼场的逻辑、评估好 Agent 的标准(数据飞轮、Agent Native、效率、成本、用户粘性)、商业模式创新(从成本到价值、按次/工作流/结果/Agent 付费)以及人与 Agent 的协作关系(Human in/on the loop)。对话还探讨了 Agent 基础设施的机会(环境、上下文、工具、安全)以及巨头(OpenAI、Anthropic、Google、Microsoft)在 Agent 领域的布局与分化。最后展望了多模态、自主学习、记忆机制和新交互作为 AI 未来关键技术台阶,指出 AI 产品正从工具走向关系。

16

他为女儿做的 AI 应用拿到了苹果设计奖,我还挖出了这些脑洞清奇的英语 App

爱范儿ifanr.com06-176382 字 (约 26 分钟)AI 评分: 90 🌟🌟🌟🌟
他为女儿做的 AI 应用拿到了苹果设计奖,我还挖出了这些脑洞清奇的英语 App

文章探讨了 AI 对语言学习的改变,并着重介绍了 Capwords、Read Easy、Para 翻译这三款 AI 加持的创新英语辅助工具。这三款产品脑洞清奇,代表了不同的创新方向:Capwords 通过图像识别将单词与生活场景关联,强调记忆的具象性;Read Easy 采用中英对照和文内标注,旨在帮助用户在理解译文的同时更贴近原文;Para 翻译则利用画中画实现无缝的全局翻译体验。通过与开发者对话,文章揭示了这些产品设计背后的理念:利用 AI 降低语言门槛,重塑用户与语言之间的关系,强调实用性、沉浸感和用户体验的优化,而非单纯的技术堆砌或死记硬背。

17

我用 MiniMax Agent 做 PPT,实在太爽了

沃垠AImp.weixin.qq.com06-173400 字 (约 14 分钟)AI 评分: 91 🌟🌟🌟🌟🌟
我用 MiniMax Agent 做 PPT,实在太爽了

文章对比了传统 AI 生成 PPT 的局限性,提出了 MiniMax Agent 作为新范式,通过详细的任务分解、深度研究和多模态搜索能力,能够生成高质量、审美在线的 PPT。作者通过制作《流浪地球 3》剧情介绍 PPT、电商营销方案、章北海人物志、AI 人类体验网页、今日热搜播客等多个实测案例,展示了 MiniMax Agent 在低幻觉、信息检索、内容生成、多格式输出和自检等方面的强大能力。文章认为 MiniMax Agent 是少有的能做到可交付水准的 Agent 产品,并看好 MiniMax 在 Agent 领域的布局和发展。

18

Sam Altman 最新万字对谈:理想硬件形态是 AI 伴侣,就业冲击没那么可怕

爱范儿ifanr.com06-1812418 字 (约 50 分钟)AI 评分: 91 🌟🌟🌟🌟🌟
Sam Altman 最新万字对谈:理想硬件形态是 AI 伴侣,就业冲击没那么可怕

文章记录了 Sam Altman 与弟弟 Jack Altman 关于未来 5 到 10 年 AI 发展的深度对谈。Sam Altman 预测 AI 将具备自主科研能力,甚至发现新科学;人形机器人虽有机械工程难题,但未来有望实现;他认为人类对超级智能的适应能力将超出想象,并能快速创造新的工作角色,无需过度担忧大规模失业。OpenAI 的理想消费者产品形态是无处不在的“AI 伴侣”,通过多样化设备和接口提供帮助。Altman 强调构建完整的“AI 工厂”供应链(包括能源解决方案)的重要性。他也回应了 Meta 的竞争,认为 OpenAI 的优势在于其以创新为核心的文化。对谈展现了 Altman 对技术未来的乐观判断及对 OpenAI 使命的坚持。

19

深度|李飞飞:创办 World Labs 的初衷,就是想无所畏惧地解决空间智能问题,没有空间智能,AI 将是不完整的

Z Potentialsmp.weixin.qq.com06-158884 字 (约 36 分钟)AI 评分: 91 🌟🌟🌟🌟🌟
深度|李飞飞:创办 World Labs 的初衷,就是想无所畏惧地解决空间智能问题,没有空间智能,AI 将是不完整的

本文是知名 AI 专家李飞飞的深度访谈,她阐述了创办 World Labs 的初衷——解决空间智能这一核心 AI 难题,并为此致力于构建 3D 世界模型,尽管面临数据和产品化等挑战。她强调空间智能即理解、推理、交互和生成 3D 世界的能力,认为它是人类和动物的核心智能,没有空间智能,AI 将是不完整的。访谈还深入讨论了机器人学作为高度多模态系统的重要性,尤其突出了触觉数据及其与视觉、感知、空间数据集成的重要性。李飞飞回顾了 ImageNet 的创立历程,分享了对 AI 研究突破的看法,并对年轻科学家和创业者提出了“无所畏惧”的建议。最后,她重申了以人为本的 AI 愿景,认为 AI 应作为增强人类、解决医疗等现实问题的工具。

20

Vol.64 40 页 PPT 记录 2025 年中 AI 行业共识

屠龙之术xiaoyuzhoufm.com06-16864 字 (约 4 分钟)AI 评分: 93 🌟🌟🌟🌟🌟
Vol.64 40 页 PPT 记录 2025 年中 AI 行业共识

本期播客由主播庄明浩基于其课程内容整理,聚焦 2025 年 6 月 AI 行业的技术、产品和资本三大核心主题。技术层面,讨论了 Agent(智能体)成为行业共识,推理模型(L2)能力持续提升,以及预训练、后训练和强化学习在模型能力进化中的作用,特别是合成数据和通过模型互评进行强化学习的新趋势。强调了中美在基础模型和开源生态上的激烈竞争。产品层面,分析了 AI 技术对产品形态的改变,特别是浏览器重新成为 AI 应用的战场,以及产品设计中“看见”(可视化 AI 执行过程)的重要性。从运营角度探讨了邀请码等推广策略的普遍现象。资本层面,揭示了 AI 公司估值随收入加速增长、并购频繁的现状,并探讨了 Agent 时代在推理模型、合成数据、工具调用、协议层及基础设施等方面的早期投资机会。播客整体结构清晰,内容涵盖广泛,提供了理解当前 AI 行业格局和未来趋势的多维度视角。

21

104. 和 Rokid 祝铭明聊,吴妈、阿里、硬件创业黑森林的第 11 年

张小珺Jùn|商业访谈录xiaoyuzhoufm.com06-15677 字 (约 3 分钟)AI 评分: 92 🌟🌟🌟🌟🌟
104. 和 Rokid 祝铭明聊,吴妈、阿里、硬件创业黑森林的第 11 年

本期节目深入访谈智能眼镜公司 Rokid 创始人祝铭明(Misa),梳理了他长达十一年的硬件创业历程。访谈从其首个操作系统公司被阿里巴巴收购的早期经历切入,分享了在资金极度困难时刻获得阿里投资的细节,以及在阿里内部参与云 OS 和 AI Lab(m lab)的探索与感悟。随后,重点聚焦第二次创业 Rokid 的历程,包括从哲学转向计算机的学习背景,公司初期在 AI 音箱方向的尝试及遇到的挑战(如大公司竞争、产品非平台属性),以及 2019 年决定 all in 转向 AR 眼镜赛道的关键决策过程。祝铭明详细阐述了 AR 眼镜作为 AI 时代理想硬件载体的底层逻辑,对比分析了中美市场对智能眼镜的产品定义差异,并描绘了 AI 与 AR 深度融合后个人智能设备的未来形态。同时,他也坦诚分享了创业过程中的团队调整、融资风格(依赖朋友和老上司信任)、与巨头竞争的策略、以及对杭州创业环境的看法,展现了在硬件“黑森林”中坚持梦想的韧性与智慧。

22

Vol.65 AI 新时代,Google 又行了?

屠龙之术xiaoyuzhoufm.com06-191033 字 (约 5 分钟)AI 评分: 92 🌟🌟🌟🌟🌟
Vol.65 AI 新时代,Google 又行了?

本期播客围绕近期谷歌 IO 大会进行深度探讨,评估谷歌在 AI 领域的最新进展及其对行业格局的影响。嘉宾们一致认为,谷歌通过此次大会成功扭转了此前在 AI 赛道上的“落后”印象,凭借 Gemini 2.5 Pro、Veo3 视频生成模型等技术突破,以及将 AI 深度整合进搜索、Gmail、Chrome 等核心产品生态的战略,展现了其强大的技术实力和产品创新能力,实现了“王者归来”。讨论分析了 Veo3 模型在视频生成(特别是原生音频方面)的颠覆性进展及其对内容创作和后期制作的影响。同时,播客探讨了 AI 技术对传统搜索模式的冲击,谷歌如何在保持核心优势的同时进行自我革新。嘉宾们还对比了中美在 AI 大模型技术(如推理模型)研发路径上的差异和相互影响,并对 AI 时代的技术趋势(Agent、Coding、多模态)和创业方向(硬件入口、细分场景应用、服务化)进行了分析和展望,强调了适应技术变革和产品化能力的重要性。整期播客呈现了对谷歌 AI 战略、前沿技术应用及未来行业发展的全面、深入且专业的探讨。

23

《人类简史》作者怒怼硅谷:智能≠真理,AI 正在走偏!

新智元mp.weixin.qq.com06-156601 字 (约 27 分钟)AI 评分: 91 🌟🌟🌟🌟🌟
《人类简史》作者怒怼硅谷:智能≠真理,AI 正在走偏!

本文是历史学家尤瓦尔·赫拉利在 Possible 播客中对人工智能的深度反思。赫拉利认为 AI 的崛起可能比文字发明更具历史意义,甚至标志着“无机生命”的开端。他警告,AI 的变革速度远超人类社会的“有机”适应能力,可能带来持续且剧烈的颠覆性冲击,其影响可能大于工业革命。他批判硅谷对智能的过度推崇,强调智能不等于追求真理的能力,缺乏意识的 AI 可能偏离人类价值观。赫拉利认为,重建社会信任和修正算法激励机制,而非仅仅依赖技术本身,是引导 AI 走向“善良”未来的关键。他呼吁人类通过实际行动示范正直和同情心,以此“养育”AI,避免反乌托邦的发生。