播客
本期播客由李广密对话阶跃星辰首席科学家张祥雨,深度剖析多模态人工智能的十年发展与未来趋势。张祥雨分享了个人在深度学习、模型 scaling 等方面的学术经历,并着重探讨了当前大型语言模型(LLM)在训练中遇到的“怪现象”:通用能力增强的同时,推理(特别是数学)能力反而可能下降。他分析了这与 Next Token Prediction 范式的本质缺陷相关,并介绍了 O 系列模型如何通过引入思维链(COT)有效解决这一问题。此外,访谈深入讨论了视觉与语言多模态融合在理解与生成一体化上的挑战,以及未来 AI 的两个潜在“GPT-4 时刻”:长上下文和模型的在线学习/自主学习,强调从自然界反馈学习的重要性。整期节目提供了顶尖科学家对前沿 AI 技术趋势的深刻洞察。
本期播客邀请前 OpenAI、Instagram、Uber、Facebook 等公司产品高管 Peter Deng,深度解析从 0 到 1 到规模化打造数十亿用户产品的关键。Peter 分享了在 Uber 学到的“产品本身没那么重要”的反直觉教训,强调用户消费的是整体体验。他认为伟大科技公司常基于现有技术有效应用而非纯技术突破。播客详细阐述了规模化阶段需建立系统性思维和增长团队的重要性。Peter 独创了五种产品经理类型框架,并分享了“六个月法则”等独特招聘秘诀,强调招聘互补型人才和成长型思维。他对 AI 颠覆教育的见解独到,认为未来提问能力和高阶抽象思维更重要。此外,他还讨论了 AI 创业护城河(独家数据和工作流整合)、AI 公司产品团队价值、向上管理技巧及从失败中学习的经验,为技术从业者提供了宝贵的实践指导和职业发展洞察。
本期播客由主播庄明浩基于其课程内容整理,聚焦 2025 年 6 月 AI 行业的技术、产品和资本三大核心主题。技术层面,讨论了 Agent(智能体)成为行业共识,推理模型(L2)能力持续提升,以及预训练、后训练和强化学习在模型能力进化中的作用,特别是合成数据和通过模型互评进行强化学习的新趋势。强调了中美在基础模型和开源生态上的激烈竞争。产品层面,分析了 AI 技术对产品形态的改变,特别是浏览器重新成为 AI 应用的战场,以及产品设计中“看见”(可视化 AI 执行过程)的重要性。从运营角度探讨了邀请码等推广策略的普遍现象。资本层面,揭示了 AI 公司估值随收入加速增长、并购频繁的现状,并探讨了 Agent 时代在推理模型、合成数据、工具调用、协议层及基础设施等方面的早期投资机会。播客整体结构清晰,内容涵盖广泛,提供了理解当前 AI 行业格局和未来趋势的多维度视角。
本期播客由 Stripe CEO Patrick Collison 访谈 OpenAI 联合创始人兼总裁 Greg Brockman。Greg 分享了 OpenAI 如何从“先有技术再找问题”的非传统模式成长为 AI 领导者。他回顾了 Dota 2 AI 项目如何验证规模化假设的潜力,并分享了团队在不确定性中学习管理和拥抱惊喜的经验。Greg 坦诚讲述了 GPT-3 API 推出时的挑战,并展望了 AI 在个性化交互、医疗、教育、编程等领域的未来应用,预测 AI 辅助编程将进化为“AI 同事”甚至“AI 管理者”。访谈还深入探讨了 AI 发展面临的能源瓶颈和数据墙等关键挑战,以及 OpenAI 在产品决策上的平衡策略。最后,Greg 回顾了个人成长经历,并幽默地反思了对 AGI 时间线的预测,强调 OpenAI 致力于每年带来颠覆性 AI 突破。
本期播客围绕近期谷歌 IO 大会进行深度探讨,评估谷歌在 AI 领域的最新进展及其对行业格局的影响。嘉宾们一致认为,谷歌通过此次大会成功扭转了此前在 AI 赛道上的“落后”印象,凭借 Gemini 2.5 Pro、Veo3 视频生成模型等技术突破,以及将 AI 深度整合进搜索、Gmail、Chrome 等核心产品生态的战略,展现了其强大的技术实力和产品创新能力,实现了“王者归来”。讨论分析了 Veo3 模型在视频生成(特别是原生音频方面)的颠覆性进展及其对内容创作和后期制作的影响。同时,播客探讨了 AI 技术对传统搜索模式的冲击,谷歌如何在保持核心优势的同时进行自我革新。嘉宾们还对比了中美在 AI 大模型技术(如推理模型)研发路径上的差异和相互影响,并对 AI 时代的技术趋势(Agent、Coding、多模态)和创业方向(硬件入口、细分场景应用、服务化)进行了分析和展望,强调了适应技术变革和产品化能力的重要性。整期播客呈现了对谷歌 AI 战略、前沿技术应用及未来行业发展的全面、深入且专业的探讨。
本期节目深入访谈智能眼镜公司 Rokid 创始人祝铭明(Misa),梳理了他长达十一年的硬件创业历程。访谈从其首个操作系统公司被阿里巴巴收购的早期经历切入,分享了在资金极度困难时刻获得阿里投资的细节,以及在阿里内部参与云 OS 和 AI Lab(m lab)的探索与感悟。随后,重点聚焦第二次创业 Rokid 的历程,包括从哲学转向计算机的学习背景,公司初期在 AI 音箱方向的尝试及遇到的挑战(如大公司竞争、产品非平台属性),以及 2019 年决定 all in 转向 AR 眼镜赛道的关键决策过程。祝铭明详细阐述了 AR 眼镜作为 AI 时代理想硬件载体的底层逻辑,对比分析了中美市场对智能眼镜的产品定义差异,并描绘了 AI 与 AR 深度融合后个人智能设备的未来形态。同时,他也坦诚分享了创业过程中的团队调整、融资风格(依赖朋友和老上司信任)、与巨头竞争的策略、以及对杭州创业环境的看法,展现了在硬件“黑森林”中坚持梦想的韧性与智慧。
本期播客采访了语雀创始人、前阿里/字节高管玉伯,深入探讨了他从大型科技公司离职投身独立 AI 创业的深层动机与思考。玉伯坦诚分享了在大厂工作多年的体验,包括管理岗位的局限、不同企业文化的差异(阿里与字节),以及驱动他追求“自由梦”并最终选择创业的原因。他详细介绍了其 AI 创业项目“优曼”(YouMind)的产品理念,强调将 AI 定位为创作者的“伙伴”,致力于降低创作门槛,提供共同构建的快乐,而非仅仅是效率工具。访谈也直面了创业过程中的挑战,如融资困难和产品定义模糊,玉伯对此持“种树”哲学,强调耐心等待产品自然成长。他认为创业需回答“愿不愿意、能不能、值不值得”三个核心问题,并分享了对诚实表达、互联网社区及用户共创的见解。整个对话充满了真诚的个人反思与对未来 AI 及创业趋势的展望。
本期播客特邀 AI 笔记应用 Granola 的创始人 Chris Pedregal,深入探讨了 AI 技术如何作为人类思维工具的最新阶段,延续了书写、数学符号等历史进程。Chris 阐述了 Granola 的核心理念:AI 应增强而非取代人类能力,强调用户判断力至上。播客详细介绍了 Granola 如何通过实时转录和笔记优化,解放用户精力,使其专注于关键思考;以及通过提供动态上下文信息,彻底改变知识工作者获取和利用信息的方式。对话还围绕 AI 时代的创业特点展开,如小型团队如何基于大型语言模型快速构建卓越产品,以及如何平衡快速迭代与深思熟虑的产品设计。最后,展望了未来 AI 交互界面和理想中的思维工具形态,并讨论了 AI 应用在个性化方面的局限性及教育领域的潜力。整期节目提供了对 AI 产品构建、人机协作模式及 AI 创业的深刻洞察。
本期节目对话智源研究院院长王仲远,深入探讨人工智能的未来发展路线。王仲远博士分享了 AI 从大语言模型向多模态、具身智能、AI for Science 及世界模型演进的趋势,强调了原生多模态和世界模型对 AI 进入物理世界的关键作用。他阐述了智源研究院“功成不必在我”的理念,聚焦支持青年科学家进行前沿探索,打造创新科研土壤。讨论还涵盖了王仲远丰富的个人经历,从微软、Facebook 到美团、快手,分享了不同企业文化下的成长与反思,强调基本功、细节和心智磨练的重要性。节目探讨了技术创新的快慢平衡、世界模型的争议与技术路线、具身智能兴起等话题,勾勒了 AI 从数字世界迈向物理世界的宏大前景。王仲远也分享了智源在开源、人才培养和追求世界顶尖科研机构目标上的实践与挑战,为听众提供了关于 AI 前沿、职业发展和机构运作的深刻洞察。
本期播客邀请 PingCAP CTO 黄东旭,深入分析了大语言模型(LLM)对数据库应用、架构及研发带来的深刻变革。讨论围绕 AI 代理的兴起,指出其对数据库提出了处理多源、实时、个性化数据的需求,从而模糊了传统在线数据库与离线数据仓库的边界,实时写入和事务处理能力变得日益重要。嘉宾强调了云原生、存算分离和极致多租户架构在 AI 浪潮下的关键作用,认为 AI 加速并放大了这些技术的价值。播客还探讨了 SQL 作为 AI 与数据库沟通语言的优势,以及 AI 在辅助数据库查询编写、性能优化和成本估算方面的潜力与挑战。最后,黄东旭分享了作为 CTO 对 AI 辅助研发的看法,鼓励拥抱 AI 工具提升效率,但也警示过度依赖和“AI 化”的行业歪风,并对未来数据库研发人员提出了培养“系统品味”的建议。