BestBlogs.dev 精选文章 第 70 期

10-31

1849 字 · 约 8 分钟

文章详细介绍了 OpenAI 推出的由 GPT-5 驱动的“白帽”Agent——Aardvark，它能够在大规模代码库中自动发现并修复安全漏洞。Aardvark 的创新之处在于不依赖传统的程序分析技术，而是运用大语言模型驱动的推理与工具使用能力来理解代码行为，像人类安全研究员那样工作。其工作流程涵盖威胁建模、漏洞发现、沙盒验证、Codex 修复和人工复审。内部测试显示，Aardvark 已识别出 92%的已知漏洞，并在多个开源项目中发现了 10 个获得 CVE 编号的漏洞。文章还指出，Anthropic、谷歌、微软等科技巨头也同期发布了类似的 AI 代码安全 Agent，共同应对人工调试和传统自动化方法难以跟上大规模代码库漏洞发现与修复需求的挑战，预示着 AI Debugging 将成为软件安全领域的重要发展方向。

Cursor 发布首个编程大模型！代码生成 250tokens/秒，强化学习+MoE 架构

10-30

2079 字 · 约 9 分钟

Cursor 发布首个编程大模型！代码生成 250tokens/秒，强化学习+MoE 架构

文章详细介绍了 Cursor 2.0 及其首次搭载的内部编程大模型 Composer。该模型采用强化学习（RL）和 MoE（Mixture of Experts）架构，旨在实现低延迟编码，官方宣称能以 250 tokens/秒的速度生成代码，并在 30 秒内完成复杂任务，性能超越现有主流模型。Cursor 2.0 还引入了原生浏览器工具、语音生成代码以及“以 Agent 为中心”的全新界面逻辑，支持多 Agent 并行运行。文章强调 Composer 通过在真实开发环境中进行 RL 训练，使其能调用工具、执行命令，学习到实际的编程技能和涌现行为。尽管性能卓越，文章也指出 Cursor 在模型底层透明度方面存在不足，未明确说明 Composer 是自研预训练还是基于现有模型微调。

美团视频生成模型来了！一出手就是开源 SOTA

10-27

3766 字 · 约 16 分钟

文章详细介绍了美团最新开源的视频生成模型 LongCat-Video，该模型参数为 13.6B，支持文生视频、图生视频及核心的视频延长功能，能稳定生成长达数分钟的视频且无质量下降。LongCat-Video 在开源模型中表现顶尖，部分核心能力可与谷歌闭源模型 Veo3 媲美，尤其在物理世界理解和常识性维度上具有领先优势。技术上，模型基于 Diffusion Transformer 框架，通过将所有任务统一为条件帧续生、原生预训练长视频任务、以及采用块稀疏注意力等方法，实现了高效率和高质量。该模型采用 MIT 协议，允许商用，为广大开发者和企业提供了免费使用和集成的便利，极大地加速了视频 AI 技术的普及和商业化应用。美团表示，推出 LongCat-Video 旨在探索世界模型这一前沿领域，明确将视频生成模型视为构建世界模型的关键路径，通过视频生成任务压缩几何、语义、物理等多种形式的知识，使 AI 得以在数字空间中模拟、推演乃至预演真实世界运行，具备更深层次的智能。

李沐：年度演讲谈智能体！

Datawhale

10-28

7143 字 · 约 29 分钟

文章深入介绍了李沐关于语音智能体商业落地的年度演讲。他通过开放世界游戏中的 AI NPC 和财富 500 强保险公司的 AI 电话销售员两大核心案例，详细阐述了语音智能体从技术挑战到实际应用的经验。在游戏场景中，智能体需兼顾“游戏设计师”与“演员”双重角色，面临开放性、人设一致性及剧情引导难题；在保险销售中，则需满足严格的行业监管、精准回答、工具调用及低延迟等要求。文章重点探讨了二段式链式架构作为实现高智能、低延迟和可定制性的关键，并介绍了 Context Engineering（上下文工程）和策略调度器等高级工程实践。同时，强调了大规模预训练、域内评测以及应对 B2B 领域数据安全挑战的重要性。李沐指出，语音智能体技术虽处于早期，但具备高度可扩展性，商业落地前景广阔。

117. 开源一段论文探索之旅：模型范式、Infra 和数据、语言、多模态的完整变迁史

张小珺Jùn｜商业访谈录

xiaoyuzhoufm.com

10-28

1413 字 · 约 6 分钟

117. 开源一段论文探索之旅：模型范式、Infra 和数据、语言、多模态的完整变迁史

本期播客特邀美团光年之外产品负责人谢青池，分享他作为非技术背景产品经理，通过一年多时间研读数百篇 AI 论文，深入理解 AI 技术边界的经验。节目以其独特的视角，将 AI 发展史划分为模型范式变迁、基础设施与数据、语言模型和多模态模型四大核心部分，详细解读了从 1999 年 GPU 诞生到 2024 年最新进展中的 36 篇关键论文。内容涵盖了深度学习的开端 AlexNet、Transformer 架构的革命性影响、强化学习的突破（如 AlphaGo Zero）、LoRA 等高效微调技术、以及 Scaling Law、LAION-5B 等数据与算力发展里程碑。同时，播客也探讨了 Word2Vec、GPT 系列、InstructGPT 等语言模型演进，以及 GAN、Diffusion、CLIP、Stable Diffusion 等多模态模型的创新。谢青池还分享了如何利用 AI 工具辅助论文阅读、推荐了体系化的学习资源，并强调了在 AI 早期阶段，产品经理深入理解技术原理对产品创新和职业发展的重要性。整个分享旨在帮助技术从业者和 AI 爱好者构建对 AI 宏观发展脉络的深刻理解。

我的研发实践：高准确率 AICoding 工作流设计

大淘宝技术

10-27

25400 字 · 约 102 分钟

本文深入探讨了在企业级复杂场景下，如何通过 AI 技术显著提升研发效能，同时确保代码质量。作者以“氛围编程”概念切入，指出 AI 生成代码虽能提高效率，但在质量保障方面仍存挑战。基于此，团队聚焦于 AB 实验下线、Switch 开关治理等高频、重复且熟悉的非业务需求场景，设计了一套高准确率的 AICoding 工作流。该工作流融合了 MCP（Agent 与工具通信）、A2A（Agent 间协作）和 AG-UI（Agent 与用户交互）三大协议，构建了基于 Single-Agent 架构的智能生码系统。通过精细化提示词工程、动态上下文注入和标准化工作流编排，实现了任务的自动化生成与发布。文章还对 Claude 4 和 Qwen3-Coder 等主流大模型进行了能力调研，并阐述了 Agent 的决策逻辑与框架选择。最终目标是在保证 90%以上正确率的前提下，解放研发人力，使其聚焦于高价值创新。文章强调，选择细分、可控的场景，结合业务深度知识，沉淀可复用的工作流模板，是实现安全、高效、可推广 AI 研发提效的关键路径。

AI 编程上瘾指南，一天不用浑身难受

腾讯技术工程

10-27

27866 字 · 约 112 分钟

文章详细阐述了 AI 编程在当前技术变革中的战略价值和机遇，指出其将传统开发模式从 IDE 辅助转变为人机协作的编程伙伴，并有效解决了重复编码、需求偏差和文档维护等效率瓶颈。作者提出了以 CodeBuddy 为核心的编程方法，构建了包含信息层、工具层、能力层（提示工程）和质量层的 AI 编程生态。在此基础上，文章系统性地阐述了 AI × SDLC（软件开发生命周期）方法论的五大核心能力：结构化任务分解、智能上下文工程、标准化交付体系、测试驱动的自愈式开发和质量驱动的持续优化。最后，通过“需求到代码的端到端工作流”、“前端 Figma 到代码自动化”和“后端系统迭代开发”三大核心场景的深度实践，展示了 AI 编程在实际项目中的显著效果，并总结了实施过程中的踩坑经验与解决方案。文章还客观分析了 AI 编程的适用边界与局限性，为开发者提供了全面而深入的 AI 编程实践指南。

Build Hour: AgentKit

OpenAI

10-29

13381 字 · 约 54 分钟

本次 Build Hour 介绍 AgentKit，这是 OpenAI 提供的一个综合工具包，旨在简化智能体工作流（包括复杂的多智能体系统）的构建、部署和优化。它通过提供 Agent Builder 进行可视化工作流设计、版本控制以及通过连接器注册表安全地连接工具和数据，从而解决了智能体开发的历史复杂性。此外，还集成了自动提示词优化和护栏机制。ChatKit 提供了一个可定制的 UI，用于部署智能体，从而实现品牌一致性和丰富的交互式小部件。至关重要的是，Evals 提供了内置功能，用于确保智能体的大规模可靠性，从而能够测试单个节点、评估端到端跟踪以及基于人工反馈自动优化提示词。该演示重点介绍了使用真实世界数据进行“评估驱动开发 (eval-driven development)”的转变。通过客户支持、销售助手和内部生产力工具等实际应用，AgentKit 能够节省大量的原型设计时间。

什么是智能体？

ByteByteGo Newsletter

blog.bytebytego.com

10-29

2147 字 · 约 9 分钟

本文概述了 AI 智能体。AI 智能体是一种能够感知环境、做出决策并采取行动以实现特定目标的软件系统，具有一定的独立性。它与被动的、遵循指令的传统软件不同。核心操作机制“智能体循环”（感知、思考、行动、观察、重复）得到解释，强调了大型语言模型如何充当“大脑”，以及智能体如何利用各种工具（例如，网络搜索、API）来扩展其能力并适应动态情况。本文还将 AI 智能体分为一个复杂程度的谱系：简单反射、基于模型、基于目标、基于效用和学习型智能体，并通过清晰的示例和图表对每种智能体进行了说明。最后，它强调了 AI 智能体对软件开发的变革性影响，即转向面向目标的任务完成，而不是明确的逐步指令。

如何让 Agent 更符合预期？基于上下文工程和多智能体构建云小二 Aivis 的十大实战经验

阿里云开发者

10-31

11519 字 · 约 47 分钟

如何让 Agent 更符合预期？基于上下文工程和多智能体构建云小二 Aivis 的十大实战经验

文章深入探讨了如何构建和调优高性能 Agent 的复杂课题，特别聚焦于上下文工程和多智能体架构的优化实践。作者结合阿里云“云小二 Aivis”项目的真实踩坑经验，总结了十大关键实战建议，旨在解决 Agent 常见的运行不稳定、产生幻觉、不按预期输出等问题。核心经验包括清晰化预期、精准投喂上下文、明确身份和历史执行、结构化表达逻辑、自定义工具协议、合理使用 Few-Shot、保持上下文“苗条”、记忆管理、Multi-Agent 平衡可控性与灵活性，以及坚持人在回路（HITL）的重要性。文章提供了具体案例和解决方案，为 Agent 开发者提供了宝贵的实践指导。

AI 出码率 70%+的背后：高德团队如何实现 AI 研发效率的量化与优化

阿里云开发者

10-27

5456 字 · 约 22 分钟

本文详细阐述了高德团队在 AI 辅助编程背景下，如何从零搭建一套科学、可落地的研发效率量化指标体系。文章首先指出当前 AI 编程工具缺乏统一的效率衡量标准，并提出了以“AI 出码率”为核心指标，结合代码量、会话交互和使用时长等辅助指标来全面评估 AI 工具的效能。文章深入介绍了指标体系的建设方案，包括多 IDE 基础插件的数据采集能力、基于 MCP 协议的标准化采集方案及其演进过程，并详细说明了提示词设计与优化策略。通过这一数据驱动的闭环优化机制，高德团队成功将 AI 出码率从 30% 提升至 70% 以上，实现了从被动接受到主动探索 AI 编码的转变，并沉淀了 AI 工具使用最佳实践，最终促进了团队整体开发效率的显著提升和 AI 编码习惯的养成。

Agent HQ 介绍：任何代理，满足您的工作方式

The GitHub Blog

github.blog

10-28

1391 字 · 约 6 分钟

本文宣布了 GitHub 的 Agent HQ，这是一项战略举措，旨在将各种 AI 编码代理（来自 Anthropic、OpenAI、Google 等）直接集成到 GitHub 平台中。它通过创建一个统一的生态系统来解决当前 AI 工具的碎片化问题，在该生态系统中，代理可以在现有的 Git、Pull Request 和 Issue 工作流程中无缝运行。主要功能包括“任务控制中心”，这是一个用于跨不同设备和界面（GitHub、VS Code、移动设备、CLI）分配和跟踪代理任务的命令中心。新的 VS Code 集成提供了“计划模式”，用于结构化任务规划，以及通过 AGENTS.md 文件（一种用于定义代理行为的配置文件）使用特定规则和防护措施自定义代理行为。此外，Agent HQ 通过“GitHub 代码质量”等功能来强调企业级信心和控制，以实现系统的代码可维护性，一个 “Copilot 指标仪表板” 用于使用情况洞察，以及一个专用的“控制平面”，用于管理组织内的 AI 访问和代理行为。这一愿景旨在提供强大、安全和集成的 AI 赋能的开发体验。

自主型 AI 和安全

Martin Fowler

martinfowler.com

10-28

4378 字 · 约 18 分钟

Martin Fowler 在这篇文章中深入探讨了自主型 AI 系统固有的重大安全风险。这些系统是基于 LLM 的应用程序，能够通过内部逻辑、工具调用和子代理实现自主行动。识别出的核心问题是 LLM 无法可靠地区分内容和指令，这使得它们从根本上容易受到提示注入攻击。本文介绍了 Simon Willison 的“AI 代理致命三要素”：访问敏感数据、暴露于不受信任的内容以及外部通信能力相结合，从而创建了高风险环境。然后，Fowler 概述了实际的缓解策略，包括最大限度地减少对敏感数据的访问（例如，避免在文件中使用凭据）、阻止外部通信渠道、严格限制暴露于不受信任的内容，以及至关重要的是，采用 Docker 容器等沙盒技术来隔离有风险的任务。他还强调根据最小权限原则拆分任务，并保持“人工干预”以审查 AI 输出。除了技术风险外，本文还涉及关于 AI 供应商和 LLM 的环境影响的更广泛的行业和伦理问题，最后呼吁在这个快速发展的领域保持持续的意识和怀疑态度。

让 Agent 系统更聪明之前，先让它能被信任

阿里云开发者

10-30

7876 字 · 约 32 分钟

文章深入探讨了 AI Agent 系统开发中普遍存在的“简单”错觉，指出其背后是复杂性被框架封装、平台外包和问题推迟的假象。作者从系统工程视角，详细阐述了 Agent 系统在可运行、可复现和可进化三个层次上的复杂度，并揭示了 LLM 不确定性如何通过 Agent 的内存、编排和测试环节被放大。文章通过丰富的实际案例和作者自身的认知演化过程，强调从“能跑”到“能用”的 Agent 需要系统化设计而非简单的 Prompt Hack。最后，文章介绍了 ReAct、CodeAct 等 Agent 设计模式，并总结了“先稳定后聪明，先可观测后优化”的核心原则，呼吁将 Agent 视为系统组件进行工程化管理，而非仅依赖其智能。

LinkedIn 生成式 AI 技术栈的演进之路

ByteByteGo Newsletter

blog.bytebytego.com

10-28

3226 字 · 约 13 分钟

本文记录了 LinkedIn 在构建和部署 AI 赋能产品方面的重大转型，从最初孤立的生成式 AI 实验发展到全面的平台战略。文章详细阐述了统一的生成式 AI 应用程序堆栈的建立，强调了战略性转向 Python，以利用其丰富的生态系统和开发者基础，并采用 LangChain 作为主要框架。讨论的关键架构组件包括用于保持一致性的集中式提示源真值、用于结构化 API 调用的技能注册表，以及用于上下文管理的双重记忆系统（对话式和体验式）。文章还介绍了他们对模型推理、微调以及从遗留系统进行增量迁移的策略。此外，它还详细介绍了平台对 AI 智能体的支持演变，定义了它们的结构、可发现性和编排，利用了 LinkedIn 现有的消息传递基础设施，强调了人机协同控制、强大的可观测性和内部开发者工具（如 AI Playground）。叙述总结了关于标准化、松耦合和安全性的实践经验，例如，招聘助手等应用。

《智能体设计模式》之多智能体协作模式：分工协同突破单一智能体能力边界[译]

Gino Notes

ginonotes.com

10-28

10283 字 · 约 42 分钟

文章作为《智能体设计模式》一书的翻译章节，深入探讨了多智能体协作模式。它指出单一智能体在处理复杂跨领域任务时的局限性，并提出通过任务分解、专业化分工及智能体间协同工作来突破这些限制。文章详细介绍了六种协作架构（如网络化、监督者、层级结构）和六种协作形式（如顺序交接、并行处理、辩论与共识），并列举了复杂研究、软件开发、创意内容生成等七大典型应用场景。此外，文章还通过 CrewAI 和 Google ADK 框架提供了丰富的实战代码示例，演示了如何实现智能体分层、循环、顺序、并行执行以及将智能体封装为工具。最后，文章总结了该模式的适用时机与权衡考量，强调其在构建模块化、可扩展和鲁棒系统中的核心价值，为开发者提供了系统性的设计原则与最佳实践。

智能体商务协议与 AI 经济基础设施构建：Stripe 数据与 AI 负责人 Emily Glassberg Sands 访谈

Latent Space

latent.space

10-30

20471 字 · 约 82 分钟

智能体商务协议与 AI 经济基础设施构建：Stripe 数据与 AI 负责人 Emily Glassberg Sands 访谈

本文总结了对 Stripe 数据与 AI 负责人 Emily Glassberg Sands 的采访，重点介绍了他们构建 AI 经济基础设施的使命。主要举措包括与 OpenAI 共同开发的智能体商务协议（ACP），该协议使 AI 智能体能够使用共享的支付 Token 和集成的风险信号，从商家目录中搜索和购买商品。Stripe 还开发了一种基于 Transformer 的支付基础模型，通过将费用视为 Token 并将行为序列视为上下文，将银行卡测试欺诈检测从 59 % 大幅提高到 97 %。此外，Stripe 推出了 Token 计费，以帮助 AI 企业根据智能体成本的波动动态地为其服务定价。本文还涉及 Stripe 的内部 AI 应用，其中 65-70 % 的工程师使用 AI 编码助手，并且集成开发效率显著提升。最后，它提供了对新兴 AI 经济的见解，指出在 Stripe 上的 AI 公司具有更快的市场推广速度、从第一天开始的全球覆盖以及更高的人均收入。

揭秘 Nano Banana：谷歌 DeepMind 图像模型的创新之路

a16z

10-28

17367 字 · 约 70 分钟

本次对谷歌 DeepMind 的 Oliver Wang 和 Nicole Brichtova 的播客采访探讨了 Nano Banana，即 Gemini 2.5 Flash 图像模型的创建和影响。它详细介绍了该模型的起源，融合 Gemini 的智能与 Imagen 的视觉质量，Nano Banana 通过个性化的零样本图像生成迅速走红。值得注意的是，其病毒式的采用和社区参与，尤其是在日本的漫画和动漫生成方面，证明了其在现实世界中的影响。讨论强调了人工智能如何通过减少手动苦差事来增强创作者的能力，从而使他们能够将 90% 的精力集中在创造力上。探讨了控制、一致性、用户界面设计等关键挑战，以及这些挑战对专业艺术家和普通用户的影响。专家们深入研究了人工智能在教育、视觉学习以及多模态人工智能的未来中的潜力，包括用于视频生成的 2D 和 3D 世界模型之间的争论。他们强调人工智能是一种需要人类意图和品味来创造有意义的艺术的工具，承认最初艺术家持怀疑态度，但预见到在创意领域中人机协作得到增强的未来。

OpusClip 增长秘诀：如果每个阶段只让我选一件事做 | 对谈 Opus 前增长产品负责人君陶

42章经

xiaoyuzhoufm.com

10-25

1488 字 · 约 6 分钟

OpusClip 增长秘诀：如果每个阶段只让我选一件事做 | 对谈 Opus 前增长产品负责人君陶

本期播客特邀 OpusClip 前增长产品负责人谢君陶，深度分享了 AI 产品从 0 到 1 再到 100 的增长实践经验。讨论围绕获客、转化、留存和洞察四个核心维度展开。

在获客方面，嘉宾强调冷启动阶段应寻找产品的真实用户作为合作伙伴而非单纯的推广代理，通过与 KOL（如 OpusClip 与知名创作者张 You Share 的合作）建立深度经济共赢关系，实现精准破圈和品牌背书，避免盲目铺设渠道，确保初期用户的高质量和与产品的高度契合。KOL 的天然影响力是视频产品实现 PMF 后破圈的关键。

转化环节，灵活的定价策略被认为是早期高效抓手。对于视频和创作者 AI 产品，定制化功能（如 RunwayML 的自定义语音、Higgsfield 的个性化角色创建）是重要的付费点，因为用户追求内容的独特性。播客详细阐述了动态调整定价的策略，并强调在调整过程中必须保护老用户的利益，甚至提供额外权益，以维护良好口碑和长期留存。同时，优化 UI 信息传递（如定价弹窗的时机和文案）能显著提升转化率。

留存被定位为最重要的增长指标，是实现产品复利式增长的基石。嘉宾通过对比不同流失率公司的用户留存曲线，强调了高留存率的决定性作用。为提升留存，播客倡导以用户为中心的运营策略，即 70%的产品迭代基于用户反馈，30%则满足那些未被明确提出但普遍受欢迎的需求。OpusClip 通过构建多渠道用户反馈闭环（如 Discord 社区、Intercom 客服、Canny 功能需求收集、社交媒体监控），并结合内部周报机制、工程自动化及产品路线图公示，确保用户反馈能高效转化为产品价值。

洞察部分，嘉宾建议创业公司在有限资源下，从高收益、确定性强的 AB 测试入手，逐步建立数据驱动决策的信心。他分享了付费弹窗测试、邮箱后缀分析、社交账号挖掘等方法，用于用户洞察和决策支持。强调初期可利用现有 SaaS 工具（如 Statsig）低成本甚至零成本搭建测试基建，避免超前投入数据人才和复杂基础设施。最后，播客还深入探讨了增长团队搭建、AI 产品定价潜力（普遍偏保守，有涨价空间）及 AI 视频市场趋势，并指出 OpusClip 最正确的决策是成功进行品牌建设，定义了新品类并与 KOC/KOL 建立深度合作，从而构建了长期获客的壁垒和用户粘性。播客总结，成功的增长在于科学、严谨地落地执行基础工作。

Sam、Jakub 和 Wojciech 谈 OpenAI 的未来，附观众问答

OpenAI

10-29

17849 字 · 约 72 分钟

与 OpenAI 领导层（Sam Altman、Jakub S. 和 Wojciech Z.）的这次讨论全面概述了该公司的未来战略，围绕三个核心支柱构建：研究、产品和基础设施。在研究方面，他们预计十年内实现超人工智能，到 2025 年 9 月推出 AI 研究助理，到 2028 年 3 月推出完全自主的 AI 研究员，强调 AI 安全和对齐的多层方法，包括像“思维链忠实性”这样的新型技术。产品支柱侧重于将 OpenAI 发展成为一个“AI 云”平台，在支持外部开发者的同时，倡导用户自由和强大的隐私保护，包括像“AI 特权”这样的概念，将成年用户视为负责任的个体。基础设施支柱揭示了一项前所未有的承诺，即超过 30 吉瓦的计算能力，代表着 1.4 万亿美元的财务承诺，并渴望建立一个能够每周生产 1 吉瓦的“基础设施工厂”，以“星际之门”项目为例。引入了一种新的组织架构，其特点是由控制性的非营利组织 OpenAI 基金会监督一家公共利益公司（PBC），最初的重点是 AI 驱动的科学发现（例如，治愈疾病）和建立“AI 韧性”以管理生物安全和工作岗位流失等系统性风险。会议最后是问答环节，讨论了模型成瘾、用户对模型的控制等主题。这些讨论强调了 OpenAI 对负责任且有影响力的 AI 开发的承诺。

黄仁勋台上最强 GPU 炸场，台下感叹"中国芯片爆发"，瞄准 6G 投资诺基亚

10-29

3154 字 · 约 13 分钟

文章详细报道了英伟达最新发布会的核心内容，包括新一代Vera Rubin超级芯片的亮相，其算力高达100 PFLOPs，并计划于2026年和2027年推出不同版本的平台。同时，英伟达宣布了在量子计算和6G通信领域的战略布局，推出了NVQLink互连架构和CUDA-Q开放平台以连接量子处理器，并发布了NVIDIA Arc产品线，与诺基亚合作开发AI原生6G加速计算平台，并进行了10亿美元投资。黄仁勋在会上盛赞中国芯片和AI模型的发展。文章还深入分析了英伟达在数据中心、量子计算和6G领域面临的激烈竞争，包括来自AMD、高通、IBM以及中国本土企业在芯片和通信技术方面的挑战。尽管竞争激烈，市场投资者仍对英伟达前景看好，其股价创下历史新高。

Block 如何成为全球领先的人工智能驱动型企业 | Dhanji R. Prasanna

Lenny's Podcast

10-26

25784 字 · 约 104 分钟

Block 如何成为全球领先的人工智能驱动型企业 | Dhanji R. Prasanna

本期播客邀请了 Block 首席技术官 Dhanji R. Prasanna，详细介绍了 Block 向人工智能原生企业的转型过程。他提交给 Jack Dorsey 的“人工智能宣言”是转型的催化剂，推动公司从以总经理为中心的组织结构转变为职能型组织结构，并强调“技术优先”的理念。其中一项核心创新是“Goose”，这是一个基于 Anthropic 的模型上下文协议 (MCP) 构建的开源通用人工智能代理，它显著提高了技术和非技术团队的生产力（人工智能优先的工程团队每周节省 8-10 小时，公司整体节省 20-25% 的时间）。Prasanna 强调，非技术用户通过构建自己的软件工具也获得了意想不到的收益。他还讨论了人工智能自主性日益增强的工程未来、“氛围编码”的概念，甚至是在人工智能辅助下使用 rm -rf (强制删除命令) 从头开始重建应用程序。他分享的关键经验包括：代码质量并非产品成功的决定性因素（以 YouTube 为例），工程中“受控的混乱”的价值，以及“人类的判断力和洞察力”在防止人工智能偏离方向方面的关键作用，还有“从小处着手”的原则。他还强调领导者应亲自使用人工智能工具来推动应用，并从过去的产品失败案例中吸取教训，如 Google Wave 和 Google+。

对李想的第二次 3 小时访谈：智慧是我们和万物的关系

语言即世界language is world