精选推送

BestBlogs.dev 精选文章第 64 期

大家好！欢迎查阅 BestBlogs.dev 为您带来的第 64 期 AI 精选。

本周 AI 领域可谓是风起云涌，从具备长时独立工作能力的 GPT-5-Codex ，到引领 3D 生成新纪元的空间智能模型，再到行业领袖对 AI 泡沫的激辩，无不预示着技术边界的又一次拓展。让我们一同快速览阅本周最值得关注的亮点。

🚀 模型与研究亮点

🤖 OpenAI 发布专为编程优化的 GPT-5-Codex ，能独立完成长达 7 小时的复杂软件工程任务，其代码审查能力已在内部广泛应用。
🏆 阿里巴巴开源首个深度研究 Agent 模型通义 DeepResearch ，凭借创新的数据策略和训练框架，在多个权威 Agent 评测集上登顶榜首。
🎬 快手可灵团队发布数字人技术 Kling-Avatar ，通过多模态导演模块与两阶段生成框架，让数字人从简单“对口型”进化到能够生动“会表演”。
🌌 李飞飞团队推出空间智能模型 Marble ，仅需一张图片或文本提示，即可生成可无限探索、持久且无缝导出的高质量 3D 世界。
🎨 腾讯混元团队提出 SRPO 算法，仅需 10 分钟训练，即可高效解决文生图模型的“皮肤过油”问题，大幅提升人像真实感。
🔍 一文深入探讨大模型“通用验证器”的两大技术路径：以 ScaleAI 的 RaR 框架为代表的“模型裁判”与以 UC Berkeley 的 INTUITOR 为代表的“模型自评”，揭示了提升模型可靠性的关键。

🛠️ 开发与工具精粹

🔌 深度解析 Model Context Protocol (MCP) 的本质，它并非高级的 Function Calling，而是一套模型无关、用于构建可互操作 AI 应用的工程协议。
📝 开源工具包 Spec Kit 倡导“规范驱动开发”新模式，强调先编写可执行的规范文档，作为 AI 生成和验证代码的唯一“真相来源”，提升代码可靠性。
🏢 OpenAI 内部揭秘 Codex 的七大核心应用场景与六项最佳实践，展示了其如何深度融入日常开发，以加速代码理解、重构及测试。
🧠 阿里云 Qwen Code 展示 Agentic Coding 新范式，证明 AI 已超越代码补全，能够通过精巧的 Prompt 设计自主规划、执行并验证复杂的软件工程任务。
🖱️ 快速上手 AI 编程工具 Cursor 的实战指南，文章演示了如何通过提供充足的上下文信息，让 AI 在老旧项目中也能高效生成符合规范的代码。
🚀 探索“意图即代码”的革命性开发范式，构想了开发者仅需用自然语言定义业务意图，由 AI 负责实现、探索与验证的未来工作流。

💡 产品与设计洞见

🎙️ AI 语音独角兽 ElevenLabs 分享其达成 2 亿美元 ARR 的增长秘诀，关键在于精准找到产品市场契合点、保持小团队高效执行以及深耕社区。
👓 Meta 发布首款带显示屏的 AI 眼镜 Ray-Ban Display ，结合光波导 HUD 和神经接口腕带，旨在重塑下一代计算入口与交互方式。
📊 OpenRouter 的 API 账单数据揭示了 AI 应用的真实热门趋势，编码助手和提供情感价值的角色扮演应用成为独立开发者的两大主要赛道。
😌 AI 成为强大的自我疗愈工具，社区涌现出大量结构化 Prompt，利用大语言模型作为私密的心理伙伴，辅助用户进行情绪管理和深度自我探索。
📱 掌握利用 Lovart 与 Seedream 4.0 模型的组合，可将任意长文或文档一键转化为适合小红书等平台的精美图文内容，成为自媒体创作利器。
🎉 Product Hunt 最新月度精选榜单出炉，涵盖了 AI 工作流自动化、AI 求职、个人 AI 助理以及无代码 AI 应用生成等 10 款创新产品。

📰 资讯与报告前瞻

📈 OpenAI 与 Anthropic 发布最新使用报告，ChatGPT 周活跃用户突破 7 亿，核心用途转向实用建议，而 Claude 在企业自动化任务中表现突出。
🗣️ 行业领袖激辩 AI 泡沫，OpenAI 董事长 Bret Taylor 警示存在大量“表演性” AI 应用，而 a16z 创始人 Ben Horowitz 则认为这是基于真实增长的技术新纪元。
🏭 资深专家吴穹展望软件开发的终局，认为 AI 将推动软件工程进入“黑灯工厂”时代，软件输出将从确定性转向概率性。
🗺️ 蚂蚁集团发布《2025 大模型开源开发生态全景图 2.0》，报告显示生态正经历快速洗牌，AI Agent 和 AI Coding 成为最活跃的核心板块。

希望本周的精选内容能为您带来新的启发。保持学习，我们下周再见！

立即订阅

1刚刚，OpenAI 发布 GPT-5-Codex：可独立工作超 7 小时，还能审查、重构大型项目｜机器之心
2开源 Agent 模型榜第一名，现在是阿里通义 DeepResearch
3从「对口型」到「会表演」，刚进化的可灵 AI 数字人，技术公开了｜机器之心
4刚刚，李飞飞空间智能新成果震撼问世！3D 世界生成进入「无限探索」时代｜机器之心
5给大模型生图“去油”，混元这个新研究火了
6一文读懂 GPT-5 的绝招，这是决定 AI 未来的隐形武器
7别再误会 MCP 了！一篇写给 AI 工程师的硬核“辟谣”指南
8【第 3588 期】基于 AI 的规范驱动开发：使用全新开源工具包快速上手
9OpenAI 内部揭秘：我们如何使用 Codex
10不只是写代码：Qwen Code 如何规划、执行并验证软件工程任务
1130 分钟轻松掌握 Cursor，快速提升开发效率和体验
12凡人程序员进入修仙时代？意图即代码的范式革命即将到来
13YC 编写的 Vibe Coding 指南
142 亿美元 ARR，AI 语音赛道最会赚钱的公司，ElevenLabs 如何做到快速增长？
15小扎演示多次翻车，但这依然是 2025 最好的 AI 眼镜 | 附现场体验
16API 账单不会说谎：OpenRouter Top 10 榜单，看到下一个爆款
17我用 AI，治好了那个总说“我不够好”的自己
18藏师傅教你用 Lovart x Seedream4.0 搞定终极自媒体神器
19AI 帮你和马斯克谈笑风生，顺便找工作写代码回邮件｜Product Hunt 精选 44
207 亿人每周狂发 180 亿条消息！OpenAI 首次揭秘 ChatGPT 最火用途
21OpenAI 董事长：太多 AI 应用是在表演！AI 泡沫远比想象更严重，会有人赔大本；应用不应追求 AGI；微调或不再重要；支持抽成模式
22#231.a16z 创始人 Ben Horowitz：创始人为何失败以及为何你需要直面恐惧
23对话吴穹：软件开发的终局，是我们将迎来自己的“黑灯工厂”
24LLM 开源 2.0 大洗牌：60 个出局，39 个上桌，AI Coding 疯魔，TensorFlow 已死｜机器之心

刚刚，OpenAI 发布 GPT-5-Codex：可独立工作超 7 小时，还能审查、重构大型项目｜机器之心

机器之心

jiqizhixin.com

09-16

3345 字 · 约 14 分钟

刚刚，OpenAI 发布 GPT-5-Codex：可独立工作超 7 小时，还能审查、重构大型项目｜机器之心

文章详细介绍了 OpenAI 最新发布的 GPT-5-Codex，这是一款针对智能体编程任务进行优化的 GPT-5 模型。它在真实软件工程任务中表现出色，能够快速响应交互式会话，并独立完成长达 7 小时的复杂任务，包括项目构建、功能开发、测试编写、调试和大规模重构。GPT-5-Codex 的代码审查能力尤为突出，能主动发现关键漏洞，在 OpenAI 内部已审查绝大多数 PR。该模型在 SWE-bench Verified 和 Code refactoring tasks 基准测试中均优于 GPT-5，并能根据任务复杂度动态调整思考时间。同时，文章还介绍了 Codex 平台的一系列升级，包括全新设计的开源 Codex CLI（支持图片输入、待办清单、工具调用和权限管理）、支持 VS Code 等 IDE 的插件（提供上下文感知、云端本地无缝切换）以及与 GitHub 的深度集成。OpenAI 还强调了 Codex 的安全措施，如默认沙箱环境、权限机制和可配置安全设置。Codex 已包含在 ChatGPT 的 Plus、Pro、Business、Edu 和 Enterprise 订阅中，并计划很快通过 API 开放 GPT-5-Codex。

开源 Agent 模型榜第一名，现在是阿里通义 DeepResearch

量子位

qbitai.com

09-18

4294 字 · 约 18 分钟

文章详细介绍了阿里巴巴开源的首个深度研究 Agent 模型通义 DeepResearch。该模型采用 30B-A3B 轻量级架构，在 HLE、BrowseComp-zh、GAIA 等多个权威评测集上取得了 SOTA 成绩，超越了 OpenAI Deep Research 和 DeepSeek-V3.1 等竞品。文章深入阐述了模型能力提升的关键因素，包括一套不依赖人工标注、大规模生成高质量训练数据的多阶段数据策略，以及创新的 IterResearch 范式和 Research-Synthesis 框架，有效解决了 Agent 在复杂多步任务中的认知瓶颈和噪音污染。此外，还介绍了革新的端到端 Agent 训练流程（Agentic CPT → Agentic SFT → Agentic RL）和基于策略的强化学习优化实践，强调了数据质量和训练环境稳定性对 Agentic RL 成功的决定性作用。文章最后展示了通义 DeepResearch 在高德出行 Agent 和通义法睿等内部应用中的落地成果，并提供了模型、框架和方案的开源地址，具有极高的实践参考价值。

从「对口型」到「会表演」，刚进化的可灵 AI 数字人，技术公开了｜机器之心

机器之心

jiqizhixin.com

09-15

2596 字 · 约 11 分钟

文章详细介绍了快手可灵团队最新发布的数字人技术 Kling-Avatar，该技术旨在将数字人从简单的语音对口型提升到能够根据用户意图进行生动表演的水平。Kling-Avatar 的核心是一个由多模态大语言模型赋能的两阶段生成框架。首先，一个多模态导演模块（MLLM Director）将音频、图像和文本提示整合为结构化的故事线，生成一段全局一致的蓝图视频。其次，基于蓝图视频的关键帧，系统采用并行合成的级联生成方式，结合音频对齐插帧策略，高效生成分钟级长视频，确保口型同步和身份一致性。文章还详细阐述了口型对齐、文本可控性、身份一致性等训练与推理策略，并介绍了高质量训练数据管线和包含 375 个样本的测评基准。实验结果显示，Kling-Avatar 在总体效果、口型同步、画面质量、指令响应和身份一致性等多个维度上均超越了现有先进产品如 OmniHuman-1 和 HeyGen，尤其在复杂发音和长时视频生成方面表现出色。目前该功能已在可灵平台开启公测，标志着数字人技术在表达深度上的重要突破。

刚刚，李飞飞空间智能新成果震撼问世！3D 世界生成进入「无限探索」时代｜机器之心

机器之心

jiqizhixin.com

09-17

1291 字 · 约 6 分钟

刚刚，李飞飞空间智能新成果震撼问世！3D 世界生成进入「无限探索」时代｜机器之心

文章详细介绍了斯坦福大学李飞飞教授的创业公司 World Labs 最新推出的空间智能模型 Marble。该模型的核心能力在于能够仅通过一张图片或一段文本提示，实现 3D 世界的“无限探索”，生成持久存在、可自由导航的 3D 世界。文章强调了 Marble 相较于现有技术的优势，例如其生成的 3D 世界具有永久性、无形变、无不一致性，并且规模更大、风格更多样、几何结构更优质。用户不仅可以在浏览器中自由视角探索这些世界，还能将其导出为高斯点云，并通过开源渲染库 Spark 无缝集成到 Three.js 等下游项目中，从而构建基于 Web 的 3D 体验。Marble 目前主要专注于 3D 环境的创建，暂不支持单个对象（如人物或动物）的生成。文章还提供了白名单申请地址，邀请用户体验预览版。

BestBlogs.dev 精选文章 第 64 期

🚀 模型与研究亮点

🛠️ 开发与工具精粹

💡 产品与设计洞见

📰 资讯与报告前瞻

目录

BestBlogs.dev 精选文章第 64 期