跳转到主要内容
精选推送

BestBlogs.dev 第 77 期:氛围工程

大家好!欢迎阅读 BestBlogs.dev 第 77 期 AI 精选文章推荐。

本周的关键词是「氛围工程(Vibe Engineering)」。Simon Willison 用 JustHTML 项目诠释了这个概念的精髓:「Agent 负责打字,我负责思考」。这不是把代码丢给 AI 然后祈祷测试能过,而是工程师对每一行代码负责,同时在各环节充分利用 AI 代理。从 OpenAI 内部 92% 的 Codex 采用率,到 Every 公司 99% 的代码由 AI 编写,氛围工程正在从流行语变成真正的方法论。

说到实践,本周我也用氛围工程的方式对 BestBlogs.dev 的服务端进行了一次大手术:模块拆分、分布式部署、数据库集群搭建,从单机架构升级为可扩展的分布式系统。过程中深刻体会到:AI 确实能大幅提升编码效率,但架构决策、模块边界划分、测试策略这些「思考」的部分,依然需要人来把控。即将部署上线,敬请期待。

以下是本周最值得关注的 10 个精彩亮点:

🏆 Gemini 3 Flash 试图打破 AI 模型的帕累托极限:Pro 级推理能力(GPQA 90.4%)配上 Flash 级延迟,吞吐量达 218 Token/秒。可调节的思考层级参数和上下文缓存技术,让复杂 Agent 场景的落地成本大幅降低。OpenAI 还怎么玩?

🤖 GPT-5.2 Codex 专为智能体编码场景优化,主打超长上下文理解、大规模代码重构和网络安全能力。网友实测:很贵,但确实好用。编码模型的军备竞赛正式进入下半场。

🔬 DeepMind CEO Demis Hassabis 提出了一个核心论断:AGI = 50% 扩展 + 50% 创新 。单纯堆数据不够,还需要类似 AlphaGo 的搜索与规划能力。他把 AI 变革比作「10 倍速的工业革命」,并对后稀缺时代的经济体系重构提出了深刻见解。

🛠️ 本周最密集的话题是 Vibe Engineering 。OpenAI 内部数据显示使用 Codex 的工程师 PR 产出多 70%;Simon Willison 通过 JustHTML 展示了 3000 行代码通过 9200 个测试的实践;Kitze 清晰区分了盲目信任 AI 的 Vibe Coding 与战略性引导 AI 的 Vibe Engineering;淘特团队则分享了 SDD 落地的实战经验。

🧩 ByteByteGo 系统性拆解了 Deep Research 的多智能体架构——从编排者分解任务、子代理并行检索,到综合阶段生成带引用的报告。文章还对比了 OpenAI、Gemini、Claude、Perplexity 的实现差异,是理解 AI 研究系统工作原理的优质参考。

📈 Lovable 用不到一年、仅 100 人的团队达成 2 亿美元 ARR,打破 SaaS 增长记录。Elena Verna 的复盘揭示了 AI 时代的增长逻辑重构:95% 创新投入、激进免费策略、公开构建,以及用「最小可爱产品(MLP)」取代 MVP 的产品哲学。

💡 Every 的 CEO Dan Shipper 分享了打造 AI 原生公司 的激进实践:99% 的代码由 AI Agent 编写,单人即可构建并维护复杂的生产级应用。「复利工程」概念——将隐性开发知识转化为可复用的 Prompt 库——实现了工程效率的 10 倍跃升。

📊 真格基金戴雨森将 2026 年定义为 The Year of R :Return(回报考核)、Research(新研究范式)、Remember(个性化记忆)。他冷静预警了二级市场的回调风险,并用「哑铃型策略」为创业者和投资者提供了穿越周期的建议。

🎨 图像与视频生成领域本周也有重磅更新。GPT Image 1.5 显著提升了指令遵循和局部编辑精准度;字节的 Seedance 1.5 pro 则实现了音视频联合生成,原生支持多语种口型匹配,标志着 AI 视频从单一视觉向视听一体化叙事的跨越。

🌐 Anthropic 发布的 Interviewer 工具通过 1250 人深度访谈,绘制了一幅「人类情绪雷达图」:职场人掩饰自动化以维持专业形象,创作者在效率与原创性焦虑中挣扎,科学家因可靠性顾虑保留核心判断。AI 研究正从技术指标转向对人类心理的深度理解。

希望本期的推荐能为您带来新的启发。保持好奇,我们下周见!

网易科技
mp.weixin.qq.com
12-18
3465 字 · 约 14 分钟
94
OpenAI 还怎么玩?谷歌凌晨炸场!Pro 级智商跌成“白菜价”,网友惊呼:六边形战士

谷歌发布 Gemini 3 Flash,试图打破 AI 模型性能与效率的帕累托极限。该模型在保留 Gemini 3 Pro 级推理能力(GPQA 90.4%)的同时,实现了 Flash 级的极低延迟和 3 倍速度提升,吞吐量达 218 Token/秒。其核心特色包括可调节的思考层级参数和上下文缓存技术,显著降低了法律、金融和编程等复杂 Agent 场景的落地成本。

浮之静
mp.weixin.qq.com
12-17
3351 字 · 约 14 分钟
92
GPT Image 1.5 实测 & Prompt 指南

OpenAI 发布全新旗舰图像模型 GPT-Image-1.5,显著提升了指令遵循能力和局部编辑的精准度。新模型在多轮编辑中能有效保持光照、构图与人物外观的一致性,并大幅增强了文字渲染效果。文章不仅详细解读了官方 Prompt 指南(包括通用骨架与硬约束写法),还通过与 Gemini 3.0 Pro Image 的对比测试,展示了 GPT 在风格迁移上的优势及在复杂图像合成场景下的局限,适合关注 AI 绘图进阶与工作流整合的读者。

字节跳动Seed
mp.weixin.qq.com
12-16
4297 字 · 约 18 分钟
91
声画俱全,一镜入戏 | Seedance 1.5 pro 音视频创作模型正式发布

字节跳动 Seed 团队发布 Seedance 1.5 pro,这是一款突破性的音视频联合生成模型,标志着 AI 视频从单一视觉生成向视听一体化叙事的跨越。该模型基于 MMDiT 架构,核心亮点在于实现了精准的音画同步,原生支持多语种及方言的口型匹配与情感演绎。除了音频突破,它还显著提升了电影级运镜控制(如希区柯克变焦)和叙事连贯性。虽然在多角色对话和物理稳定性上仍有改进空间,但其在短剧、广告及影视创作中的实用价值已大幅提升,目前已在即梦 AI 和豆包上线。

Google DeepMind
youtube.com
12-16
12482 字 · 约 50 分钟
93
智能的未来 | 戴密斯·哈萨比斯(DeepMind 联合创始人兼首席执行官)

这期 Google DeepMind 年度访谈中,CEO Demis Hassabis 深入剖析了从 Gemini 3 到通用人工智能的技术路径。他提出了「AGI = 50% 扩展 + 50% 创新」的核心论断,强调单纯依赖数据堆叠不足以实现突破,必须结合类似 AlphaGo 的搜索与规划能力。访谈重点探讨了世界模型和模拟环境在理解物理规律和加速科学发现(如核聚变、材料科学)中的关键作用。此外,Hassabis 将 AI 变革比作「10 倍速的工业革命」,并对后稀缺时代的经济体系重构提出了深刻见解。

赛博禅心
mp.weixin.qq.com
12-14
1539 字 · 约 7 分钟
93
下一场革命:Vibe Engineering|OpenAI 内部分享

OpenAI 内部分享会揭示了 Codex 在公司内部的真实应用数据:92% 的技术人员采用率,使用者 PR 产出比不用者多 70%。文章记录了两个震撼的案例:7 小时 200 轮迭代产出 500 行高质量代码,以及 12 小时从空目录完成完整 Kotlin 到 Rust 的重写项目。更值得关注的是工程师角色的根本转变——从写代码变成管理 AI 代理,甚至是管理 AI 代理创建的子代理。Simon Willison 提出的「Vibe Engineering」概念与「Vibe Coding」形成鲜明对比:后者是让模型随便写代码然后祈祷测试能过,前者是高级工程师对每一行代码负责,同时在各环节充分利用代理。对于关注 AI 编程工具发展趋势的开发者,这是一手的内部实践参考。

Simon Willison's Weblog
simonwillison.net
12-14
848 字 · 约 4 分钟
93

JustHTML 是一个几乎完全由 LLM 构建的纯 Python HTML5 解析器,通过 9200 多个官方测试,只有 3000 行代码。但作者 Emil 的工作方式不是 vibe coding 而是 vibe engineering——他负责架构设计、测试策略、性能优化等关键决策,AI 负责具体实现。正如他所说:agent 负责打字,我负责思考。

大淘宝技术
mp.weixin.qq.com
12-15
12243 字 · 约 49 分钟
92

淘特团队探索了从 Copilot 到 SDD 的 AI 编程演进之路。针对 Agentic Coding 代码风格失控和 SDD 落地难的问题,提出了一套实用解法:利用 Rules 文件锁定项目规范,配合轻量级技术方案和 AI 自动维护文档,在复杂的业务场景中实现了规范性与效率的平衡。

AI Engineer
youtube.com
12-13
9931 字 · 约 40 分钟
92
从“氛围编码”到“氛围工程”——Kitze 与 Sizzy

Kitze 用极具感染力的幽默风格,深入探讨了 AI 时代开发者的生存之道。他清晰区分了「Vibe Coding」(盲目信任 AI 生成代码) 和「Vibe Engineering」(结合技术知识战略性引导 AI),并分享了 Composer One 如何改变他的开发工作流。演讲涵盖了前端开发的现状、AI 工具的正确使用方式、开发者需要掌握的新技能,以及对工作岗位变化的深刻洞察。特别值得关注的是他对如何高效使用 AI 智能体的实战经验,从语音编码到上下文管理,都有详细的方法论分享。

ByteByteGo Newsletter
blog.bytebytego.com
12-12
2666 字 · 约 11 分钟
92
OpenAI、Gemini 和 Claude 如何利用智能体赋能深度研究

ByteByteGo 这篇技术深度文章系统性地拆解了 Deep Research 系统的多智能体架构。文章详细解释了从用户查询到最终报告生成的完整流程,包括编排者如何将任务分解给专门的子代理、并行执行信息检索、以及综合阶段如何生成带引用的研究报告。特别有价值的是对比分析了 OpenAI、Gemini、Claude、Perplexity 等主流平台的实现差异,比如 OpenAI 采用交互式澄清、Gemini 自主生成研究计划。配合清晰的架构图,适合想要深入理解 AI 研究系统工作原理的开发者和架构师。

Lenny's Podcast
youtube.com
12-18
11186 字 · 约 45 分钟
93
Lovable 如何在一年内实现 2 亿 ARR:2026 年新版 AI 增长策略

Lovable 在不到一年内以仅 100 人的团队达成 2 亿美元 ARR,打破了 SaaS 增长的历史记录。Elena Verna 深度复盘了 AI 时代的增长逻辑重构:传统的漏斗优化已失效,取而代之的是 95% 的创新投入、激进的免费策略和公开构建。她提出了「最小可爱产品(MLP)」取代 MVP,以及 PMF 需每季度重塑的深刻洞察。这是理解 AI Native 公司如何通过氛围编码和极致产品力重写增长剧本的必听内容。

Founder Park
mp.weixin.qq.com
12-16
8151 字 · 约 33 分钟
93
独家对话 Looki 创始人孙洋:摸着自己过河

Looki L1 通过重塑 AI 硬件 叙事,实现了从「电子垃圾」嫌疑到日均 7.9 小时高频伴侣的逆袭。访谈核心在于产品逻辑的迭代——从单纯记录转向上下文理解与主动式惊喜。创始人孙洋关于「周中工作流」的高频应用洞察,以及超越硬件销售的 价值售卖 长期愿景,为 AI 硬件创业提供了极具参考价值的实战路径。

Founder Park
mp.weixin.qq.com
12-17
8731 字 · 约 35 分钟
92
12 月,我们推荐这 7 款 AI 新品

这篇文章汇集了极客公园创新大会上展示的 7 款具有代表性的 AI 新品,涵盖笔记、摄影、办公助手、营销、Agent 市场、可穿戴硬件及电商视觉等领域。文章通过 flomo、Doka、remio 等创始人的分享,深入探讨了 AI 时代的产品哲学:从 flomo 坚持不做生成内容而专注「上下文」洞察,到 Pallas AI 提出的 AEO 概念。这是一份关于 AI 落地场景多样性与差异化竞争策略的实战观察,适合产品经理和创业者寻找灵感。

AI Engineer
youtube.com
12-18
4414 字 · 约 18 分钟
92
如何打造一家 AI 原生公司(即使您的公司已有 50 年历史)—— Dan Shipper,Every 公司创始人

Every 的 CEO Dan Shipper 分享了打造 100% AI 原生公司的激进实践。在 Every,99% 的代码由 AI Agent 编写,单人即可构建并维护复杂的生产级应用。文章提出了「复利工程」概念,通过将隐性开发知识转化为可复用的 Prompt 库,实现了并行工作流和跨产品代码共享。这不仅将原型设计的边际成本降至极低,还重塑了组织文化,让管理者和 CEO 也能在碎片时间轻松提交生产级代码,实现了工程效率的 10 倍跃升。

新智元
mp.weixin.qq.com
12-15
3974 字 · 约 16 分钟
92
Anthropic 重磅新研究:当 AI 采访了 1250 人,它看见了人类的「职业软肋」

Anthropic 发布了创新工具 Interviewer,不仅展示了 AI 进行大规模定性研究的能力,更通过对 1250 名用户的深度访谈,绘制了一幅精准的「人类情绪雷达图」。研究揭示了职场人、创作者和科学家在面对 AI 时的不同心理图谱:职场人掩饰自动化以维持专业形象,创作者在效率与原创性焦虑中挣扎,科学家则因可靠性顾虑而保留核心判断。这篇文章深刻剖析了 AI 如何触碰各职业「不可替代的核心」,标志着 AI 研究从单纯的技术指标转向对人类心理和社会关系的深度理解。

Web3天空之城
mp.weixin.qq.com
12-15
20729 字 · 约 83 分钟
92
谷歌创始人布林在斯坦福工程学院百年庆典对话: 创新, 创业与人工智能的未来 | 图解全文+音频评论+视频 |附 2 万字原文

谢尔盖·布林重返一线后的深度分享。核心观点:1. 算法 > 规模:算力只是甜点,算法突破才是主菜;2. 速度危机:AI 迭代极快,甚至连 Google 都因对 Transformer 犹豫而需奋起直追;3. 教育预言:知识传播去中心化,传统大学实体模式恐难延续百年。适合关注 AGI 趋势与技术哲学的读者。

张小珺Jùn|商业访谈录
xiaoyuzhoufm.com
12-13
2973 字 · 约 12 分钟
94
124. 年终回顾【站在 2025 年之外】和戴雨森聊 2026 年预期、The Year of R、回调、我们如何下注

本期播客是对 AI 行业从狂热转向务实的关键复盘。真格基金戴雨森将 2026 年定义为 "The Year of R",包含三个核心维度:Return(回报)——市场将从盲目投入转向对 ROI 和高质量增长的考核;Research(研究)——单纯的 Scaling Law 遇瓶颈,需通过新研究范式(如 Thinking Time Scaling)解锁能力;Remember(记忆)——应用层真正的护城河在于基于用户上下文的个性化记忆。戴雨森不仅分析了中国模型公司在开源生态中的强劲追赶,还冷静预警了二级市场潜在的回调风险,通过“哑铃型策略”为创业者和投资者提供了穿越周期的建议。

Z Potentials
mp.weixin.qq.com
12-17
3148 字 · 约 13 分钟
92
深度| 大模型年终观察,如何定义 2025 年的"好模型"?

这篇文章精准捕捉了 2025 年 AI 行业的关键转折点:市场正从跑分疲劳转向建立真正的信任。Interconnects.ai 和 OpenRouter 的数据表明,DeepSeek、Kimi 等开源模型已从可选项变为必选项,且在复杂推理任务中的 Token 份额显著上升。文章提出了构建 AI 信任的三个务实维度:基于真实生产数据的多维评测、以成本透明化为核心的部署工程,以及强调可治理与可观测性的交付体系。

    BestBlogs.dev 第 77 期:氛围工程 | BestBlogs.dev