
Simon Willison 发布了其年度标志性的 AI 领域复盘。文章将 2025 定义为「推理」与「智能体」爆发的一年,详细梳理了从 RLVR 技术带来的推理能力飞跃,到 Claude Code 等 CLI 编程 Agent 如何彻底改变开发工作流。作者重点分析了中国开源模型(如 DeepSeek)的强势崛起、200 美元订阅制的普及,以及「偏差常态化」带来的安全隐患。
大家好!欢迎阅读 BestBlogs.dev 第 79 期 AI 精选文章推荐。
这是 2026 年的第一期,本周的关键词是大模型上市元年 。
智谱以「全球大模型第一股」的身份登陆港交所,Minimax 紧随其后完成上市。从 2023 年的百模大战,到 2025 年的商业化落地,再到 2026 年开年的资本市场验证,中国大模型行业用三年时间完成了从技术竞赛到价值兑现的跨越。这不仅是两家公司的里程碑,更是整个行业进入成熟期的信号。
BestBlogs 也在新年迎来了一些变化。应群友的建议,我们新增了 OAuth 和验证码登录,登录后可以收藏、划线喜欢的内容,方便回顾自己的阅读轨迹。同时开放了订阅源推荐功能,你可以提交优质的内容源,通过展示推荐人和推荐理由,让社区共同参与内容建设。
以下是本周最值得关注的 10 个精彩亮点:
🏆 智谱 和 Minimax 同期上市,两期播客分别对话了智谱 CEO 张鹏和 Minimax 天使投资人陈昱。张鹏复盘了智谱从「认知智能」起步到坚定 ToB 路线的十年历程;陈昱则揭秘了 Minimax 如何通过 MoE 架构和多模态差异化在烧钱大战中突围。两场对话共同描绘了中国大模型从技术萌芽到资本验证的激荡三年。
📊 Simon Willison 发布了他标志性的年度 LLM 复盘 ,将 2025 定义为「推理」与「智能体」爆发之年。文章梳理了 RLVR 带来的推理飞跃、CLI 编程 Agent 改变开发工作流、DeepSeek 等中国开源模型的崛起,以及 200 美元订阅制的普及。另一篇国内盘点则从 GPT-5.2 到 Manus,列出了年度最强模型、应用与硬件。
🤖 阿里通义开源 MAI-UI 系列 GUI 智能体(2B/8B),在 ScreenSpot-Pro 等评测中刷新 SOTA。模型首创将主动交互、MCP 工具调用与端云协同融合,有效解决移动端长程任务中的指令模糊问题,同时发布了高难度评测基准 MobileWorld。
💡 Manus 出售前的最后一期访谈,季逸超复盘了从少年极客到打造顶尖通用 Agent 的心路。核心在于 Manus 如何在垂类与通用 Agent 的路线之争中选择「模拟人」而非「制造工具」,以及为何放弃自研基座模型而专注于 Context Engineering。
🛠️ Anthropic 的 Claude Agent SDK 研讨会提出「Bash Is All You Need」,主张用 Bash 脚本和 Codegen 的组合性超越传统刚性 Tool 定义。腾讯 CodeBuddy 负责人则提出 GENIUS AI 框架,批判氛围编程的局限性,主张向规约编程进阶。两篇内容共同指向 AI Coding 从「补全」到「自主」的演进路径。
📁 Cursor 提出动态上下文发现 机制,用文件系统替代全量静态注入,特定场景下 Token 消耗降低 46.9%。另一篇文章则探讨上下文图谱 ,传统系统记录了「发生了什么」却丢失了「为什么」,Agent 的真正价值在于捕捉跨系统的决策轨迹,构建组织的动态世界模型。
🌐 CES 2026 现场报道展现了 AI 从云端模型进化为物理实体的全景:会飞的 AI 萌宠、38.5 克超轻量眼镜、人形机器人矩阵。中国企业占比近 1/4,AI 硬件正从参数竞赛转向用户体验。黄仁勋则发布了 Rubin 全新计算架构和 Cosmos 世界模型,为万亿级参数模型和物理 AI 定义新天花板。
🧩 淘宝技术团队借用「道、法、术」框架剖析 AI 工程与传统工程 的异同:「道」上从追求绝对正确转向管理概率预期;「法」上从领域建模转移至上下文工程;「术」上强调轨迹可视化与多维评估。对于正从传统架构转型的工程师,这是一份实战指南。
👨💼 Agent in the Shell 借用《攻壳机动队》的隐喻,指出 Agent 虽有强大规划能力,却被迫伪装成人去操作为人类设计的 GUI。这种系统性失配撕毁了旧有商业契约,未来必须将 Agent 纳为合法行动者。另一篇文章则探讨 AI 时代产品经理的价值重构:从功能交付转向效果交付,在不确定性中构建稳定的价值框架。
🎤 马斯克在特斯拉工厂的 4 万字访谈预言 AGI 将在 2026 年实现,提出「普遍高收入」的经济图景。罗永浩对话 Lovart 创始人陈冕,探讨 AI-native 产品的构建逻辑,真正的创新不在于将 AI 嫁接到旧工作流,而在于挖掘新人群与新需求。另一期播客对话 AI 领域积极行动者 Zara,聚焦非技术背景如何在 AI 浪潮中转型,核心观点:AI 降低了技术门槛,却让营销、分发与品牌成为新的稀缺壁垒。
2026 年开年,大模型公司敲钟上市,算力架构迭代升级,Agent 从概念走向落地。新的一年,新的坐标。保持好奇,我们下周见!