跳转到主要内容
精选推送

BestBlogs.dev 第 79 期:大模型上市元年

大家好!欢迎阅读 BestBlogs.dev 第 79 期 AI 精选文章推荐。

这是 2026 年的第一期,本周的关键词是大模型上市元年

智谱以「全球大模型第一股」的身份登陆港交所,Minimax 紧随其后完成上市。从 2023 年的百模大战,到 2025 年的商业化落地,再到 2026 年开年的资本市场验证,中国大模型行业用三年时间完成了从技术竞赛到价值兑现的跨越。这不仅是两家公司的里程碑,更是整个行业进入成熟期的信号。

BestBlogs 也在新年迎来了一些变化。应群友的建议,我们新增了 OAuth 和验证码登录,登录后可以收藏、划线喜欢的内容,方便回顾自己的阅读轨迹。同时开放了订阅源推荐功能,你可以提交优质的内容源,通过展示推荐人和推荐理由,让社区共同参与内容建设。

以下是本周最值得关注的 10 个精彩亮点:

🏆 智谱Minimax 同期上市,两期播客分别对话了智谱 CEO 张鹏和 Minimax 天使投资人陈昱。张鹏复盘了智谱从「认知智能」起步到坚定 ToB 路线的十年历程;陈昱则揭秘了 Minimax 如何通过 MoE 架构和多模态差异化在烧钱大战中突围。两场对话共同描绘了中国大模型从技术萌芽到资本验证的激荡三年。

📊 Simon Willison 发布了他标志性的年度 LLM 复盘 ,将 2025 定义为「推理」与「智能体」爆发之年。文章梳理了 RLVR 带来的推理飞跃、CLI 编程 Agent 改变开发工作流、DeepSeek 等中国开源模型的崛起,以及 200 美元订阅制的普及。另一篇国内盘点则从 GPT-5.2 到 Manus,列出了年度最强模型、应用与硬件。

🤖 阿里通义开源 MAI-UI 系列 GUI 智能体(2B/8B),在 ScreenSpot-Pro 等评测中刷新 SOTA。模型首创将主动交互、MCP 工具调用与端云协同融合,有效解决移动端长程任务中的指令模糊问题,同时发布了高难度评测基准 MobileWorld。

💡 Manus 出售前的最后一期访谈,季逸超复盘了从少年极客到打造顶尖通用 Agent 的心路。核心在于 Manus 如何在垂类与通用 Agent 的路线之争中选择「模拟人」而非「制造工具」,以及为何放弃自研基座模型而专注于 Context Engineering。

🛠️ Anthropic 的 Claude Agent SDK 研讨会提出「Bash Is All You Need」,主张用 Bash 脚本和 Codegen 的组合性超越传统刚性 Tool 定义。腾讯 CodeBuddy 负责人则提出 GENIUS AI 框架,批判氛围编程的局限性,主张向规约编程进阶。两篇内容共同指向 AI Coding 从「补全」到「自主」的演进路径。

📁 Cursor 提出动态上下文发现 机制,用文件系统替代全量静态注入,特定场景下 Token 消耗降低 46.9%。另一篇文章则探讨上下文图谱 ,传统系统记录了「发生了什么」却丢失了「为什么」,Agent 的真正价值在于捕捉跨系统的决策轨迹,构建组织的动态世界模型。

🌐 CES 2026 现场报道展现了 AI 从云端模型进化为物理实体的全景:会飞的 AI 萌宠、38.5 克超轻量眼镜、人形机器人矩阵。中国企业占比近 1/4,AI 硬件正从参数竞赛转向用户体验。黄仁勋则发布了 Rubin 全新计算架构和 Cosmos 世界模型,为万亿级参数模型和物理 AI 定义新天花板。

🧩 淘宝技术团队借用「道、法、术」框架剖析 AI 工程与传统工程 的异同:「道」上从追求绝对正确转向管理概率预期;「法」上从领域建模转移至上下文工程;「术」上强调轨迹可视化与多维评估。对于正从传统架构转型的工程师,这是一份实战指南。

👨‍💼 Agent in the Shell 借用《攻壳机动队》的隐喻,指出 Agent 虽有强大规划能力,却被迫伪装成人去操作为人类设计的 GUI。这种系统性失配撕毁了旧有商业契约,未来必须将 Agent 纳为合法行动者。另一篇文章则探讨 AI 时代产品经理的价值重构:从功能交付转向效果交付,在不确定性中构建稳定的价值框架。

🎤 马斯克在特斯拉工厂的 4 万字访谈预言 AGI 将在 2026 年实现,提出「普遍高收入」的经济图景。罗永浩对话 Lovart 创始人陈冕,探讨 AI-native 产品的构建逻辑,真正的创新不在于将 AI 嫁接到旧工作流,而在于挖掘新人群与新需求。另一期播客对话 AI 领域积极行动者 Zara,聚焦非技术背景如何在 AI 浪潮中转型,核心观点:AI 降低了技术门槛,却让营销、分发与品牌成为新的稀缺壁垒。

2026 年开年,大模型公司敲钟上市,算力架构迭代升级,Agent 从概念走向落地。新的一年,新的坐标。保持好奇,我们下周见!

Simon Willison's Weblog
simonwillison.net
12-31
7469 字 · 约 30 分钟
93
2025:大语言模型年度回顾

Simon Willison 发布了其年度标志性的 AI 领域复盘。文章将 2025 定义为「推理」与「智能体」爆发的一年,详细梳理了从 RLVR 技术带来的推理能力飞跃,到 Claude Code 等 CLI 编程 Agent 如何彻底改变开发工作流。作者重点分析了中国开源模型(如 DeepSeek)的强势崛起、200 美元订阅制的普及,以及「偏差常态化」带来的安全隐患。

通义大模型
mp.weixin.qq.com
12-29
3377 字 · 约 14 分钟
92
MAI-UI 开源:通用 GUI 智能体基座登顶 SOTA!

阿里通义实验室开源 MAI-UI 系列 GUI 智能体(2B/8B),在 ScreenSpot-Pro 和 AndroidWorld 等权威评测中刷新 SOTA。模型首创将主动交互、MCP 工具调用与端云协同机制融合,有效解决移动端长程任务中的指令模糊与操作中断问题,并发布了高难度评测基准 MobileWorld。

129. 全球大模型第一股的上市访谈,和智谱 CEO 张鹏聊:敢问路在何方?

这期播客分享了智谱 AI CEO 张鹏在公司于港交所上市这一历史时刻的深刻思考。文章详尽回顾了智谱从 2016 年探索「认知智能」起步,到坚持技术原生、推出 GLM 模型,再到 2026 年成为「全球大模型第一股」的创业全貌。张鹏坦诚地分享了智谱为何在 C 端热潮中坚定选择 ToB 商业化路径,以及如何在百模大战的泡沫中保持理性。对于关注 AI 行业演进、大模型商业落地及清华系创业生态的读者来说,这不仅是一家公司的成长史,更是中国 AI 行业从感知走向认知的缩影。

61.Minimax 上市,与大模型牌局的三年演进|对话云启陈昱

本期播客深度对话 Minimax 天使投资人陈昱,系统复盘了中国大模型独角兽从技术萌芽到 2026 年成功上市的激荡三年。节目不仅揭秘了 Minimax 如何通过 MOE 架构和多模态差异化路线在「烧钱大战」中突围,更首次公开了陈昱「猎手型」的投资哲学——在不确定性中通过底层研究锚定「聪明且有野心」的创始人。

AI Engineer
youtube.com
01-05
7676 字 · 约 31 分钟
92
Claude Agent SDK [完整研讨会] — Thariq Shihipar,Anthropic

Anthropic 的 Thariq Shihipar 深入解析 Claude Agent SDK,提出从线性工作流向自主 Agent 演进的技术路线。核心观点强调「Bash Is All You Need」,主张利用 Bash 脚本和 Codegen 的组合性超越传统刚性 Tool 定义。内容涵盖通过文件系统进行上下文工程、将非结构化数据转化为 SQL 接口、以及利用子智能体管理大规模上下文。这对构建从简单自动化到处理 5000 万行代码库的复杂系统提供了实战架构指导。

CSDN
mp.weixin.qq.com
01-04
6967 字 · 约 28 分钟
93
AI Coding 产品的顶层思考与方法论:从范式革命到规约编程

本文由腾讯 CodeBuddy 产品负责人深度解析 AI Coding 的战略定位与落地方法论。作者提出了原创的 GENIUS AI 框架(涵盖质量、效率、创新等六个维度),并批判性地指出当前流行的氛围编程在复杂工程中的局限性,主张向规约编程进阶。文章结合腾讯内部数据与全球竞品分析,探讨了从 L1 聊天机器人到 L5 自主 AI 开发团队的演进路径,是产品经理和技术领导者理解 AI 软件工程革命的必读之作。

宝玉的分享
baoyu.io
01-07
2462 字 · 约 10 分钟
93
动态上下文发现 (Dynamic Context Discovery)

Cursor 提出了「动态上下文发现」机制,核心理念是利用文件系统作为 AI Agent 的交互接口,替代传统的全量静态上下文注入。通过让 Agent 根据任务需求主动读取文件(如长日志、MCP 工具定义),该策略在大幅降低 Token 消耗(特定场景下节省 46.9%)的同时,避免了无关信息对模型的干扰。文章通过五个具体的工程实例,展示了如何利用这一策略构建更高效、更专注的编程智能体。

大淘宝技术
mp.weixin.qq.com
01-05
7748 字 · 约 31 分钟
92
AI 工程 vs 传统工程 —「道法术」中的变与不变

本文由淘宝搜索技术团队专家撰写,借用中国传统哲学「道、法、术」框架,深度剖析了 AI 工程与传统软件工程的本质异同。作者核心观点鲜明:AI 工程并非推倒重来,而是在坚实工程基础上,为应对大模型「不确定性」进行的架构升级。 在「道」上,工程目标从追求绝对正确转向管理概率预期;在「法」上,架构重心从传统的领域建模转移至上下文工程与不确定性边界控制;在「术」上,则强调轨迹可视化与多维评估体系的引入。对于正从传统架构转型 AI 应用开发的工程师而言,这是一份极具价值的实战指南。

LangChain
youtube.com
01-08
6436 字 · 约 26 分钟
92
Cursor 如何构建 AI 编程工具的未来

这场由 LangChain CEO Harrison Chase 与 Cursor 工程主管 Jason Ginsberg 展开的深度对话,揭示了 AI 编程工具从「代码补全」向「自主 Agent」演进的核心逻辑。视频深入探讨了 Cursor 如何通过调试模式实现 Agent 的自我纠错,以及即将推出的可视化编辑器如何模糊代码与设计之间的边界。Jason 强调了 Cursor 内部极简的开发流程与 Dogfooding 文化对产品迭代的驱动作用。

言午
mp.weixin.qq.com
01-01
6925 字 · 约 28 分钟
93
Agent in the Shell,豆包手机是敲键盘的“机械手指”吗?

本文深入探讨了 AI Agent 在当前互联网架构中面临的「身份困境」。作者借用《攻壳机动队》的隐喻,指出 Agent 虽拥有强大的规划能力,却被迫套上伪装成人的外壳去操作为人类设计的 GUI。这种系统性失配撕毁了基于「注意力税」和「人类担责」的旧有商业契约。文章预言,未来必须通过建立可识别身份、精细授权和审计黑匣子等制度,将 Agent 纳为合法行动者,实现从 UI 交互向协议治理的范式转移。推荐给关注 AI 基础设施及数字化商业模式演进的读者。

智东西
mp.weixin.qq.com
01-07
17198 字 · 约 69 分钟
92
暴走 2 万步逛遍 CES2026:9 大方向最火,中企霸场,机器人全明星大乱斗

智东西深入 CES 2026 现场,全景展现了人工智能如何从纯粹的云端模型进化为触手可及的物理实体。文章涵盖了从会飞的 AI 萌宠、38.5 克超轻量 AI 眼镜到爆发式增长的人形机器人矩阵等前沿新品。报道特别强调了中国企业在这一届展会中的主导地位(占比近 1/4),并观察到 AI 硬件正从模型参数竞赛向实际用户体验转型。

Founder Park
mp.weixin.qq.com
12-29
8669 字 · 约 35 分钟
93
推特热议、AI 万亿美元新赛道,「上下文图谱」到底是什么?创业机会在哪?

传统记录系统只记录了「发生了什么」,却丢失了「为什么」。本文深入探讨了 SaaS 领域的最新争论,反驳了「Agent 仅需更好数据治理」的观点,提出 AI Agent 的真正价值在于捕捉跨系统的决策轨迹,构建组织的上下文图谱。这不仅是技术架构的演进,更是下一个万亿美元级的创业机会:打造企业的动态世界模型,让隐性知识转化为核心数据资产,解决企业运营中的「碎片化税」和「双时钟问题」。

人人都是产品经理
mp.weixin.qq.com
12-25
5726 字 · 约 23 分钟
91
阙杭宁:AI 时代产品经理的价值重构与实战探索

本文探讨了 AI 时代产品经理的新范式:从功能交付转向效果交付。通过网易云信在 AI 玩具领域的实战,展示了如何用云端算力弥补端侧硬件局限,并利用故事引擎优化情感陪伴体验。核心观点在于,AI 产品的本质是在不确定性中构建稳定的价值框架,并帮助传统厂商大幅缩短 POC 周期。

Lenny's Podcast
youtube.com
12-28
23498 字 · 约 94 分钟
93
Rippling 首席产品官 Matt MacInnis:每位领导者都需要听的 10 个反传统领导力真理

Rippling 首席产品官 Matt MacInnis 在这期播客中分享了打造 160 亿美元估值公司背后的反常识原则。他提出的「高 Alpha,低 Beta」框架为团队管理和产品开发提供了新视角:在需要创新的地方追求高 Alpha,在需要稳定的地方降低 Beta。更有价值的是他对硅谷流行观念的挑战:成功比失败教会你更多,VC 的「永不放弃」是为投资人服务而非创始人,产品市场契合度到来时是显而易见的。对于产品领导者和创业者,这是一次难得的深度对话,展现了如何通过持续高强度对抗组织熵,以及为什么「非凡的成果需要非凡的努力」。

128. Manus 决定出售前最后的访谈:啊,这奇幻的 2025 年漂流啊…

这期播客是 Manus 联合创始人季逸超的深度访谈,复盘了其从少年极客到打造顶尖通用 AI 智能体的心路历程。访谈核心在于 Manus 如何在「垂类 Agent」与「通用 Agent」的路线之争中,坚定选择了后者,即「模拟人」而非「制造工具」。季逸超详细拆解了 Manus 的技术决策:为何放弃自研基座模型而专注于 Context Engineering 和 Agent 架构;为何在早期砍掉 AI 原生浏览器项目;以及如何通过 Monica 积累现金流和用户洞察。

51CTO技术栈
mp.weixin.qq.com
01-06
20124 字 · 约 81 分钟
93
重磅!黄仁勋开年第一讲:世界在经历两大平台级革命!全新计算架构 Rubin 亮相!开源首个自动驾驶 AI,发布 AI 原生应用框架!曝 Grok5 参数规模

黄仁勋在 CES 2026 再次定义了 AI 算力的天花板。本次演讲的核心在于 NVIDIA 的全栈战略升级:硬件上,发布了集成了 Vera CPU 和 Rubin GPU 的全新计算架构,专为万亿级参数模型设计;软件上,推出了针对物理 AI (Physical AI) 的 Cosmos 世界模型 和具备推理能力的自动驾驶模型 Alpamayo。文章详细拆解了 NVIDIA 如何通过与 Siemens、Cadence 等工业巨头合作,将 Agentic AI 引入数字孪生与机器人制造。

Web3天空之城
mp.weixin.qq.com
01-07
44399 字 · 约 178 分钟
92
新年 4 万字对话埃隆·马斯克: 中国芯片, 奇点,丰裕时代与人类的终极演化 |图解+视频 |附全文

埃隆·马斯克在特斯拉超级工厂的这场深度访谈,为我们描绘了一个即将被「超音速海啸」席卷的未来。他预言通用人工智能将在 2026 年 实现,并提出了「普遍高收入」这一颠覆性的经济图景。对话跨越了太阳能革命、轨道数据中心以及 Optimus 机器人的三倍指数增长。这不仅是对技术的预测,更是对人类文明作为「生物引导加载程序」的深刻反思,是任何关注奇点临近与社会变革读者的必读之作。

十字路口Crossing
xiaoyuzhoufm.com
01-05
36294 字 · 约 146 分钟
92
AI 时代是谁的黄金时代?|和张咋啦聊:文科生、积极行动、爆款的规律、普通人也能赢

本期播客深度对话 AI 领域的「积极行动者」ZARA,探讨非技术背景(文科生)如何在 AI 浪潮中实现个人转型。核心观点认为:AI 极大地降低了技术门槛,却使得「营销、分发与品牌」成为了新的稀缺壁垒。ZARA 提出的「活人感」营销理念,主张创始人应成为首席营销官,通过「Learn in Public」积累个人复利。播客不仅分享了从 VC 到产品经理的跨界心路,更提供了关于高主观能动性的实操建议。适合对 AI 转型感到焦虑、希望打造个人品牌的职场人与创业者收听。

罗永浩的十字路口
xiaoyuzhoufm.com
01-09
675 字 · 约 3 分钟
93
Lovart 创始人陈冕×罗永浩!且让我大闹一场,然后悄然离去

在本期《罗永浩的十字路口》中,罗永浩深度对话了 Lovart 创始人陈冕。陈冕分享了他横跨腾讯、百度、滴滴、字节跳动等大厂的通关履历,以及在 AI 浪潮中寻求个人救赎的创业历程。访谈核心聚焦于 AI-native 产品的构建逻辑:真正的创新不在于将 AI 嫁接到旧的工作流,而在于通过 AI 挖掘新人群与新需求,实现设计行业的平权。陈冕预言 AI 将取代 80% 以上的初级设计工作,但也为具备审美和品味的顶尖人才创造了更高价值。无论你是关注 AI 趋势的从业者,还是处于职场焦虑中的创业者,这长达四小时的对谈都能为你提供关于认知、速度与信念的深刻启发。

    BestBlogs.dev 第 79 期:大模型上市元年 | BestBlogs.dev