bestblogs.dev - 汇集顶级编程、人工智能、产品、科技文章，大语言模型摘要评分辅助阅读，探索编程和技术未来

梁文锋 DeepSeek 新论文！接棒何恺明和字节，又稳了稳 AI 的“地基”

硅星人Pro

01-02

2723 字 (约 11 分钟)

90

DeepSeek 于 2026 年 1 月 1 日发布新论文《mHC: Manifold-Constrained Hyper-Connections》，提出了一种名为 mHC（流形约束超连接）的宏观架构创新。该创新是 Transformer 中最底层的组件——残差连接的一次重要改进，旨在解决字节跳动 Hyper-Connections 架构在提升模型性能时面临的训练稳定性问题。mHC 通过将连接权重矩阵约束到双随机矩阵，有效防止了信号爆炸和 Loss 尖峰，并在不引入新超参数的情况下提升了模型的收敛速度和稳定性。文章回顾了从何恺明 ResNet 到字节跳动 Hyper-Connections 再到 DeepSeek mHC 的十年技术演进，强调了 mHC 在优化超大规模模型训练效率方面的价值，并指出 DeepSeek 在底层工程实现上的“秀肌肉”能力，即通过手写 CUDA 内核代码等方式将理论方案高效落地。

梁文锋 DeepSeek 新论文！接棒何恺明和字节，又稳了稳 AI 的“地基”

硅星人Pro

|

01-02

|

2723 字 (约 11 分钟)

|

90

DeepSeek 于 2026 年 1 月 1 日发布新论文《mHC: Manifold-Constrained Hyper-Connections》，提出了一种名为 mHC（流形约束超连接）的宏观架构创新。该创新是 Transformer 中最底层的组件——残差连接的一次重要改进，旨在解决字节跳动 Hyper-Connections 架构在提升模型性能时面临的训练稳定性问题。mHC 通过将连接权重矩阵约束到双随机矩阵，有效防止了信号爆炸和 Loss 尖峰，并在不引入新超参数的情况下提升了模型的收敛速度和稳定性。文章回顾了从何恺明 ResNet 到字节跳动 Hyper-Connections 再到 DeepSeek mHC 的十年技术演进，强调了 mHC 在优化超大规模模型训练效率方面的价值，并指出 DeepSeek 在底层工程实现上的“秀肌肉”能力，即通过手写 CUDA 内核代码等方式将理论方案高效落地。

商业科技

中文

Transformer

残差连接

DeepSeek

Scaling Law 没死，它只是换了个活法

硅星人Pro

昨天

4030 字 (约 17 分钟)

90

本文深度探讨了 Scaling Law 是否已死的争议焦点，特别是在 Gemini 3 发布后，业界对大模型发展路径的重新思考。文章指出，尽管传统的“更大模型、更多数据、更多算力”这种简单粗暴的 Scaling Law 似乎遇到瓶颈，但其内涵正在发生变化。黄仁勋提出了预训练、后训练和推理时计算三条 Scaling 曲线，Sam Altman 也强调持续投入就能持续变好。各大科技巨头仍在投入巨资进行算力基础设施建设，表明 Scaling Law 并未失效，只是从单一维度扩展到多维度优化。文章还分析了不同参与者（如英伟达、OpenAI、Ilya Sutskever、世界模型派）在此争议中的立场和利益考量，并以 DeepSeek 为例，说明算力利用效率的重要性以及中国 AI 公司面临的挑战。最终得出结论：Scaling Law 未死，只是活法变了，从单纯的规模堆砌转向了多阶段、精细化的扩展和优化。

Scaling Law 没死，它只是换了个活法

硅星人Pro

|

昨天

|

4030 字 (约 17 分钟)

|

90

本文深度探讨了 Scaling Law 是否已死的争议焦点，特别是在 Gemini 3 发布后，业界对大模型发展路径的重新思考。文章指出，尽管传统的“更大模型、更多数据、更多算力”这种简单粗暴的 Scaling Law 似乎遇到瓶颈，但其内涵正在发生变化。黄仁勋提出了预训练、后训练和推理时计算三条 Scaling 曲线，Sam Altman 也强调持续投入就能持续变好。各大科技巨头仍在投入巨资进行算力基础设施建设，表明 Scaling Law 并未失效，只是从单一维度扩展到多维度优化。文章还分析了不同参与者（如英伟达、OpenAI、Ilya Sutskever、世界模型派）在此争议中的立场和利益考量，并以 DeepSeek 为例，说明算力利用效率的重要性以及中国 AI 公司面临的挑战。最终得出结论：Scaling Law 未死，只是活法变了，从单纯的规模堆砌转向了多阶段、精细化的扩展和优化。

商业科技

中文

Scaling Law

大模型

AI发展趋势

黄仁勋 CES 上硬菜：Vera Rubin 已量产！为 AI 赌上 6 颗芯片

硅星人Pro

今天

3420 字 (约 14 分钟)

89

文章详细报道了英伟达 CEO 黄仁勋在 CES 2026 上发布的核心内容——Vera Rubin AI 计算平台的全面投产。面对摩尔定律放缓与 AI 算力需求爆炸式增长的矛盾，英伟达采取激进策略，重新设计了 CPU、GPU、互联方式等六颗核心芯片。Rubin GPU 实现了 5 倍于 Blackwell 的推理性能，同时晶体管增量仅 1.6 倍；Vera CPU 首次采用 88 个自研 Olympus 核心。文章还介绍了硅光子集成技术 Spectrum-X 和解决 KV Cache 瓶颈的 BlueField-4 DPU，以及液冷无缆化设计的 NVL72 系统，使得 AI 训练效率大幅提升，成本显著下降。此外，英伟达还发布了面向物理 AI 的开源 VLA 模型 Alpamayo，进一步巩固了其在 AI 领域从芯片到系统到应用的全面布局。

黄仁勋 CES 上硬菜：Vera Rubin 已量产！为 AI 赌上 6 颗芯片

硅星人Pro

|

今天

|

3420 字 (约 14 分钟)

|

89

文章详细报道了英伟达 CEO 黄仁勋在 CES 2026 上发布的核心内容——Vera Rubin AI 计算平台的全面投产。面对摩尔定律放缓与 AI 算力需求爆炸式增长的矛盾，英伟达采取激进策略，重新设计了 CPU、GPU、互联方式等六颗核心芯片。Rubin GPU 实现了 5 倍于 Blackwell 的推理性能，同时晶体管增量仅 1.6 倍；Vera CPU 首次采用 88 个自研 Olympus 核心。文章还介绍了硅光子集成技术 Spectrum-X 和解决 KV Cache 瓶颈的 BlueField-4 DPU，以及液冷无缆化设计的 NVL72 系统，使得 AI 训练效率大幅提升，成本显著下降。此外，英伟达还发布了面向物理 AI 的开源 VLA 模型 Alpamayo，进一步巩固了其在 AI 领域从芯片到系统到应用的全面布局。

商业科技

中文

英伟达

Vera Rubin

AI芯片

关于 2026 年的 AI，这里有 20 个预判（不负责任版）

硅星人Pro

01-04

3650 字 (约 15 分钟)

88

文章对 2026 年 AI 领域提出了 20 个“不负责任”的预判，涵盖了从技术架构（如英伟达 GPU 地位动摇、后 Transformer 架构兴起）、应用形态（如 Chatbot 转向 Agent、AI Coding 使软件即时化、视频生成转向互动），到社会经济影响（如互联网分裂为硅基与碳基、Agent Economy 形成、AI 手机与超级 App 博弈加剧、GEO 替代 SEO），以及硬件发展（人形机器人、AI 硬件从视觉转向多模态感知、AI 陪伴硬件热潮），再到人机关系变化（人类成为 AI 的 Agent）。这些预判大胆且具前瞻性，尝试勾勒出未来几年 AI 发展的多元面貌和深远影响，许多观点触及了当前 AI 发展的瓶颈与新趋势。

关于 2026 年的 AI，这里有 20 个预判（不负责任版）

硅星人Pro

|

01-04

|

3650 字 (约 15 分钟)

|

88

文章对 2026 年 AI 领域提出了 20 个“不负责任”的预判，涵盖了从技术架构（如英伟达 GPU 地位动摇、后 Transformer 架构兴起）、应用形态（如 Chatbot 转向 Agent、AI Coding 使软件即时化、视频生成转向互动），到社会经济影响（如互联网分裂为硅基与碳基、Agent Economy 形成、AI 手机与超级 App 博弈加剧、GEO 替代 SEO），以及硬件发展（人形机器人、AI 硬件从视觉转向多模态感知、AI 陪伴硬件热潮），再到人机关系变化（人类成为 AI 的 Agent）。这些预判大胆且具前瞻性，尝试勾勒出未来几年 AI 发展的多元面貌和深远影响，许多观点触及了当前 AI 发展的瓶颈与新趋势。

商业科技

中文

AI技术趋势

人工智能预测

Agent Economy

对话 GameSkill 陈迪：把世界冠军变成 AI 教练，塞进你的电脑里

硅星人Pro

2025-12-31

5612 字 (约 23 分钟)

88

本文通过对 GameSkill 创始人陈迪的专访，深入探讨了其如何利用 AI 技术打造电竞专业训练工具的商业模式和技术路径。GameSkill 的核心是将世界冠军的经验“塞进”AI 里，通过与顶级电竞俱乐部天禄合作，获取标注数据和战术体系，训练出能提供实时指导和深度复盘的 AI 教练。技术上，GameSkill 采用端侧推理的小模型，实现毫秒级响应，解决了云端高延迟和成本问题，并通过分层训练（从基础识别到战术意图，再到职业级理解）以及知识蒸馏、任务分层架构，确保了“小模型”也能具备“职业级”智能。商业模式上，“1 块钱一局”按需付费的创新模式降低了使用门槛，并与硬件厂商（如英特尔）合作，通过 AIPC 预装等方式进行获客。文章强调了 AI 应用应回归商业本质，在用户愿意付费的场景中提供更优解决方案的理念。

对话 GameSkill 陈迪：把世界冠军变成 AI 教练，塞进你的电脑里

硅星人Pro

|

2025-12-31

|

5612 字 (约 23 分钟)

|

88

本文通过对 GameSkill 创始人陈迪的专访，深入探讨了其如何利用 AI 技术打造电竞专业训练工具的商业模式和技术路径。GameSkill 的核心是将世界冠军的经验“塞进”AI 里，通过与顶级电竞俱乐部天禄合作，获取标注数据和战术体系，训练出能提供实时指导和深度复盘的 AI 教练。技术上，GameSkill 采用端侧推理的小模型，实现毫秒级响应，解决了云端高延迟和成本问题，并通过分层训练（从基础识别到战术意图，再到职业级理解）以及知识蒸馏、任务分层架构，确保了“小模型”也能具备“职业级”智能。商业模式上，“1 块钱一局”按需付费的创新模式降低了使用门槛，并与硬件厂商（如英特尔）合作，通过 AIPC 预装等方式进行获客。文章强调了 AI 应用应回归商业本质，在用户愿意付费的场景中提供更优解决方案的理念。

商业科技

中文

AI产品

电竞

端侧AI

当 AI 聊「童年阴影」的时候，它在聊什么｜Hao 好读论文

硅星人Pro

2025-12-31

4668 字 (约 19 分钟)

87

文章深入探讨了关于 AI“心理”的两种截然不同的研究方法。首先，它介绍了卢森堡大学团队通过角色扮演实验，让 AI 聊“童年阴影”，模型表现出高度拟人化的心理困扰。作者指出该实验存在循环论证和上下文依赖的逻辑漏洞，认为 AI 只是在调用其庞大参数中的语义关联进行“表演”。随后，文章详细分析了 Google DeepMind 与剑桥大学合作发表的更严谨的研究，该研究通过“无菌”的实验室操作、独立施测和对数概率评分，揭示了塑造 AI 人格的是后训练而非预训练，模型越强大则人格越稳定，且模型人格会影响其下游工作，同时主流模型性格趋同。最关键的发现是，模型人格并非内置，而是流动的、可表演的知识，可以通过提示词瞬间调整。文章最终总结，理性的 AI 心理学应保持怀疑态度，不应过度拟人化 AI，并提出 DeepMind 的研究更接近科学本质，AI 更像一面镜子，反映了人类自身的集体记忆。

当 AI 聊「童年阴影」的时候，它在聊什么｜Hao 好读论文

硅星人Pro

|

2025-12-31

|

4668 字 (约 19 分钟)

|

87

文章深入探讨了关于 AI“心理”的两种截然不同的研究方法。首先，它介绍了卢森堡大学团队通过角色扮演实验，让 AI 聊“童年阴影”，模型表现出高度拟人化的心理困扰。作者指出该实验存在循环论证和上下文依赖的逻辑漏洞，认为 AI 只是在调用其庞大参数中的语义关联进行“表演”。随后，文章详细分析了 Google DeepMind 与剑桥大学合作发表的更严谨的研究，该研究通过“无菌”的实验室操作、独立施测和对数概率评分，揭示了塑造 AI 人格的是后训练而非预训练，模型越强大则人格越稳定，且模型人格会影响其下游工作，同时主流模型性格趋同。最关键的发现是，模型人格并非内置，而是流动的、可表演的知识，可以通过提示词瞬间调整。文章最终总结，理性的 AI 心理学应保持怀疑态度，不应过度拟人化 AI，并提出 DeepMind 的研究更接近科学本质，AI 更像一面镜子，反映了人类自身的集体记忆。

商业科技

中文

AI心理

大模型

人格特质

文章

梁文锋 DeepSeek 新论文！接棒何恺明和字节，又稳了稳 AI 的“地基”

梁文锋 DeepSeek 新论文！接棒何恺明和字节，又稳了稳 AI 的“地基”

Scaling Law 没死，它只是换了个活法

Scaling Law 没死，它只是换了个活法

黄仁勋 CES 上硬菜：Vera Rubin 已量产！为 AI 赌上 6 颗芯片

黄仁勋 CES 上硬菜：Vera Rubin 已量产！为 AI 赌上 6 颗芯片

关于 2026 年的 AI，这里有 20 个预判（不负责任版）

关于 2026 年的 AI，这里有 20 个预判（不负责任版）

对话 GameSkill 陈迪：把世界冠军变成 AI 教练，塞进你的电脑里

对话 GameSkill 陈迪：把世界冠军变成 AI 教练，塞进你的电脑里

当 AI 聊「童年阴影」的时候，它在聊什么｜Hao 好读论文

当 AI 聊「童年阴影」的时候，它在聊什么｜Hao 好读论文

订阅源

文章

梁文锋 DeepSeek 新论文！接棒何恺明和字节，又稳了稳 AI 的“地基”

梁文锋 DeepSeek 新论文！接棒何恺明和字节，又稳了稳 AI 的“地基”

Scaling Law 没死，它只是换了个活法

Scaling Law 没死，它只是换了个活法

黄仁勋 CES 上硬菜：Vera Rubin 已量产！为 AI 赌上 6 颗芯片

黄仁勋 CES 上硬菜：Vera Rubin 已量产！为 AI 赌上 6 颗芯片

关于 2026 年的 AI，这里有 20 个预判（不负责任版）

关于 2026 年的 AI，这里有 20 个预判（不负责任版）

对话 GameSkill 陈迪：把世界冠军变成 AI 教练，塞进你的电脑里

对话 GameSkill 陈迪：把世界冠军变成 AI 教练，塞进你的电脑里

当 AI 聊「童年阴影」的时候，它在聊什么｜Hao 好读论文

当 AI 聊「童年阴影」的时候，它在聊什么｜Hao 好读论文

订阅源