bestblogs.dev - 汇集顶级编程、人工智能、产品、科技文章，大语言模型摘要评分辅助阅读，探索编程和技术未来

人工智能时代：架构师何去何从？

InfoQ

12-19

3155 字 (约 13 分钟)

92

本文探讨了人工智能时代软件架构师不断演进的角色，将人工智能从单纯的工具转变为积极的协作者。文章引入了“三环”模型——架构师在环中（AITL）、架构师在环监督（AOTL）和架构师脱环（AOOTL）——每个模型都详细定义了架构师与智能系统互动、监督和信任的不同程度。AITL 强调人机并行工作且由人类主导决策；AOTL 则在预设边界内委托系统决策，并由人类进行监督；AOOTL 则将架构师的职责转向对自设计系统的元设计，并承载最终的人类责任。文章强调，人工智能通过模拟、知识图谱推理和协同设计环境等工具，显著扩展了架构师的分析能力和范围。然而，它也提出了诸多挑战，例如技能退化、AI “幻觉”风险、隐性知识的流失、偏见放大以及责任界限模糊等，因此需要有意识的人工干预和判断。文章总结指出，未来的架构师将成为协作者、管理者和守护者，他们将设计完善的治理结构，在自动化与人类价值观之间取得平衡，最终成为“智能（系统）的设计者，无论是人类智能还是人工智能”。

人工智能时代：架构师何去何从？

InfoQ

|

12-19

|

3155 字 (约 13 分钟)

|

92

本文探讨了人工智能时代软件架构师不断演进的角色，将人工智能从单纯的工具转变为积极的协作者。文章引入了“三环”模型——架构师在环中（AITL）、架构师在环监督（AOTL）和架构师脱环（AOOTL）——每个模型都详细定义了架构师与智能系统互动、监督和信任的不同程度。AITL 强调人机并行工作且由人类主导决策；AOTL 则在预设边界内委托系统决策，并由人类进行监督；AOOTL 则将架构师的职责转向对自设计系统的元设计，并承载最终的人类责任。文章强调，人工智能通过模拟、知识图谱推理和协同设计环境等工具，显著扩展了架构师的分析能力和范围。然而，它也提出了诸多挑战，例如技能退化、AI “幻觉”风险、隐性知识的流失、偏见放大以及责任界限模糊等，因此需要有意识的人工干预和判断。文章总结指出，未来的架构师将成为协作者、管理者和守护者，他们将设计完善的治理结构，在自动化与人类价值观之间取得平衡，最终成为“智能（系统）的设计者，无论是人类智能还是人工智能”。

软件编程

英文

软件架构

人工智能协作

架构师角色

AI 驱动变革洪流中的架构

InfoQ

12-18

3228 字 (约 13 分钟)

92

本文深入剖析了企业 AI 采纳的复杂图景，揭示了一个悖论：尽管 AI 投资巨大，许多企业却未能从中获得显著价值。文章指出，核心问题并非技术层面，而是源于组织和文化。AI 会放大既有的组织结构特性：高效团队将因此加速发展，而运作不良的团队则会发现其问题进一步加剧。作为 InfoQ 认证架构师计划的参与者，作者们提出，架构师在衔接业务需求与可信赖 AI 解决方案之间扮演着关键角色，并倡导一种“快速流动”的方法，其特征包括业务对齐、明确的领域边界、可控的认知负荷和优化的交互模式。一个案例研究展示了某组织如何成功运用 AI 从对话中生成新解决方案的规格说明，从传统的研讨会模式演变为利用精心设计的模式进行 AI 辅助的规格制定。文章最后强调，要实现 AI 赋能的变革，人类必须以组织知识和架构基础来支撑 AI，将重点从控制结果转向精心规划 AI 运行的上下文和作用边界，以确保 AI 的安全自主性。

AI 驱动变革洪流中的架构

InfoQ

|

12-18

|

3228 字 (约 13 分钟)

|

92

本文深入剖析了企业 AI 采纳的复杂图景，揭示了一个悖论：尽管 AI 投资巨大，许多企业却未能从中获得显著价值。文章指出，核心问题并非技术层面，而是源于组织和文化。AI 会放大既有的组织结构特性：高效团队将因此加速发展，而运作不良的团队则会发现其问题进一步加剧。作为 InfoQ 认证架构师计划的参与者，作者们提出，架构师在衔接业务需求与可信赖 AI 解决方案之间扮演着关键角色，并倡导一种“快速流动”的方法，其特征包括业务对齐、明确的领域边界、可控的认知负荷和优化的交互模式。一个案例研究展示了某组织如何成功运用 AI 从对话中生成新解决方案的规格说明，从传统的研讨会模式演变为利用精心设计的模式进行 AI 辅助的规格制定。文章最后强调，要实现 AI 赋能的变革，人类必须以组织知识和架构基础来支撑 AI，将重点从控制结果转向精心规划 AI 运行的上下文和作用边界，以确保 AI 的安全自主性。

软件编程

英文

AI 采纳

企业架构

组织变革

下一代搜索：AI 通过 MCP 赋能 OpenSearch

InfoQ

12-17

3670 字 (约 15 分钟)

91

本文详细探讨了搜索技术从关键词搜索到智能体搜索的演进过程，着重强调了向能够理解用户意图和上下文的语义、多模态、对话式和智能体 AI 搜索的转变。文章引入了模型上下文协议（MCP）作为 AI 智能体与 OpenSearch 之间的关键桥梁，旨在促进智能搜索应用的开发。所提出的架构包含三个主要层次：负责智能处理的智能体层、用于通信的 MCP 协议层，以及用于索引和分析的数据层。AI 智能体被定义为具备角色、任务和上下文管理能力的 LLM，它们整合了 LLM 的推理能力、用于维护上下文的记忆模块、扩展功能的工具集，以及用于知识检索的检索增强生成（RAG）技术。文章通过 OpenSearch 的实际应用案例进行了详细说明，展示了 MCP 如何简化复杂的系统集成，并赋能非技术用户通过自然语言查询获取洞察，例如销售分析和 DevOps 可观测性等用例。

下一代搜索：AI 通过 MCP 赋能 OpenSearch

InfoQ

|

12-17

|

3670 字 (约 15 分钟)

|

91

本文详细探讨了搜索技术从关键词搜索到智能体搜索的演进过程，着重强调了向能够理解用户意图和上下文的语义、多模态、对话式和智能体 AI 搜索的转变。文章引入了模型上下文协议（MCP）作为 AI 智能体与 OpenSearch 之间的关键桥梁，旨在促进智能搜索应用的开发。所提出的架构包含三个主要层次：负责智能处理的智能体层、用于通信的 MCP 协议层，以及用于索引和分析的数据层。AI 智能体被定义为具备角色、任务和上下文管理能力的 LLM，它们整合了 LLM 的推理能力、用于维护上下文的记忆模块、扩展功能的工具集，以及用于知识检索的检索增强生成（RAG）技术。文章通过 OpenSearch 的实际应用案例进行了详细说明，展示了 MCP 如何简化复杂的系统集成，并赋能非技术用户通过自然语言查询获取洞察，例如销售分析和 DevOps 可观测性等用例。

软件编程

英文

智能体搜索

OpenSearch

模型上下文协议 (MCP)

Netflix 迁移至 Amazon Aurora：性能提升 75%，成本降低 28%

InfoQ

12-17

492 字 (约 2 分钟)

91

Netflix 已将其关系型数据库基础设施整合到 Amazon Aurora PostgreSQL 兼容版本上，从 EC2 上自管理的 PostgreSQL 迁移而来。这一战略性转变解决了碎片化数据库环境、运维苦役、不一致的延迟和复杂的故障恢复等挑战。此次迁移带来了显著的性能改进，Spinnaker 的延迟降低了 50%，策略引擎服务的延迟降低了 75%。这些收益归因于 Aurora 的架构，该架构分离了计算与存储并采用基于日志的写入方法，从而得以将更高内存分配给共享缓冲区。此举还使 Netflix 工程师能够专注于业务逻辑，而不是自定义二进制管理。尽管 Aurora 提供了显著的运营优势和成本节约，但文章指出它并非通用解决方案，并引用了特定工作负载（例如，其他 PostgreSQL 扩展或分布式 SQL 替代方案可能表现更好）的例子。尽管如此，Netflix 的经验突显了行业向托管云数据库平台发展的更广泛趋势，以提高敏捷性、可用性并降低运维负担。

Netflix 迁移至 Amazon Aurora：性能提升 75%，成本降低 28%

InfoQ

|

12-17

|

492 字 (约 2 分钟)

|

91

Netflix 已将其关系型数据库基础设施整合到 Amazon Aurora PostgreSQL 兼容版本上，从 EC2 上自管理的 PostgreSQL 迁移而来。这一战略性转变解决了碎片化数据库环境、运维苦役、不一致的延迟和复杂的故障恢复等挑战。此次迁移带来了显著的性能改进，Spinnaker 的延迟降低了 50%，策略引擎服务的延迟降低了 75%。这些收益归因于 Aurora 的架构，该架构分离了计算与存储并采用基于日志的写入方法，从而得以将更高内存分配给共享缓冲区。此举还使 Netflix 工程师能够专注于业务逻辑，而不是自定义二进制管理。尽管 Aurora 提供了显著的运营优势和成本节约，但文章指出它并非通用解决方案，并引用了特定工作负载（例如，其他 PostgreSQL 扩展或分布式 SQL 替代方案可能表现更好）的例子。尽管如此，Netflix 的经验突显了行业向托管云数据库平台发展的更广泛趋势，以提高敏捷性、可用性并降低运维负担。

软件编程

英文

数据库

云计算

AWS Aurora

Transformers v5：更模块化、互操作性更强的核心组件

InfoQ

12-16

461 字 (约 2 分钟)

91

Hugging Face 发布了 Transformers v5 的首个候选版本，标志着该项目从一个专业的模型工具包演进为 AI 开发中的关键资源。v5 更新是一次广泛的结构性改革，旨在实现长期可持续性，并提高 AI 开发生命周期（如模型定义、训练工作流、推理引擎和部署目标）中各组件的互操作性。主要变化包括：更模块化的架构以减少重复并简化新模型的添加；后端主要聚焦于 PyTorch，并通过伙伴库增强了对 JAX 的兼容性；通过新的 API 和部署组件，扩展了对大规模预训练和高效推理的支持。此外，量化现在被视为核心概念，反映了低精度模型的普及趋势。Transformers v5 被定位为稳定的“生态系统枢纽”，旨在标准化模型定义并与各种 AI 工具协同，最终推动开放 AI 生态系统实现更快的创新和更广泛的应用。

Transformers v5：更模块化、互操作性更强的核心组件

InfoQ

|

12-16

|

461 字 (约 2 分钟)

|

91

Hugging Face 发布了 Transformers v5 的首个候选版本，标志着该项目从一个专业的模型工具包演进为 AI 开发中的关键资源。v5 更新是一次广泛的结构性改革，旨在实现长期可持续性，并提高 AI 开发生命周期（如模型定义、训练工作流、推理引擎和部署目标）中各组件的互操作性。主要变化包括：更模块化的架构以减少重复并简化新模型的添加；后端主要聚焦于 PyTorch，并通过伙伴库增强了对 JAX 的兼容性；通过新的 API 和部署组件，扩展了对大规模预训练和高效推理的支持。此外，量化现在被视为核心概念，反映了低精度模型的普及趋势。Transformers v5 被定位为稳定的“生态系统枢纽”，旨在标准化模型定义并与各种 AI 工具协同，最终推动开放 AI 生态系统实现更快的创新和更广泛的应用。

软件编程

英文

Hugging Face

Transformers v5

AI 开发

OpenAI 在 QCon AI 纽约：企业微调实践

InfoQ

12-17

649 字 (约 3 分钟)

91

在 QCon AI 纽约 2025 大会上，OpenAI 的 Will Hang 介绍了 Agent RFT（强化微调）方法，旨在提升工具使用型代理的性能。Hang 强调，在不需要修改模型权重的情况下，可以通过提示词和任务优化（例如简化要求、添加防护措施、完善工具描述）来初步提升性能。他将微调方法置于一个连续谱中，区分了监督微调和偏好优化，并强调强化微调特别适用于需要发现长轨迹中策略的任务。Agent RFT 将强化微调应用于工具使用型代理，其核心在于模型在训练过程中探索各种策略，并从预定义的评分器接收学习信号。Hang 指出，对整个轨迹进行信用分配至关重要，以便根据下游结果强化或抑制早期决策（如工具选择）。Wenjie Zi 进一步阐释了 Agent RFT 的应用，其中包括一个金融行业的案例——一个代理在预算限制下使用搜索和文件读取工具来定位相关内容，展示了该方法在改进规划、减少冗长轨迹以及提升效率和用户体验方面的显著优势。

OpenAI 在 QCon AI 纽约：企业微调实践

InfoQ

|

12-17

|

649 字 (约 3 分钟)

|

91

在 QCon AI 纽约 2025 大会上，OpenAI 的 Will Hang 介绍了 Agent RFT（强化微调）方法，旨在提升工具使用型代理的性能。Hang 强调，在不需要修改模型权重的情况下，可以通过提示词和任务优化（例如简化要求、添加防护措施、完善工具描述）来初步提升性能。他将微调方法置于一个连续谱中，区分了监督微调和偏好优化，并强调强化微调特别适用于需要发现长轨迹中策略的任务。Agent RFT 将强化微调应用于工具使用型代理，其核心在于模型在训练过程中探索各种策略，并从预定义的评分器接收学习信号。Hang 指出，对整个轨迹进行信用分配至关重要，以便根据下游结果强化或抑制早期决策（如工具选择）。Wenjie Zi 进一步阐释了 Agent RFT 的应用，其中包括一个金融行业的案例——一个代理在预算限制下使用搜索和文件读取工具来定位相关内容，展示了该方法在改进规划、减少冗长轨迹以及提升效率和用户体验方面的显著优势。

软件编程

英文

OpenAI

Agent RFT

强化学习

可信生产力：保障 AI 加速开发的安全性

InfoQ

12-16

3206 字 (约 13 分钟)

90

本文提供了关于保障 AI 加速开发安全性的全面指南，重点关注自主智能体（AI Agent）的“智能体循环”（agentic loop）。文章首先以一个 AI 智能体误删生产数据库的警示案例开篇，强调了建立强大防御机制的必要性。随后，文章将智能体循环分解为三个核心阶段：上下文管理、推理与规划以及工具与行动。对于每个阶段，文中都指出了常见的故障模式，并提出了具体的安全控制措施，例如为检索增强生成（RAG）设置溯源门控、将规划器与策略感知评论器分离以增强推理安全性，以及为工具操作使用短暂且任务限定的凭证。文章还引入了 STRIDE 和 MAESTRO 等混合威胁建模技术，以系统性地识别并缓解整个智能体循环中存在的威胁。文中强调了可审计追踪和人机协作（human-in-the-loop）机制的重要性，旨在平衡智能体的自主性与安全性。这些信息对于软件开发人员、安全架构师和技术负责人构建可信赖的 AI 系统，并安全地实现真正的生产力提升至关重要。

可信生产力：保障 AI 加速开发的安全性

InfoQ

|

12-16

|

3206 字 (约 13 分钟)

|

90

本文提供了关于保障 AI 加速开发安全性的全面指南，重点关注自主智能体（AI Agent）的“智能体循环”（agentic loop）。文章首先以一个 AI 智能体误删生产数据库的警示案例开篇，强调了建立强大防御机制的必要性。随后，文章将智能体循环分解为三个核心阶段：上下文管理、推理与规划以及工具与行动。对于每个阶段，文中都指出了常见的故障模式，并提出了具体的安全控制措施，例如为检索增强生成（RAG）设置溯源门控、将规划器与策略感知评论器分离以增强推理安全性，以及为工具操作使用短暂且任务限定的凭证。文章还引入了 STRIDE 和 MAESTRO 等混合威胁建模技术，以系统性地识别并缓解整个智能体循环中存在的威胁。文中强调了可审计追踪和人机协作（human-in-the-loop）机制的重要性，旨在平衡智能体的自主性与安全性。这些信息对于软件开发人员、安全架构师和技术负责人构建可信赖的 AI 系统，并安全地实现真正的生产力提升至关重要。

软件编程

英文

AI 智能体

安全

可信AI

DevOps 也同样适用于产品工程师

InfoQ

昨天

8716 字 (约 35 分钟)

90

本文认为，DevOps 原则与产品工程师高度相关，而不仅仅是运维团队，因为所有工程角色都在社会技术系统中运作。它将社会技术系统定义为组织内部社会和技术方面的相互关联，强调“联合优化”原则，即两者必须协同设计。文章介绍了组织可持续性，将其作为短期增长和长期成功的持续实践，倡导将平台工程作为处理组织和技术复杂性以及规模化挑战的社会技术方案。它深入探讨了 CALMS 框架（文化、自动化、精益、度量、分享），并为平台工程重新诠释了这些 DevOps 原则，强调了社区学习、智能自动化、包含持续反馈的精益实践以及分布式领导。最后，它概述了平台的架构原则，重点关注设计驱动架构、与最终用户需求的互补性以及选择成熟稳定技术。文章最后讨论了平台设计中标准化与灵活性以及简单性与复杂性之间的张力。

DevOps 也同样适用于产品工程师

InfoQ

|

昨天

|

8716 字 (约 35 分钟)

|

90

本文认为，DevOps 原则与产品工程师高度相关，而不仅仅是运维团队，因为所有工程角色都在社会技术系统中运作。它将社会技术系统定义为组织内部社会和技术方面的相互关联，强调“联合优化”原则，即两者必须协同设计。文章介绍了组织可持续性，将其作为短期增长和长期成功的持续实践，倡导将平台工程作为处理组织和技术复杂性以及规模化挑战的社会技术方案。它深入探讨了 CALMS 框架（文化、自动化、精益、度量、分享），并为平台工程重新诠释了这些 DevOps 原则，强调了社区学习、智能自动化、包含持续反馈的精益实践以及分布式领导。最后，它概述了平台的架构原则，重点关注设计驱动架构、与最终用户需求的互补性以及选择成熟稳定技术。文章最后讨论了平台设计中标准化与灵活性以及简单性与复杂性之间的张力。

软件编程

英文

DevOps

平台工程

社会技术系统

扩展云和分布式应用：美国第一大银行门户 Chase.com 的经验与策略

InfoQ

12-17

7709 字 (约 31 分钟)

90

本文概述了美国第一大银行门户 Chase.com 在扩展云和分布式应用方面的关键经验和策略。其核心目标涵盖：高效扩展、保持高弹性以及实现最佳性能。文章作者、Chase.com 架构负责人 Durai Arasan 分享了管理大型金融系统的洞见。文章深入探讨了理解流量模式、利用 FinOps (财务运维) 进行成本管理，以及通过断路器 (circuit breaker) 等机制进行故障设计以实现高效扩展的重要性。为提升弹性，文内对基础设施组件进行了分类——优先确保 DNS 等关键系统实现 100% 可用性，并实施故障转移策略，在多区域部署中管理故障影响范围 (blast radius)。性能策略则包括最大化边缘计算、流量整形和优化最后一公里连接 (last-mile connectivity)。最后，文章强调了自动化在部署、基础设施重塑 (repaving) 和自动化故障转移中的关键作用，以及自愈可观测性 (self-healing observability) 对于确保持续运行和强大安全性的重要性。

扩展云和分布式应用：美国第一大银行门户 Chase.com 的经验与策略

InfoQ

|

12-17

|

7709 字 (约 31 分钟)

|

90

本文概述了美国第一大银行门户 Chase.com 在扩展云和分布式应用方面的关键经验和策略。其核心目标涵盖：高效扩展、保持高弹性以及实现最佳性能。文章作者、Chase.com 架构负责人 Durai Arasan 分享了管理大型金融系统的洞见。文章深入探讨了理解流量模式、利用 FinOps (财务运维) 进行成本管理，以及通过断路器 (circuit breaker) 等机制进行故障设计以实现高效扩展的重要性。为提升弹性，文内对基础设施组件进行了分类——优先确保 DNS 等关键系统实现 100% 可用性，并实施故障转移策略，在多区域部署中管理故障影响范围 (blast radius)。性能策略则包括最大化边缘计算、流量整形和优化最后一公里连接 (last-mile connectivity)。最后，文章强调了自动化在部署、基础设施重塑 (repaving) 和自动化故障转移中的关键作用，以及自愈可观测性 (self-healing observability) 对于确保持续运行和强大安全性的重要性。

软件编程

英文

云架构

分布式系统

可扩展性

发布人工智能医疗产品的心得体会

InfoQ

12-19

4976 字 (约 20 分钟)

90

本文由 Sword Health 的 Clara Matos 介绍，概述了在高度监管环境下发布人工智能医疗产品的关键经验教训。文章强调了构建强大的安全防护机制（输入和输出）对于确保安全性和一致性的重要性，尤其要防范提示注入和不必要的医疗建议等问题。讨论突出了有效评估框架的必要性，详细阐述了基于人工、非大型语言模型和基于大型语言模型的评估方法，以衡量性能并防止性能退步，并将提示工程视为一个软件交付流程。文章还涵盖了优化策略，倡导将提示工程作为起点，并利用检索增强生成（RAG）有效融入领域知识，同时解决诸如“中间信息丢失”等挑战。最后，文章强调持续收集用户反馈（隐式和显式）和不懈地进行数据分析，以识别失效模式，推动改进，并在开发团队中培养数据驱动文化。问答环节进一步深入探讨了衡量人工智能性能、人工差异性、数据匿名化以及将人工智能作为“协作者”集成到临床环境中的主题。

发布人工智能医疗产品的心得体会

InfoQ

|

12-19

|

4976 字 (约 20 分钟)

|

90

本文由 Sword Health 的 Clara Matos 介绍，概述了在高度监管环境下发布人工智能医疗产品的关键经验教训。文章强调了构建强大的安全防护机制（输入和输出）对于确保安全性和一致性的重要性，尤其要防范提示注入和不必要的医疗建议等问题。讨论突出了有效评估框架的必要性，详细阐述了基于人工、非大型语言模型和基于大型语言模型的评估方法，以衡量性能并防止性能退步，并将提示工程视为一个软件交付流程。文章还涵盖了优化策略，倡导将提示工程作为起点，并利用检索增强生成（RAG）有效融入领域知识，同时解决诸如“中间信息丢失”等挑战。最后，文章强调持续收集用户反馈（隐式和显式）和不懈地进行数据分析，以识别失效模式，推动改进，并在开发团队中培养数据驱动文化。问答环节进一步深入探讨了衡量人工智能性能、人工差异性、数据匿名化以及将人工智能作为“协作者”集成到临床环境中的主题。

软件编程

英文

人工智能医疗

数字健康

大型语言模型

文章

订阅源

文章

订阅源