文章
本文探讨了 Airbnb 如何在 Kubernetes 上大规模部署分布式 SQL 数据库,以应对有状态工作负载带来的挑战。与常见的模式不同,Airbnb 将数据库集群部署在多个 Kubernetes 集群上,每个集群映射到一个不同的 AWS 可用区,以提高可靠性和容错隔离。关键技术包括使用 AWS EBS 卷,并结合 Kubernetes 持久卷声明(PVCs),以实现持久化存储。这种方式支持快速重新挂载,并使用自定义 Kubernetes Operator 精细化地管理节点更换,确保数据库仲裁和数据一致性。本文还详细介绍了应对策略,包括使用准入钩子和序列化替换来处理计划内事件、主动基础设施事件和计划外故障。此外,Airbnb 采用自管理 Kubernetes,并实施分阶段的跨集群升级策略。结合多集群部署和过度配置,实现了高容错性,并有效降低了故障的爆炸半径。实施了高级读取策略,例如存储读取超时、副本读取和过期读取,以缓解 EBS 尾部延迟峰值。这种全面的方法使 Airbnb 能够以高可用性和可扩展性处理每秒数百万个查询。
本文阐释了模型上下文协议 (MCP),它旨在解决当前 AI 模型无法访问实时外部数据或与外部系统交互的瓶颈。传统 AI 模型受限于训练数据,拥有“冻结知识”,导致其信息滞后且相对孤立。Anthropic 推出的 MCP 作为一个通用适配器,已被多家科技公司采用,能够实现 AI 系统与任意数据源或工具的无缝连接。该协议将复杂的集成问题从乘法 (N 个 AI 应用 * M 个数据源) 简化为加法 (N + M 个实现)。本文详细介绍了 MCP 的架构,包括宿主应用程序、MCP 客户端和 MCP 服务器,以及其三层协议栈(传输层、协议层和能力层)。文章追溯了一个请求的处理流程,展示了 MCP 如何实现动态 AI 交互,并强调了其开源特性及其将孤立的 AI 模型转变为互联互通、功能强大的助手的潜力,类似于 TCP/IP 对互联网的赋能。