本文对全球最大的云存储服务 Amazon S3 进行了深入的技术综述。文章详细描述了 S3 的巨大规模——在数百万台服务器和数千万个驱动器上管理着数百 EB 的数据。讨论的关键技术里程碑包括在不牺牲可用性的情况下,通过复制日志和缓存一致性协议实现从最终一致性到强一致性的转变。叙述强调了 S3 对 11 个 9 持久性的承诺,这得益于自动推理(形式化方法)和持续审计系统的支持。此外,文章还介绍了 S3 Tables(支持 Iceberg)和 S3 Vectors 等新原语,展示了 S3 如何在保持技术无畏和简单性的文化的同时,从一个简单的对象存储演进为去中心化分析和 AI 工作负载的基础层。






