[新闻简报] AWS又挂了?别怪DNS,怪走光的那些老鸟
10月20日,AWS美国东区(US-EAST-1)发生大规模宕机,DynamoDB服务崩溃,导致大半个互联网跟着瘫痪。问题不只是DNS解析故障,而是累积已久的人才断层。这不是单一技术故障,而是一场组织能力崩溃的预演。
为什么重要
AWS是全球最关键的云基础设施提供商之一,支撑着金融、电商、政府、社交等各类高依赖系统。这类基础设施一旦失灵,不只是网站打不开,更是社会运作的停摆警报。此次事件暴露了AWS在人力结构与知识管理上的隐患,值得所有依赖云平台的企业警惕。
关键点
- 美西时间凌晨12:11,AWS开始调查US-EAST-1区域异常
- 1小时后确认DynamoDB请求错误率异常升高
- 2:01,锁定问题为DNS解析DynamoDB API失败
- DynamoDB是基础服务,影响波及几乎所有AWS子服务
- 连带导致银行、政府、社交媒体、Amazon.com等服务中断
- 前75分钟AWS状态页面仍显示“一切正常”,信息延误严重


