声明:本文表达的观点和意见仅代表作者个人观点,并不代表 crypto.news 编辑部的观点和意见。
AWS 的宕机事件提醒我们,当如此多的资源依赖于单一服务提供商时,现代数字系统变得多么脆弱。域名系统 (DNS) 记录的故障引发了亚马逊网络服务 (AWS) 基础设施的连锁反应,短短两小时内就导致超过 14,000 个网站瘫痪,造成超过 10 亿美元的损失,其中包括 Coinbase、 Metamask和 Robinhood 等知名网站。即使服务恢复后,数据同步问题又引发了进一步的连锁反应,造成了更大的中断。
- AWS 服务中断暴露了过度依赖少数超大规模云提供商会造成系统脆弱性,单个 DNS 故障可能会波及数千个服务和关键基础设施。
- 集中化虽然提高了效率,但也集中了故障点,使政府、金融系统和数字身份框架面临风险,而自动化和规模化只会加剧这些风险。
- 真正的韧性需要分布式架构——可验证的凭证、信任注册表和去中心化验证——以减少单点故障,并允许系统安全地发生故障,而不是发生灾难性的故障。
AWS试图通过多个本地故障点来保障安全,但未能预料到区域性DNS中断的情况。作为超过90%财富100强企业的云服务提供商,此次事件表明,即使是最大的集中式服务提供商也无法完全防范集中化带来的风险。这也暴露了过度依赖缺乏适当安全保障的关键基础设施会带来的后果。
当私营企业争相恢复网络访问时,各国政府却在同样的错误假设下,而且往往使用相同的服务提供商,构建人工智能和国家数字身份等关键公共基础设施。一旦这些基础设施出现故障,身份验证、支付和基本服务的访问都可能同时中断。此次事件暴露了一个简单的真相:当关键基础设施集中在一处时,其弹性就会消失,即使是最大的云服务提供商也无法完全规避集中化带来的风险。
问题不应该是是否会再次发生重大故障,而是何时发生,以及如何应对这种集中风险。分布式和去中心化的基础设施、可验证凭证和信任注册表等技术已在全球范围内部署,以确保将集中式故障的概率降至最低。允许数据保留在部门孤岛中,同时将验证过程与集中式数据库解耦,从而默认实现身份隐私。
集中化是一种结构性风险,而非技术性错误。
AWS 的宕机暴露了现代互联网底层架构的深层缺陷。如今,互联网的大部分骨干网络都依赖于少数几家云服务商、CDN 和 DNS 提供商。AWS、微软 Azure 和谷歌云这三大超大规模云服务商,目前控制着全球近 70% 的云基础设施市场。正如最近所见,一旦其中一家出现故障,其影响将远远超出其自身的网络范围。简而言之,我们的系统设计之初是为了实现不间断运行,就像精益生产工厂一样——为了保证产量而优化,但一旦生产线停止运转,系统就会变得脆弱不堪。
这个问题遍及各行各业;公共机构也使用相同的云服务提供商来运行日益庞大的国家数字身份框架、支付系统和人工智能模型。最初追求无缝扩展性,如今却演变成一种依赖关系,将关键系统以日益紧密的方式捆绑在一起。
当日常生活如此依赖于少数几个平台时,故障就不能再被视为孤立事件。它们会变成系统性风险,波及所有与之相关的事物。
规模带来的虚假舒适感
集中化在便捷性方面效果最佳。它承诺速度快、效率高、成本低——谁会拒绝这些呢?然而,集中化也隐藏着诸多代价。当所有数据都流向同一主干系统时,系统的韧性终将转化为脆弱性,这只是时间问题。
即使像AWS那样内置了冗余机制,集中式系统也存在同样的弱点。一个错误的设置、安全漏洞或其他问题,例如常见的DNS故障,都可能导致整个扇区瞬间瘫痪。
使用自动化技术时,风险会增加;当这些系统出现故障时,最好的结果是人们会被锁定在互联网和账户之外,最坏的结果是他们的支付、公共服务或国家身份信息会被锁定。
讽刺的是,那些旨在通过自动化提高效率来消除停机时间的系统,也反而营造了一种哪怕片刻故障都无法容忍的环境。每一层自动化都增加了便利性,但也削弱了人为监督,一旦出现问题,风险就会加剧。除非韧性与效率同等重要,否则每一次故障都会提醒我们,我们对系统的控制力是多么有限。
分布式系统是韧性的基础
真正的韧性并非来自增加备份服务器的数量,而是来自消除对单一控制点的需求。去中心化系统正是通过这种设计实现了这一点。
在去中心化网络或系统中,独立节点各自独立地进行决策和验证。要在实际系统中实现这一点,需要一些机制,允许在不持有底层数据的情况下验证信息。诸如可验证凭证、基于区块链的信任注册表和自主身份等技术已经实现了这些原则。验证无需存储在单一系统中并进行检查,而是可以通过加密方式在分布式网络中执行。
这意味着数据可以保留在它现有的位置,即运行它的部门或组织系统内部,而验证可以与数据的集中化脱钩。验证无需提取或暴露集中存储的底层数据即可进行,从而消除最大的单点故障,同时确保数据保留在它所属的个人或实体手中。我们无需重构整个基础设施;而是为了减轻故障的规模和影响。
应用于人工智能领域,这意味着模型可以从多个可信来源获取经过验证的数据,而无需依赖单一的中央枢纽。金融领域的合规性检查可以在分布式系统中运行,这些系统可以验证交易,而无需经过每个服务提供商。总而言之,这将构建一个即使发生故障也能安全运行,而不是灾难性故障的基础设施。
关键基础设施不必如此集中。
关键基础设施不必依附于庞大的集中式数据库,后者虽然扩展了企业和政府掌握的信息,却也为欺诈者和关键系统故障提供了诱人的陷阱。我们无需单一的数字骨干网就能使关键系统高效协同工作。通过分布式系统、开放标准和可验证数据,即可实现互操作性,这些方法能够在不集中控制权的情况下协调数据。
我们已经具备了这种能力——区块链和 Web3 技术使金融、身份和人工智能等行业能够在独立的网络中安全地进行协调,而不是依赖于一个中央提供商。
这种设计的基础设施能够自动建立边界,限制共享的数据范围、存储方式以及访问权限,同时还能促进原本并非设计用于协同运行的系统之间的协作。效率源于分散,而非依赖。
真正的代价不仅在于关键集中式服务再次宕机,更在于下一代人工智能、国家身份识别和云服务器等数字基础设施能否构建得足以抵御故障。通过采用分布式验证和基于区块链的信任框架,我们可以构建增强韧性的系统,而不是掩盖其当前的脆弱性。
弗雷泽·爱德华兹 (Fraser Edwards)正在引领 cheqd 网络的发展,该网络旨在帮助企业创建和利用数字凭证,同时应对自主身份 (SSI) 的商业挑战。在他的领导下,cheqd 一直走在数字身份解决方案变革的前沿,使其更易于全球企业使用和应用。弗雷泽经常在区块链和身份相关会议上发表演讲,包括 Messari 主网、Web Summit、Zebu Live、Nebular Summit、Money 20/20、RWOT、欧洲区块链大会等等。在他的领导下,cheqd 成功入选巴黎区块链周、ETHCC 等知名创业孵化器项目。



