谷歌随后表示,所有因网络拥堵受影响用户的问题已经解决。谷歌将对故障原因展开调查,并提供相关调查报告。今日,Google官方博客解释了事故原因。
谷歌指出,从本质上讲,昨日的网络中断是因为服务器配置更改。适用于单一区域中的少数服务器,错误地应用于多个相邻区域的大量服务器,进而导致这些区域停止使用一半以上的可用网络容量。进出这些区域的网络流量试图适应剩余的网络容量,导致了网络拥堵。网络系统成功 分流了过载流量,保留了对延迟敏感的流量,并丢弃了大部分对延迟不是很敏感的流量。
谷歌表示,谷歌的工程团队在几秒钟内就发现了这个问题,但诊断和纠正的时间远远超过预期。收到警报后,谷歌工程团队就迅速确定了故障原因,但网络拥堵同样降低了工程团队恢复正确配置的能力,从而延长了停机时间。
事故期间,YouTube全球观看次数下降了10%,Google云存储的流量减少了30%,大约1%的Gmail活跃用户帐户出现了问题。
来源:IT之家