阿里云再次宕机回应称已全部修复

2019-03-04 20:52来源：新京报浏览：次手机版

　　阿里云并未公开详细赔偿细节；业内人士称，用户可选择“多云”部署，以避免宕机损失
　　阿里云又宕机了，这一次发生在午夜。
　　3月2日23时55分左右，阿里云开始出现大规模故障，位于华北地区的多家互联网公司的IT运维人员发现多个APP和网站开始陷入卡顿。随后一批程序员赶往公司加班。58高级架构师沈剑在针对此次宕机的回忆文章中称，这场事故持续了三个小时左右，事后观察了两个小时。
　　3月3日早间，阿里云开始发布公告，开始全面排查。截至目前披露的结果是，华北2地域可用区C部分的ECS服务器（云服务器）等实例出现IO HANG（IO不响应），经紧急排查处理后已全部恢复。阿里云方面向记者证实了这一结果，并表示其他区域未发现此类情况。
　　针对故障，阿里云表示，将根据SLA协议（服务合同），尽快处理赔偿事宜。但阿里云并未公开详细的赔偿细节。而根据阿里云开发者论坛上的网友说法，赔偿通常是按照故障时间的100倍进行的，而方案则根据包年包月预付费模式和按量付费模式有所不同，但总额不超过支付的单台云服务器费用总额。
　　这是一场发生在周末的宕机时间，因微博的传播而备受关注。第三方机构Forrester分析师戴鲲告诉记者，华北2地域是阿里云最早开通服务的华北地域之一，而ECS服务器又是阿里云最为核心的IaaS（基础设施即服务）之一，影响程度应当是相对较大的。
　　2018年6月，阿里云曾出现技术故障。尽管官方最终给出的故障时间仅为30分钟，而恢复时间需要1小时。但阿里云最终仍将其定义为S1级别事故，即核心业务重要功能不可用，影响了部分用户，造成了一定损失。
　　2019年1月，第三方机构IDC报告数据显示，2018年上半年中国公有云厂商中，阿里云以43%的市场占有率排名第一，相当于第二名至第九名的总和；腾讯排名第二，市场占有率为11.2%。
　　■ 延展
　　99.99%的安全性有多可靠？
　　事实上，宕机事件频繁发生。仅2018年一年，全球主流云计算厂商曾发生数十起宕机事故。对于宕机的原因，亚马逊AWS称因数据中心硬件问题，微软Azure数据中心则因高温和打雷，腾讯云因运营和硬盘故障，谷歌则因自动化失效。
　　但与此同时，多家云服务商仍在承诺99.99%的安全可靠性。对此，有技术专家表示，这一数字是经过验证的，而且通过部署反馈，故障率的确在0.01%以下。并且，一旦出现故障，云服务商也都有相应的容灾方案，可以及时解决问题。
　　沈剑在上述文章中表示，更换其他方案，也会遇到其他的问题，而自建机房，更是没有信心比阿里云更好。目前大多数公司仍在业务阶段，考虑投入产出比，所以多机房模式并不适合所有公司。
　　如何避免宕机事故造成重大损失？有业内人士称，需要将重要业务分别放在不同的“篮子”里，也就是选择多个供应商，进行“多云”部署。负责运营微软云服务落地的世纪互联蓝云首席执行官柯文达表示，真正的企业级市场中，用户一定是希望“多云”部署。
　　不过，也有行业人士认为，“多云”部署，会带来管理、开发、人员培训的复杂性，也可以选择多区域部署的方式。
　　市场对云计算的需求仍在增长
　　云计算取代旧有IT部署的趋势已不可逆。Gartner数据显示，云计算占全球总IT支出的规模正在不断增加。从2010年的1.99%，上升到2018年的8%，而未来几年向云转移将会直接或间接影响超过1万亿美元的IT支出。
　　这一切变化发生在过去十年中。十多年前，无论是跨国巨头，还是创业公司，部署IT架构的思路都是相同的，即购买服务器，部署一套系统，支撑公司业务和战略。此时，IT只是一项运营成本。

（本网站所发布文章只作为信息传播使用，不代表本网观点）

上一篇：全国联网收费高速公路年底实现移动支付全覆盖
下一篇：量子信息技术上演“星际之争”

相关阅读：

资讯排行榜

图片新闻

热点推荐