原标题:腾讯云故障致客户数据丢失遭千万索赔
在国内公有云市场份额排第二的腾讯云,面临着前所未有的危机。
“前沿数控技术新媒体”8月5日晚间发微博称,在使用腾讯云8个月后,公司存储在腾讯云上的数据无可挽回地全部丢失。
腾讯云8月6日通过微信公众号回应称,腾讯云提出了返还前沿数控技术3569元实际消耗、提供13.29万元现金或云资源额外补偿的方案,而前沿数控技术提出了1101.60万元的赔偿额。
丢失的数据
前沿数控技术背后是一家名为“北京清博数控科技有限公司”的创业公司。2014年这家公司注册微信公众号“前沿数控技术”,定位于数控、模具、机械行业。
前沿数控技术在微博中表示,在业务量的需求下,公司使用了腾讯云,可“灾难”发生在2018年7月20日。接下来的两天,腾讯云组织了技术专家来对此次故障进行补救,但前沿数控技术公司数据还是丢失了。
根据腾讯云公告,“腾讯云监控到异常后,第一时间向用户告知故障状态,并立即组织文件系统专家并联合厂商技术专家尝试修复数据。遗憾的是,虽经多方努力,最终仍有部分数据完整性校验失败。”
为什么会发生数据丢失?腾讯云在8月6日的公告中表示,腾讯云用户北京清博数控科技有限公司所属“前沿数控”平台一块操作系统云盘,因受所在物理硬盘固件版本bug导致的静默错误(写入数据和读取出来的不一致)影响,文件系统元数据损坏。
“简单类比,就是电脑的c盘(装操作系统的盘)因为底层错误而导致数据读写异常,最终挂掉了,然后客户的系统和数据都丢了。”一位云服务行业从业人士对第一财经表示。
有无备份?
前沿数控创始人伍先生对第一财经表示,公司采购的是腾讯cvm服务。
按照腾讯云k8凯发官方app官网的产品介绍,cvm提供达99.95%的服务可用性和99.9999999%的数据可靠性,cvm搭载的云硬盘提供三副本存储策略,保证了数据在任一副本出现故障时快速进行迁移和恢复。
伍先生称,“总之按腾讯云宣称的就是十亿分之一的概率, 你想一个道理,人家的安全概率是这么高了,还有三备份,那还有什么风险?三备份都出问题了,那再来几个备份又(怎么)能保证安全?”
前述云服务行业从业人士对第一财经表示,“目前的费用信息看,这个客户可能既没有用负载均衡,也没有用云存储,而是直接开了台虚拟机(单台主机)把应用和数据都部署在上面了。腾讯云在k8凯发官方app官网介绍中说的三副本是云硬盘提供三副本,没有明确包括云操作系统盘。”
第一财经获悉,前沿数控技术从腾讯采购的服务为单台cvm,并且只有系统盘没有数据盘。
用个人电脑来类比,即前沿数控技术将所有信息录入了电脑c盘(可能),系统崩溃时数据全部丢失。而如果数据信息被存放在了d盘、e盘(应用和数据分离)等,即便系统崩溃,服务器仍能留有公司数据信息。
抛除腾讯云硬盘自身故障的原因,不少从业人士称,前沿数控技术运维没有将数据同步至本地电脑上,是导致数据永久丢失的另一个原因。一位使用了云服务的创业公司创始人称,“重要数据一般都会备份至本地电脑上。”
那么,在此次硬盘故障中,前沿数控技术是唯一一家吗?记者联系腾讯云,但未能收到回复。
“客户可以选择负载均衡方案来实现应用冗余,可以选择应用和数据分离(应用部署在应用服务器,数据部署在数据库服务和存储服务上)来隔离问题带来的损害,可以通过备份机制来确保较新的数据得以存留。没有100%可靠的系统,备份和冗余是在任何环境都需要考虑的。”一位业内人士说。
腾讯云在公告中表示,“经过分析,该硬盘静默错误是在极小概率下被触发。我们随即对固件版本有bug的硬盘全部进行下线处理,确保相关隐患全部排除。”
赔偿方案现分歧
在明确数据丢失后,前沿数控技术和腾讯云就赔偿方案产生了分歧。
腾讯云在公告中表示,第一时间制定了补偿措施,腾讯提出的方案为“赔偿 补偿”。赔偿部分为“前沿数控”在腾讯云平台上(自2017年12月份开户至今)产生的实际消耗共计3569元,依据腾讯云相关服务协议、规则和行业惯例,腾讯云将按照赔偿条款中的上限以现金形式全额返还这笔费用。
补偿部分为,本着帮助用户迅速恢复业务的目的,腾讯云承诺为前沿数控技术提供13.29万元现金或云资源的额外补偿,这是后者在腾讯云平台用云金额的37倍。
面对前沿数控技术提出了1101.60万元的索赔要求。腾讯称,这远远高于腾讯云所能提供的方案。
腾讯云同时表示,在双方的沟通中,前沿数控技术还提出希望以“获得腾讯投资”、“腾讯官方引流”等方式得到补偿。在当前情况下,腾讯云的确很难满足这样的要求。
在前沿数控技术看来,腾讯云拖延到事故发生后的第14天“才给出一个让人根本不能接受的方案”。其次,前沿数控技术并非执意索赔一千万,腾讯云给出的13万元与前沿数控技术提出的赔偿金额差距太大。
至于腾讯投资、腾讯官方引流等,前沿数控技术表示,公司的诉求是希望能恢复平台数据。在腾讯云工作人员表达恢复数据无望时,前沿数控技术主动提出希望利用腾讯可利用的资源来帮助公司恢复平台运营和流量。
参考资料:http://www.ztwang.com/news/11364.html