跳转到主要内容
Chinese, Simplified

事情可以而且确实会出错。这是生活中的事实,企业花费时间和金钱为意外打嗝做准备。数据存储行业花费了数十年的时间,通过假设其组件在某些时候出现故障来提高存储架构的可靠性。链式电缆,电源,冷却,驱动器,软件(甚至系统管理员)中的所有元件可能都会失败,无需预先警告,并且会中断对用户数据的访问。

可靠性通常等同于数据可访问性,即确保在给定SLA下的数据访问。更现代的视角以不同的方式看待这两种关键的独立测量:可用性和耐用性。

让我们探讨一些差异以及它们对您的业务的重要性。

数据可用性与耐用性 - 它们不是同一件事

可用性和持久性是数据可访问性的两个非常不同的方面。可用性是指系统正常运行时间,即存储系统可操作并且可以根据请求提供数据。从历史上看,这是通过硬件冗余实现的,因此如果任何组件发生故障,将以数据访问为主。另一方面,耐久性是指长期数据保护,即存储的数据不会遭受比特腐烂,退化或其他损坏。它不关注硬件冗余,而是关注数据冗余,以便数据永不丢失或受损。

可用性和耐用性有不同的目标。对于数据中心,可用性/正常运行时间是操作的关键指标,因为任何一分钟的停机都是昂贵的。测量侧重于存储系统可用性。但是当组件,系统甚至数据中心发生故障时会发生什么?当故障得到纠正时,您的数据是否完好无损?

这说明了数据持久性的同等重要性。更正可用性故障时,必须恢复对未损坏数据的访问。随着数据的爆炸式增长,挖掘的潜力以及对更长保留率(对所有事物)的需求不断增长,您可以想象这对于商业成功至关重要。

考虑无法检索存档的主数据/参考数据副本的潜在竞争,财务或法律影响。因此,数据可用性和数据持久性对于短期和长期业务成功至关重要。

确保数据可用性 - RAID或无速率擦除编码?

确保数据可用性的常用方法是通过基于RAID的架构。跨多个驱动器划分数据可以防止一个或两个驱动器发生故障,但在重建操作期间性能会急剧下降,这可能会对业务运营产生负面影响。多年的数据中心经验表明,驱动器故障通常不是孤立事件:当RAID组中的一个驱动器发生故障时,其他组成员失败的可能性会增加。重建操作期间出现不可恢复的读取错误意味着数据现在永久丢失,从而使您的企业面临风险。

随着驱动器容量的大幅增加,重建时间也在增加。以前花费几分钟的时间现在可能需要数小时甚至数天。此外,这需要尽快更换故障驱动器,无论是周末,节假日还是半夜。

对象存储通过高级擦除编码实现数据可用性,从而将数据与奇偶校验信息组合,然后在存储池中进行分片和分布。由于只需要一部分分片来重新水化数据,因此没有重建时间或性能下降,并且在方便时可以替换故障存储组件。

数据持久性 - 单独RAID无法提供

您可能已经猜测,实现数据可用性与访问最初存储的数据并不完全相同。诸如钻头腐烂之类的介质故障,其中驱动表面的一部分或其他介质变得不可读,破坏数据,从而使得不可能以其原始未改变的形式检索数据。简单地防止诸如RAID之类的完整硬盘驱动器故障,不能防止存储在磁介质上的位逐渐失效。

广泛分布的擦除编码数据(例如18/8编码策略)和数据清理技术的组合可以持续验证写在介质上的数据,使您可以实现15个九的数据持久性。简单来说:对于每1000兆对象,只有一个对象不可读。数据持久性如何?超大规模数据中心和云服务提供商使用基于对象的存储来满足最高数据可用性和数据持久性的需求并不奇怪。

数据可用性与耐用性 - 一个错误的选择

每个组织都需要在需要时访问其数据,并且不会出现损坏或其他损失。它不是高可用性和高耐用性之间的选择;两者都很重要。

请记住,这是您的数据需要保护,而不是您的磁盘驱动器。

Article
知识星球
 
微信公众号
 
视频号