纠删码
什么是纠删码?
擦除编码是一种以无损格式对数据进行编码的简单而快速的方法。
纠删码提供了无故障的存储环境。它是一种信息分散算法,允许数据分布在多个存储设备上。纠删码背后的想法很简单:不是将数据全部写入存储,而是将其分成更小的块,然后在需要时用于重建原始数据。
纠删码可以在不同的粒度级别上工作;例如,整个文件可以被编码为K个块,或者文件系统块可以被编码为K个独立块。
擦除编码的主要优点是,即使某些块丢失或根本没有接收到,它也可以被解码。它用于不同的通信系统,以提高针对传输错误的鲁棒性。
RAID 和纠删码有什么区别?
由于某种原因,RAID 和擦除编码被误认为是同一件事。事实上,两者是完全不同的。
RAID主要用于服务器和其他大型存储设备。它将您的数据镜像到多个硬盘驱动器上,因此如果一个驱动器出现故障,您还有备份。缺点是它比擦除编码更昂贵,并且在每个驱动器上占用更多空间。
RAID 实际上并不能保护驱动器上的数据不被另一台计算机读取。任何能够接触到其中一个驱动器的人仍然可以看到您的所有信息。擦除编码的作用正如它听起来的那样:它对数据进行加扰,这样没有正确的密钥就没有人可以读取它。
擦除编码将数据分成多个片段,并使用冗余信息对其进行扩展和编码。另一方面,RAID 中的数据不会被分解。
纠删码的好处
纠删码是一种以可靠的方式存储数据的方法,可用于在存储介质的任何部分损坏时恢复原始数据。纠删码有许多优点,使其成为其他数据存储方法的有吸引力的替代方案。
纠删码的主要特点包括:
可扩展性——该技术可以应用于少量和大量数据。
可靠性——由于它只保留数据片段,即使某些存储介质出现故障,也可以恢复原始数据。
经济高效– 当您考虑到无需购买额外的备份和恢复软件而节省成本时,此技术是经济高效的。
速度——与其他方法相比,使用纠删码从单个故障中恢复所需的时间要短得多。