RAID知识简介

RAID简介

独立磁盘冗余阵列( RAID, Redundant Array of Independent Disks ),旧称廉价磁盘冗余阵列，简称磁盘阵列。

其基本思想就是把多个相对便宜的硬盘组合起来，成为一个硬盘数数组，使性能达到甚至超过一个价格昂贵、容量巨大的硬盘。

个人理解

硬盘是个很脆弱的东西，它经常会坏掉。所以，为了保证服务器可靠耐用，硬盘必须时时刻刻保持可用。所以有了RAID这个东西。它的目的是将好几个硬盘合并在一起，就算硬盘坏了一个，剩下还有好几个硬盘是正常的，这样服务器才不会挂掉。

它跟插线板是相似的概念。区别在于，插线板是为了扩展电源插孔，RAID是为了扩展硬盘插槽。

最初的RAID分成不同的等级，每种等级都有其理论上的优缺点，不同的等级在两个目标间去的平衡，分别是增加数据可靠性以及增加存储器读写性能。这些年来，出现对于RAID观念不同的应用。

RAID-0

RAID 0没有数据冗余、没有奇偶校验。因此，如果一个硬盘坏掉了，整个RAID阵列的数据都没法正常使用了。它存在的意义在于加快读写速度，提升硬盘容量。通常在数据可靠性要求不高的情况下才会使用RAID 0。比如游戏、科学计算。

因为每个硬盘都可以独立读写，如果硬盘有n块，那么读写速度提升是n倍。

下图是RAID 0的数据分布方式：

RAID-1

RAID 1模式下，如果有n块硬盘，那么会把数据保存n份一模一样的。这样即使一份数据坏掉了，剩下的备份可以正常工作。性能方面，随机存取速度相当于所有硬盘的总和，写入性能和原来单个硬盘的性能一样。

RAID-2

这种模式现在已经不太常用了。它把每个数据位都打散，然后均匀的放到各个硬盘上。使用了Hamming代码来做纠错，将Hamming代码放到专门的几个硬盘里面。下图可以看到这种模式的数据分布：

RAID-3

这种模式现在也已经不太常用了。它把每个数据字节都打散，然后均匀的分散到各个硬盘。然后将奇偶校验的数据放到专门的硬盘里。关于奇偶校验的数据在后面会提到。这种模式下，由于每个数据都分散到各个硬盘的不同地方，因此每次操作都需要所有硬盘来参与。所以，对于随机存取的场景下，这种模式的性能是很差的。对于特别长的顺序读写是非常合适的，比如视频监控数据。