数据磁盘阵列技术:高效存储,数据保障 (数据磁盘阵列技术)

在当今信息化时代,数据的存储和处理已经成为了每一个人都需要面对的问题,企业更是不能错过的关键环节。作为重要的设备之一,数据磁盘阵列技术已经逐渐被企业所接受和应用,在数据存储和保护上发挥着越来越关键的作用。本文将为大家介绍什么是数据磁盘阵列技术以及它的高效存储和数据保障的优势。

一、什么是数据磁盘阵列技术

数据磁盘阵列技术是一种利用硬件方法将多个磁盘组成一个存储设备的技术,其主要目的是通过增加磁盘数量并采用某种特定的数据分布策略,来提高磁盘阵列的数据处理能力、数据传输速率、数据纠错能力和数据容错性能。这种技术最早是由IBM公司开发的,后来随着企业对数据存储和处理能力的要求越来越高,磁盘阵列技术也逐渐被其它公司应用和推广。目前应用范围相当广泛,从个人电脑到数据中心都可以看到这种技术的身影。

二、数据磁盘阵列技术的高效存储优势

对于企业而言,数据存储一直是一个重要的问题,特别是对于大数据的存储而言更是如此。数据磁盘阵列技术提供了高效的数据存储方式,其中有以下几个特点:

1.容量可扩展

数据磁盘阵列技术可以根据业务需求的增加不断扩充存储容量,而无需停机或对数据进行迁移等操作。这一特点的优点是企业可根据业务发展需求来不断扩充存储空间,毫不影响正常的业务流程和数据使用。

2.数据读写速度快

我们都知道,磁盘的读写速度往往是影响数据访问速度的最重要因素之一。而数据磁盘阵列技术通过使用多个磁盘并采用数据分布策略,可以提高磁盘的数据访问速度,从而使得数据读写速度更快。

3. 能够有效管理多个磁盘

企业中的磁盘一般会有多台,这就需要进行有效的管理,给系统管理员带来了很多的负担。但是,当企业使用了数据磁盘阵列技术时,所有的磁盘可以被管理在一个统一的存储设备中,系统管理员的管理几乎可以一劳永逸,大大的提高了管理效率。

三、数据磁盘阵列技术的数据保障优势

随着企业数据量的不断增大,数据的重要性也愈发凸显出来,数据丢失或泄露将造成巨大的损失或影响。而数据磁盘阵列技术也充分考虑到了数据不可丢失的问题,在数据保护方面具有以下优势:

1. 数据备份

数据磁盘阵列技术可以对重要数据进行备份,即使物理硬件出现故障,可以保证数据的不丢失。企业可以自由掌握数据备份的频率,可以是每周、每日甚至每小时。

2. 数据恢复

在数据磁盘阵列技术中,不同的策略可以实现数据的快速恢复。在磁盘阵列产生故障时,当前的数据存储设备可以通过冗余并保证数据的一致性。

3. 数据冗余

数据磁盘阵列技术也提供了数据冗余的功能,这就是对数据副本的创建,即对同一份数据进行重复存储,以保证数据的安全性和可用性。数据冗余是减少数据丢失的关键。数据磁盘阵列的为数据冗余提供了强有力的支持,保证了数据的真实性和完整性,以防数据泄露或丢失。

四、数据磁盘阵列技术的适用范围

数据磁盘阵列技术适用于各种场合,主要适用于数据量大、读写频繁、性能要求较高的业务中,包括科学研究、生命科学、社交网络、金融服务、金融信用评估,物流和交通管理等等等。此外,它还适于需要数据安全性、可靠性较高的场合,例如银行、机关等。

五、

数据磁盘阵列技术不仅能够高效处理数据存储和访问,同时还能保证数据的安全性和完整性,为企业的数据存储带来了全新的方便。无论是对于个人用户还是企业来说,选择数据磁盘阵列技术都是明智的,可以帮助用户解决数据存储和数据保护方面的问题,提高存储效率,保障数据安全。

相关问题拓展阅读:

什么是磁盘阵列?

磁盘阵列简称RAID(RedundantpArrayspofpInexpensivepDisks),有”价格便则升宜且多余的磁盘阵列”之意。其原理是利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。磁盘阵列主要针对硬盘,在容量及速度上,无法跟上CPU及内存的发展,提出改善方法。磁盘阵列是由很多便宜孙裂老、容量较小、稳定性较高、速度较慢磁盘,组合成一个大型的磁盘组,利用个别磁盘提供数据所产生的加成效果来提升整个磁盘系统的效能。同时,在储存数据时,利用这项技术,将数据切割成许多区段,分别存放在各个硬盘上。

磁盘阵列还能利用同位检查(ParitypCheck)的观念,在数组中任一颗硬盘故障时,仍可读出数据,在数据重构时,将故障硬盘内的数据,经计算源迹后重新置入新硬盘中。

磁盘阵列简述:

磁盘阵列是一种把若干硬磁盘驱动器按照一定要求组成一个整体,整个磁盘阵列由阵列控制器管理的系统。冗余磁盘阵列RAID(Redundant Array of Independent Disks)技术1987年由加州大学伯克利分校提出,最初的研制目的是为了组合小的廉价磁盘来代替大的昂贵磁盘,以降低大批量数据存储的费用(当时RAID称为Redundant Array of Inexpensive Disks 廉价的磁盘阵列),同时也希望采用冗余信息的方式,使得磁盘失效时不会使对数据的访问受损失,从而开发出一定水平的数据保护技术。

磁盘阵列的工作原理与特征:

RAID的基本结昌岩构特征就是组合(Striping),捆绑2个或多个物理磁盘成组,形成一个单独的逻辑盘。组合套(Striping Set)是指将物理磁盘组捆绑在一块儿。在利用多个磁盘驱动器时,组合能够提供比单个物理磁盘驱动器更好的性能提升。 数据是以块(Chunks)的形式写入组合套中的,块的尺寸是一个固定的值,在捆绑过程实施前就已选定。块尺寸和平均I/O需求的尺寸之间的关系决定了组合套的特性。总的来说,选择块尺寸的目的是为了更大程度地提高性能,以适应不同特点的计算环境应用。

磁盘阵列优点:

磁盘阵列有许多优点:首先,提高了存储容量;其次,多台磁盘驱动器可并行工作,提高了数据传输率;…RAID技术确实提供了比通常的磁盘存储更高的性能指标、数据完整性和数据可用性,尤其是在当今面临的I/O总是滞后于CPU性能的瓶颈问题越来越突出的情况下,RAID解决方案能够有效地弥补这个缺口。

阵列技术的介绍:

RAID技术是一种工业标准,各厂商对RAID级别的定义也不尽相同。目前对RAID级别的定义可以获得业界广泛认同的有4种,RAID 0、RAID 1、RAID 0+1和RAID 5,我们常见的主板自带的阵列芯片或阵列卡能支持的模式有:RAID 0、RAID 1、RAID 0+1。

1) RAID 0是无数据冗余的存储空间条带化,它将所有硬盘构成一个磁盘阵列,可以同时对多个硬盘做读写动作,但是不具备备份及容错能力,具有成本低、读写性能极高、存储空间利用率高等特点,在理论上可以提高磁盘子系统的性能。

2) RAID 1是两块硬盘数据完全镜像,可以提高磁盘子系统的安全性,技术简单,管理方便,读写性能均好。但它无法扩展(单块硬盘容量),数据空间浪费大,严格意义上说,不应称之为“阵列”。

3) RAID 0+1综合了RAID 0和RAID 1的特点,独立磁盘配置成RAID 0,两套完整的RAID 0互相镜像。它的读写性能出色,安全性高,但构弊迅猛建阵列的成本投入大,数据空间利用率低,不能称之为经济高效的方案。

常见的阵列卡芯片有三种:Promise(乔鼎信息)、highpoint、ami(美商安迈)。这三种芯租桥片都有主板集成或独立的阵列卡这二种形式的产品。我们主要用到的是Promise阵列卡,经过测试在无盘中稳定,并且不容易坏Promise常见的阵列芯片有:Promise Fasttrak 66、Fasttrak 100、Fasttrak 133、20232、20235、20237、20230、Fasttrak TX2、Fasttrak TX4、Fasttrak TX2023,TX4000.Highpoint常见的阵列芯片有:highpoint 370、370a、372、372a。AMI / LSI Logic MegaRAID 这种芯片的产品我们用得很少,现在知道的有艾崴 WO2-R主板上集成了American Megatrends MG80649 控制器,其阵列卡的产品也没有使用过。

注意事项:

1) 用来创建磁盘阵列的硬盘一般需成对使用。

2) 强烈建议使用型号、容量、品牌均一致的四个硬盘来做阵列。

3) 阵列卡和一部分集成的阵列芯片支持双阵列,当您使用四个硬盘来做阵列时,建议设置为双阵列。但如果主板集成的是Promise类芯片,几乎都不支持创建双阵列。(4)、没有安装对应的阵列驱动程序或驱动程序不对,而又设置为由阵列启动时,NT服务器启动时将会蓝屏。任何创建阵列或者重建阵列的操作都将清除硬盘或者阵列上的所有现有数据!

阵列卡的作用,简单的一句话就是加快网吧的速度,本为一个IDE的硬盘在带30以上就会造成瓶颈,速度就会慢下来,想提高速度一定得做阵列,这样不但速度快,以后加机器也不会有太大的影响。

做阵列注意的是:

阵列的一个误区就是大家还是把磁盘分开来看,作为阵列,你只能把做阵列的硬盘当成一个大的硬盘!在拷盘前我们用SFDISK(或者用其它分区软件,不用FDISK.EXE,因为FDISK.EXE只认80G,而一般做阵列后,硬盘都大于80G)对其进行分区,然后用GHOST将盘刻到阵列硬盘上面!

只要硬盘的位置与数据线不脱离,阵列卡如果换同名的阵列卡,其内容是不会改变的,因为阵列卡中相关参数设置保存在了硬盘当中。

磁盘阵列

1. 什么是磁盘阵列(Disk Array)?

磁盘阵列(Disk Array)是由一个硬盘控制器来控制多个硬盘的相互连接,使多个硬盘的读写同步,减少错误,增加效率和可靠度的技术。

2.什么是RAID?

RAID是Redundant Array of Inexpensive Disk的缩写,意为廉价冗余磁盘阵列,是磁盘阵列在技术上实现的理论标准,其目的在于减少错误、提高存储系统的性能与可靠度。常用的等级有1、3、5级等。

3.什么是RAID Level 0?

RAID Level 0是Data Striping(数据分割)技术的实现,它将所有硬盘构成一个磁盘阵列,可以同时对多个硬盘做读写动作,但是不具备备份及容错能力,它价格便宜,硬盘使用效率更佳,但是可靠度是最差的。

以一个由两个硬盘组成的RAID Level 0磁盘阵列为例,它把数据的第1和2位写入之一个硬盘,第三和第四位写入第二个硬盘……以此类推,所以叫“数据分割”,因为各盘数据的写入动作是同时做的,所以它的存储速度可以比单个硬盘快几倍。

但是,这样一来,万一磁盘阵列上有一个硬盘坏了,由于它把数据拆开分别存到了不同的硬盘上,坏了一颗等于中断了数据的完整性,如果没有整个磁盘阵列的备份磁带的话,所有的数据是无法挽回的。因此,尽管它的效率很高,但是很少有人冒着数据丢失的危险采用这项技术。

4.什么是RAID Level 1?

RAID Level 1使用的是Disk Mirror(磁盘映射)技术,就是把一个硬盘的内容同步备份复制到另一个硬盘里,所以具备了备份和容错能力,这样做的使用效率不高,但是可靠性高。

5.什么是RAID Level 3?

RAID Level 3采用Byte-interleaving(数据交错存储)技术,硬盘在SCSI控制卡下同时动作,并将用于奇偶校验的数据储存到特定硬盘机中,它具备了容错能力,硬盘的使用效率是安装几个就减掉一个,它的可靠度较佳。

6.什么是RAID Level 5?

RAID Level 5使用的是Disk Striping(硬盘分割)技术,与Level 3的不同之处在于它把奇偶校验数据存放到各个硬盘里,各个硬盘在SCSI控制卡的控制下平行动作,有容错能力,跟Level 3一样,它的使用效率也是安装几个再减掉一个。

7.什么是热插拔硬盘?

热插拔硬盘英文名为Hot-Swappable Disk,在磁盘阵列中,如果使用支持热插拔技术的硬盘,在有一个硬盘坏掉的情况下,服务器可以不用关机,直接抽出坏掉的硬盘,换上新的硬盘。一般的商用磁盘阵列在硬盘坏掉的时候,会自动鸣叫提示管理员更换硬盘。

磁盘阵列(Disk array)原理

为什么需要磁盘阵列? 如何增加磁盘的存取(acces)速度,如何防止数据因磁盘的故障而失落及如 何有效的利用磁盘空间,一直是电脑专业人员和用户的困忧;而大容量磁盘的价 格非常昂贵,对用户形成很大的负担。磁盘阵列技术的产生一举解决了这些问题。

过去十年来,CPU的处理速度几乎是几何级数的跃升,内存(memory)的 存取速度亦大幅增加,而数据储存装置——它要是磁盘(hard disk)——的存取 速度相较之下。较为缓慢。整个I/0吞吐量不能和系统匹配,形成电脑系统的瓶 颈,降低了电脑系统的整体性能(throughout)若不能有效的提升磁盘的存取速 度,CPU、内存及磁盘间的不平衡将使CPU及内存的改进形成浪费。

目前改进磁盘存取速度的方式主要有两种。一是磁盘快取控制(disk cache controller),它将从磁盘读取的数据存在快取内存(cache memory)中以减少磁 盘存取的次数。数据的读写都在cache内存中进行,大幅增加存取的速度,如要读 取的数据不在cache内存中,或要写数据到磁盘时,才做磁盘的存取动作。这种方 式在单工期环境(Single—tasking envioronment)如DOS之下。对大量数据的 存取有很好的性能(量小且频繁的存取则不然)。但在多工(multi—tasking)环 境之下(因为要不停的作数据交换(swapping)的动作)或数据库(database) 的存取(因每一记录都很小)就不能显示其性能。这种方式没有任何安全保障。

其一是使用磁盘阵列的技术。磁盘阵列是把多个磁盘组成一个阵列,当作单 一磁盘使用,它将数据以分段(striping)的方式储存在不同的磁盘中,存取数据 时,阵列中的相关磁盘一起动作:大幅减低数据的存取时间,同时有更佳的空间 利用率。磁盘阵列所利用的不同的技术,称为RAID level,不同的level针对不 同的系统及应用,以解决数据安全的问题。

一般高性能的磁盘阵列都足以硬件的形式来达成、进—步的把磁盘cache控制 及磁盘阵列结合在—个控制器(RAID controler)或控制卡个,针对个同的用户 解决人们对磁盘输出/入系统的四大要求:

(1)增加存取速度。

(2)容错(fault tolerance),即安全性。

(3)有效的利用磁盘空间。

(4)尽量的平衡CPU,内存及磁盘的性能并异,提高电脑的整体工作性能。

磁盘阵列原理

1987年,加州伯克利大学的一位人员发表了名为“磁盘阵列研究”的论文, 正式提到了RAID也就是滋盘阵列,论文提出廉价的5.25”及3.5”的硬盘也能如 大机器上的8”盘能提供人容量、高性能和数据的一致性,并详述了RAIDl至5 的技术。 磁盘阵列针对不同的应用使用的不同技术,称为RAID level,RAID是Redundant Array of Inexpenslve Disks的缩写,而每一level代表一种技术,目前 业界公认的标准是RAID0—RAID5。这个level并个代表技术的高低,level5并不高于level3,level1也个低于level4。字于要选样哪一种RAID level的产品,纯视用户的操作环境(Operating envir0nment)及应用(application)而定,与level 的高低没有必然的关系。RAID0没有安全的保障,仅其快速,所以适合高速I/0 的系统;RAIDl适用于需安全性又要兼顾速度的系统,RAID2及RAID3适用于 大型电脑及影像、CAD/CAM等处理;RAID5多用于0LTP,因有余融机构及 大型数据处理中心的迫切需要,故使用较多而较有名气,但也因此形成很多人对 磁盘阵列的误解,以为磁盘阵列非要RAID5不可;RAID4较少使用、和RAID5 有其共同之处,但RAID4适合大量数据的存取。其他如RAID6,RAID7。乃至 RAIDl0、50、100等,都是厂商各做各的,并无一致的标准,在此不作说明。

RAID1

RAID1是使用磁盘镜像(disk muroring)的技术,磁盘镜像应用在RAIDl 之前就在很多系统中使用,它的方式是在工作磁盘(working disk)之外再加一 额外的备份磁盘(backup disk)两个磁盘所储存的数据安全一致。数据在写入工 作磁盘同时也写入备份磁盘。

RAID2

RAID2是把数据分散为位元/位元组(bit/byte)或块(b1ock),加入海明码Hamming Code、在磁盘阵列中作间隔写入(Interleaving)到每个磁盘小。而 且地址(address)都一样,也就是在各个磁盘中,其数据都在相同的磁道(cylinder or track)及扇区中。RAID2又称为并行阵列(parallel array)其设计足使 用共轴同步(spindle synchronize)的技术,存取数据时、控个磁盘阵列—起动 作,在各个磁盘的相同位置作平行存取,所以有更好的存取时间(auesstime),共 总线(bus)是特别的设计以大带宽并行传输所存取的数据,所以有更好的传输时 间(transfer time)。在人型档案的存取应用,RAID2有更好的件能,仅如果档 案太小,会将其性能批下来。因为磁盘的存取足以期区为单位。而RAID2的存取是所有磁盘平行动作,而且是作单位元或位元组的存取。故小于—个扇区的数据 最会使其件能大打折扣。RAID2是设计给需要连续且大量数据的电脑使用的、如 大型电脑(mainframe to supercomputer)、作影像处理或CAD/CAM的工作站 (workstation)等,并个适用于—般的多用户环境网络服务器(network server)。 小型机或PC。

RAID3

RAID3的数据储存及存取方式都和RAID2一样,仅在安今方面以奇偶较验 (parity check)取代海明码做错误校正及检测,所以只需要—个额外的校检磁盘 (parity disk)。奇偶校验值的计算足以各个磁盘的相对应位作XOR的逻辑运算, 然后将结果写入奇偶校验磁盘,仟何数据的修改都要做奇偶校验计算。

RAID4

RAID4也使用一个校验磁盘,但和RAID3不一样,RAID4的方式是RAID0 加上一个校验磁盘。

RAID5

RAID5和RAID4相似但避免了RAID4的瓶颈,方法是不用校验磁盘而将校 验数据以循环的方式放在每一个磁盘中,RAID5的控制比较复杂,尤其是利用硬件对磁盘阵列的控制,因为这种方式的应用比其他的RAID level要掌握更多的事情,更多的输出/入需求,既要速度快,又要处理数据,计算校验值,做错误 校正等,所以价格较高,其应用更好是0LTP,至于用于大型文件,不见得有最 佳的性能。

RAID的对比: 下面几个表列是RAID的一些性质:

操作 工作模式 最少硬盘量 可用容量 适用范围

RAID0 磁盘延伸和数据分布 2 T PC服务器和图形工作站

RAIDl 数据分布和镜像 2 T/2

RAID2 共轴同步,并行传输,ECC 3 视结构而定 大档案且输入输出不频繁的应用 如:影像处理和CAD/CAM等

RAID3 共轴同步,并行传输,Parity 3 Tx(n—1)/n

RAID4 数据分布,固定Parity 3 Tx(n—1)/n

RAID5 数据分布,分布Parity 3 Tx(n—1)/n 银行、金融、股市、数据库等大 型数据处理中心OLTP应用

RAID的性能与可用性

RAID Level 用户数据利用率 BandWidth Performance Transaction Performance 数据可用性

RAID0 1 0.25 1 0.0005

RAID1 0.5 0.25 0.85 1

RAID2 0.67 1 0.25 0.9999

RAID3 0.75 1 0.25 0.9999

RAID4 0.75 0.25 0.61 0.9999

RAID5 0.75 0.25 0.61 0.9999

以上数据基于4个磁盘,传输块大小lK,75%的读概率,数据可用性的计算 基于同样的损坏概率。

RAID的概述

RAID0

没有任何额外的磁盘或空间作安全准备,所以一般人不重视它,这是误解。 其实它有更好的效率及空间利用率,对于追求效率的应用,非常理想,可同时用 其他的RAID level或其他的备份方式以补其不足,保护重要的数据。

RAID1

更佳的安全性,100%不停机,即使有一个磁盘损坏也能照常作业而不影响 其效能(对能并行存取的系统稍有影响),因为数据是作重复储存。RAIDl的并行 读取几乎有RAID0的性能、因为可同时读取相互镜像的磁盘;写入也只比RAID0略逊,因为同时写入两个磁盘并没有增加多少工作。虽比RAID0要增加—倍的 磁盘做镜像,但作为采用磁盘阵列的进入点,它是更便宜的一个方案,是新设磁 盘陈列的用户之更佳选择。

RAlD5

RAID5在不停机及容错的表现都很好,但如有磁盘故障。对性能的影向较大, 大容量的快取内存有助于维持性能,但在0LTP的应用中,因为每—笔数据或记 录(record)都很小,对磁盘的存取频繁。故有—定程度的影响。某磁盘故障 时,读取该磁盘的数据需把共用同一校验值分段的所有数据及校验值读出来、再把故障磁盘的数据计算出来;写入时,除了要重覆读取的程序外,还要再做校验值的计算,然后写入更新的数据及校验值;等换上新的磁盘,系统要计算整个磁 盘阵列的数据以回复故障磁盘的数据,时间要很长,如系统的工作负载很重的话, 有很多输出/入的请求征排队等候时,会把系统的性能拉下来。仅如使用硬件磁 盘阵列的话,其件能就可以得到大幅度的改进,因为硬件磁盘阵列如Arena系列 本身有内置的CPU与个机系统并行运作。所有存取磁盘的输出入工作都在磁盘陈列本身完成,不花费主机的时间,配合磁盘陈列的cache内存的使用,可以提高 系统的整体性能,而优越的SCSI控制更能增加数据的传输速率,即使枉磁盘故障 的情况下,主机系统的件能也不会有明显的降低。RAID5要做的事情太多,所以 价格较贵。不适于小系统,但如果是大系统使用大的磁盘阵列的话,RAID5却是 更便宜的方案。

总而言之,RAID0及RAIDl最适合PC服务器及图形工作站的用户,提供 更佳的性能及更便宜的价格。以低成本符合市场的需求。RAID2及RAID3适用 于大档案输入输出需求个频繁的应用如影像处理及CAD/CAM等;而RAID5 则适用于银行、金融、股市、数据库等大列数据处理中心的0LTP应用;RAID4 与RAID5有相同的特件及用方式,但其较适用于大型文件的读取。

磁盘阵列的额外容错功能

事实上容错功能已成为磁盘阵列最受清睐的特性,为了加强容错的功能以及使系统在磁盘故障的情况下能迅速的重建数据,以维持系统的性能,一般的磁盘 阵列系统都可使用热备份(hot spare or hot standby drive)的功能,所谓热备份是在建立(configure)磁盘阵列系统的时候,将其中一磁盘指定为后备磁盘, 此一磁盘在平常并不操作,仅若阵列中某一磁盘发生故障时,磁盘阵列即以后备 磁盘取代故障磁盘,并自动将故障磁盘的数据重建(rebuild)在后备磁盘之上, 因为反应快速,加上cache内存减少了磁盘的存取,所以数据重建很快即可完成,对 系统的性能影响不大。对丁要求不停机的大型数据处理中心或控制小心而言,热 备份更是一项重要的功能,因为可避免晚间或无人守护时发生磁盘故障所引起的 种种不便。

备份盘又有热备份与温备份之分,热备份税和温备份的不同在于热备份盘 和阵列—起运转,一有故障时马上备援,而温备份盘虽然带电但并个运转,需要 备援时才启动。两者分别在是否运转及启动的时间,仅温备份并不运转,理论上有较长的寿命。另一个额外的容错功能是坏期区转移(bad sector reassignment)。坏扇区是磁盘故障的主要原因,通常磁盘在读写时发牛坏扇区的 情况即表示此磁盘故障。不能冉作读写,甚至有很多系统会因为不能完成读写的 动作而死机,仅若因为某一扇区的损坏而使工作不能完成或要更换磁盘,则使得 系统性能大打折扣,而系统的维护成本也未免太高了,坏扇区转移是当磁盘阵列 系统发现磁盘有坏扇区时,以另一空白的且无故障的扇区取代该扇区,以延长磁盘 的使用寿命,减少坏磁盘的发生率以及系统的维护成本。所以坏扇区转移功能使 磁盘阵列具有更好的容错性,同时使整个系统村更好的成本效益比。其他如可外 接电池备援磁盘阵列的快取内存,以避免突然断电时数据尚未写回磁盘而丢失; 或在RAIDl时作写入一致性的检查等,虽是小技术,但亦不可忽视。

深入了解RAID

·元凯宁·PCHDD

RAID是由美国加州大学伯克利分校的D.A. Patterson教授在1988年提出的。RAID是Redundent Array of Inexpensive Disks的缩写,直译为“廉价冗余磁盘阵列”,也简称为“磁盘阵列”。后来RAID中的字母I被改作了Independent,RAID就成了“独立冗余磁盘阵列”,但这只是名称的变化,实质性的内容并没有改变。可以把RAID理解成一种使用磁盘驱动器的方法,它将一组磁盘驱动器用某种逻辑方式联系起来,作为逻辑上的一个磁盘驱动器来使用。一般情况下,组成的逻辑磁盘驱动器的容量要小于各个磁盘驱动器容量的总和。RAID的具体实现可以靠硬件也可以靠软件,Windows NT操作系统就提供软件RAID功能。RAID一般是在SCSI磁盘驱动器上实现的,因为IDE磁盘驱动器的性能发挥受限于IDE接口(IDE只能接两个磁盘驱动器,传输速率更高1.5MBps)。IDE通道最多只能接4个磁盘驱动器,在同一时刻只能有一个磁盘驱动器能够传输数据,而且IDE通道上一般还接有光驱,光驱引起的延迟会严重影响系统速度。SCSI适配器保证每个SCSI通道随时都是畅通的,在同一时刻每个SCSI磁盘驱动器都能自由地向主机传送数据,不会出现像IDE磁盘驱动器争用设备通道的现象。

RAID的优点

1.成本低,功耗小,传输速率高。在RAID中,可以让很多磁盘驱动器同时传输数据,而这些磁盘驱动器在逻辑上又是一个磁盘驱动器,所以使用RAID可以达到单个的磁盘驱动器几倍、几十倍甚至上百倍的速率。这也是RAID最初想要解决的问题。因为当时CPU的速度增长很快,而磁盘驱动器的数据传输速率无法大幅提高,所以需要有一种方案解决二者之间的矛盾。RAID最后成功了。

2.可以提供容错功能。这是使用RAID的第二个原因,因为普通磁盘驱动器无法提供容错功能,如果不包括写在磁盘上的CRC(循环冗余校验)码的话。RAID和容错是建立在每个磁盘驱动器的硬件容错功能之上的,所以它提供更高的安全性。

3.RAID比起传统的大直径磁盘驱动器来,在同样的容量下,价格要低许多。

RAID的分级

1.RAID0级,无冗余无校验的磁盘阵列。数据同时分布在各个磁盘驱动器上,没有容错能力,读写速度在RAID中最快,但因为任何一个磁盘驱动器损坏都会使整个RAID系统失效,所以安全系数反倒比单个的磁盘驱动器还要低。一般用在对数据安全要求不高,但对速度要求很高的场合。

2.RAID1级,镜象磁盘阵列。每一个磁盘驱动器都有一个镜像磁盘驱动器,镜像磁盘驱动器随时保持与原磁盘驱动器的内容一致。RAID1具有更高的安全性,但只有一半的磁盘空间被用来存储数据。主要用在对数据安全性要求很高,而且要求能够快速恢复被损坏的数据的场合。

3.RAID2级,纠错海明码磁盘阵列。磁盘驱动器组中的之一个、第二个、第四个……第2n个磁盘驱动器是专门的校验盘,用于校验和纠错,例如七个磁盘驱动器的RAID2,之一、二、四个磁盘驱动器是纠错盘,其余的用于存放数据。使用的磁盘驱动器越多,校验盘在其中占的百分比越少。RAID2对大数据量的输入输出有很高的性能,但少量数据的输入输出时性能不好。RAID2很少实际使用。

4.RAID3和RAID4,奇校验或偶校验的磁盘阵列。不论有多少数据盘,均使用一个校验盘,采用奇偶校验的方法检查错误。任何一个单独的磁盘驱动器损坏都可以恢复。RAID3和RAID4的数据读取速度很快,但写数据时要计算校验位的值以写入校验盘,速度有所下降。RAID3和RAID4的使用也不多。

5.RAID5级,无独立校验盘的奇偶校验磁盘阵列。同样采用奇偶校验来检查错误,但没有独立的校验盘,校验信息分布在各个磁盘驱动器上。RAID5对大小数据量的读写都有很好的性能,被广泛地应用。

从RAID1到RAID5的几种方案中,不论何时有磁盘损坏,都可以随时拔出损坏的磁盘再插入好的磁盘(需要硬件上的热插拔支持),数据不会受损,失效盘的内容可以很快地重建,重建的工作也由RAID硬件或RAID软件来完成。但RAID0不提供错误校验功能,所以有人说它不能算作是RAID,其实这也是RAID0为什么被称为0级RAID的原因——0本身就代表“没有”。

RAID的应用

当前的PC机,整个系统的速度瓶颈主要是硬盘。虽然不断有Ultra DMA33、DMA66、DMA100等快速的标准推出,但收效不大。在PC中,磁盘速度慢一些并不是太严重的事情。但在服务器中,这是不允许的,服务器必须能响应来自四面八方的服务请求,这些请求大多与磁盘上的数据有关,所以服务器的磁盘子系统必须要有很高的输入输出速率。为了数据的安全,还要有一定的容错功能。RAID提供了这些功能,所以RAID被广泛地应用在服务器体系中。

RAID提供的容错功能是自动实现的(由RAID硬件或是RAID软件来做)。它对应用程序是透明的,即无需应用程序为容错做半点工作。要得到更高的安全性和最快的恢复速度,可以使用RAID1(镜像);要在容量、容错和性能上取折衷可以使用RAID5。在大多数数据库服务器中,操作系统和数据库管理系统所在的磁盘驱动器是RAID1,数据库的数据文件则是存放于RAID5的磁盘驱动器上。

有时我们看某些名牌服务器的配置单,发现其CPU并不是很快,内存也算不上是很大,显卡更不是更好,但价格绝对不菲。是不是服务器系统都是暴利产品呢?当然不是。服务器的配置与一般的家用PC的着重点不在一处。除去更高的稳定性外,冗余与容错是一大特点,如双电源、带电池备份的磁盘高速缓冲器、热插拔硬盘、热插拔PCI插槽等。另一个特点就是巨大的磁盘吞吐量。这主要归功于RAID。举一个例子来说,一台使用了SCSI RAID的奔腾166与一台IDE硬盘的PⅢCopermine 800都用做文件服务器,奔腾166会比PⅢ的事务处理能力高上几十倍甚至上百倍,因为PⅢ处理器的运算能力根本用不上,反倒是奔腾166的RAID起了作用。

RAID现在主要应用在服务器,但就像任何高端技术一样,RAID也在向PC机上转移。也许所有的PC机都用上了SCSI磁盘驱动器的RAID的那一天,才是PC机真正的“出头之日”。

磁盘阵列是一种把若干硬磁盘驱动器按照一定要求组成一个整体,整个磁盘阵列由阵列控制器管理的系统。冗余磁盘阵列RAID(Redundant Array of Independent Disks)技术1987年由加州大学伯克利分校提出,最初的研制目的是为了组合小的廉价磁盘来段前代替大的昂贵磁盘,以降低大批量数据存储的费用(当时RAID称为Redundant Array of Inexpensive Disks 廉价握橘清的磁盘阵列),同时也希望采用冗余信息的方式,使得磁盘失效时不会使对数据的访问受损失,从而开发出一定水平的数据保护技术。

这个链接有详细更的说明伍含,你可以打开看看:

磁盘阵列(Redundant Arrays of Independent Drives,RAID),有“旦敬独立磁盘构成的具有冗余能力的阵列”之意。磁盘阵列是由很多块独立的磁盘,组合成一个容量巨大的磁盘组,利用个别磁盘提供数据所产生加成效果提升整桥锋个磁盘系统效能。敏迟晌

多块硬盘用RAID卡合成一块就是陈列

磁盘阵列分为哪几种,各有什么样的优缺点

磁盘阵列就是Raid

RAID(Redundant Array of Independent Disk 独立冗余磁盘阵列)技术是加州大学伯克利分校1987年提出,最初是为了组合小的廉价磁盘来代替大的昂贵磁盘,同时希望磁盘失效时不会使对数据的访问受损失而开发出一定水平的数据保护技术。RAID就是一种由多块廉价磁盘构成的冗余阵列,在操作系统下是作为一个独立的大型存储设备出现。RAID可以充分发挥出多块硬盘的优势,可以提升硬盘速度,增大容量,提供容错功能够确保数据安全性,易于管理的优点,在任何一块硬盘出现问题的情况下都可以继续工作,不会受到损坏硬盘的影响。

二、RAID的几种工作模式

1、RAID0

即Data Stripping数据分条技术。RAID 0可以把多块硬盘连成一个容量更大的硬盘群,可以提高磁盘的性能和吞吐量。RAID 0没有冗余或错误修复能力,成本低,要求至少两个磁盘,一般只是在那些对数据安全性要求不高的情况下才被使用。

(1)、RAID 0最简单方式

就是把x块同样的硬盘用硬件的形式通过智能磁盘控制器或用操作系统中的磁盘驱动程序以软件的方式串联在一起,形成一个独立的逻辑驱动器,容量是单独硬盘的x倍,在电脑数据写时被依次写入到各磁盘中,当一块磁盘的空间用尽时,数据就会被自动写入到下一块磁盘中,它的好处是可以增加磁盘的容量。速度与其中任何一块磁盘的速度相同,如果其中的任何一块磁盘出现故障,整个系统将会受到破坏,可靠性是单独使用一块硬盘的1/n。

(2)、RAID 0的另一方式

是用n块硬盘选择合理的带区大小创建带区集,更好是为每一块硬盘都配备一个专门的磁盘控制器,在电脑数据读写时同时向n块磁盘读写数据,速度提升n倍。提高系统的性能。

2、RAID 1

RAID 1称为磁盘镜像:把一个磁盘的数据镜像到另一个磁拦链桐盘上,在不影响性能情况下更大限度的保证系统的可靠性和可修复性上,具有很高的数据冗余能力,但磁盘利用率为50%,故成本更高,多用在保存关键性的重要数据的场合。RAID 1有以下特点:

(1)、RAID 1的每一个磁盘都具有一个对应的镜像盘,任何时候数据都同步镜像,系统可以从一组镜像盘中的任何一个磁盘读取数据。

(2)、磁盘所能使用的空间只有磁盘容量总和的唤毕一半,系统成本高。

(3)、只要系统中任何一对镜像盘中至少有一块磁盘可以使用,甚至可以在一半数量的硬盘出现问题时系统都可以正常运行。

(4)、出现硬盘故障的RAID系统不再可靠,应当及时的更换损坏的硬盘,否则剩余的镜像盘也出现问题,那么整个系统就会崩溃。

(5)、更换新盘后原有数据会需要很长时间同步镜像,外界对数据的访问不会受到影响,只是这时整个系统的性能有所下降。

(6)、RAID 1磁盘控制器的负载相当大,用多个磁盘简坦控制器可以提高数据的安全性和可用性。

3、RAID0+1

把RAID0和RAID1技术结合起来,数据除分布在多个盘上外,每个盘都有其物理镜像盘,提供全冗余能力,允许一个以下磁盘故障,而不影响数据可用性,并具有快速读/写能力。RAID0+1要在磁盘镜像中建立带区集至少4个硬盘。

4、RAID2

电脑在写入数据时在一个磁盘上保存数据的各个位,同时把一个数据不同的位运算得到的海明校验码保存另一组磁盘上,由于海明码可以在数据发生错误的情况下将错误校正,以保证输出的正确。但海明码使用数据冗余技术,使得输出数据的速率取决于驱动器组中速度最慢的磁盘。RAID2控制器的设计简单。

5、RAID3:带奇偶校验码的并行传送

RAID 3使用一个专门的磁盘存放所有的校验数据,而在剩余的磁盘中创建带区集分散数据的读写操作。当一个完好的RAID 3系统中读取数据,只需要在数据存储盘中找到相应的数据块进行读取操作即可。但当向RAID 3写入数据时,必须计算与该数据块同处一个带区的所有数据块的校验值,并将新值重新写入到校验块中,这样无形虽增加系统开销。当一块磁盘失效时,该磁盘上的所有数据块必须使用校验信息重新建立,如果所要读取的数据块正好位于已经损坏的磁盘,则必须同时读取同一带区中的所有其它数据块,并根据校验值重建丢失的数据,这使系统减慢。当更换了损坏的磁盘后,系统必须一个数据块一个数据块的重建坏盘中的数据,整个系统的性能会受到严重的影响。RAID 3更大不足是校验盘很容易成为整个系统的瓶颈,对于经常大量写入操作的应用会导致整个RAID系统性能的下降。RAID 3适合用于数据库和WEB服务器等。

6、 RAID4

RAID4即带奇偶校验码的独立磁盘结构,RAID4和RAID3很象,它对数据的访问是按数据块进行的,也就是按磁盘进行的,每次是一个盘,RAID4的特点和RAID3也挺象,不过在失败恢复时,它的难度可要比RAID3大得多了,控制器的设计难度也要大许多,而且访问数据的效率不怎么好。

7、 RAID5

RAID 5把校验块分散到所有的数据盘中。RAID 5使用了一种特殊的算法,可以计算出任何一个带区校验块的存放位置。这样就可以确保任何对校验块进行的读写操作都会在所有的RAID磁盘中进行均衡,从而消除了产生瓶颈的可能。RAID5的读出效率很高,写入效率一般,块式的集体访问效率不错。RAID 5提高了系统可靠性,但对数据传输的并行性解决不好,而且控制器的设计也相当困难。

8、RAID6

RAID6即带有两种分布存储的奇偶校验码的独立磁盘结构,它是对RAID5的扩展,主要是用于要求数据绝对不能出错的场合,使用了二种奇偶校验值,所以需要N+2个磁盘,同时对控制器的设计变得十分复杂,写入速度也不好,用于计算奇偶校验值和验证数据正确性所花费的时间比较多,造成了不必须的负载,很少人用。

9、 RAID7

RAID7即优化的高速数据传送磁盘结构,它所有的I/O传送均是同步进行的,可以分别控制,这样提高了系统的并行性和系统访问数据的速度;每个磁盘都带有高速缓冲存储器,实时操作系统可以使用任何实时操作芯片,达到不同实时系统的需要。允许使用SNMP协议进行管理和监视,可以对校验区指定独立的传送信道以提高效率。可以连接多台主机,当多用户访问系统时,访问时间几乎接近于0。但如果系统断电,在高速缓冲存储器内的数据就会全部丢失,因此需要和UPS一起工作,RAID7系统成本很高。

10、 RAID10

RAID10即高可靠性与高效磁盘结构它是一个带区结构加一个镜象结构,可以达到既高效又高速的目的。这种新结构的价格高,可扩充性不好。

11、 RAID53

RAID7即高效数据传送磁盘结构,是RAID3和带区结构的统一,因此它速度比较快,也有容错功能。但价格十分高,不易于实现。

个人使用磁盘RAID主要是用RAID0、 RAID1或RAID0+1工作模式。

  磁盘阵列分为三种:

  一、外接式磁盘阵列柜;

  二、升穗内接式磁盘阵列卡;

  三、利用软件来仿真。

  三种各自的优缺点:

  一、外接式磁盘阵列柜最常被使用大型服务器上,具可热交换(Hot Swap)的特性,不过这类产品的价格都很贵。

  二、内接式磁盘阵列卡,因为价格便宜,但需要较高的安装技术,适合技术人员使用操作。硬件阵列能够提供在线扩容、动态修改阵列级别、自动数据恢复、驱动器漫游、超高速缓冲等功能。它能提供性能、数据保护、可靠性、可用性和可管理性的轮笑局解决方案。阵列卡专用的处理单元来进行操作。

  三、利用软件仿真的方式,是指通过网络操作系统自身提供的磁盘管理功能将连接的普通SCSI卡上的多块硬盘配置成逻辑盘,组成阵列。软件阵列可以提供数据冗余功能,但腊让是磁盘子系统的性能会有所降低,有的降低幅度还比较大,达30%左右。因此会拖累机器的速度,不适合大数据流量的服务器。

HA强调的是高可伍衡核用性,与扩展性。 阵列双机更强调的是安全性。这里需要强调的是“高可用”三个字,高可用并不表拦租示你的应用不会中断! 当然,应用也许只是暂时的停顿。而双机不是这样的,同时双机对应用程序腔掘本身也有特殊的要求,其应用范围要比HA狭窄的多,其高昂的价格也不是一般用户所能承受的。另一方面,用双阵列来做容错甚至于容灾,由于其内部使用的是专有协议,它的效率是非常高的。 当然,这里也有一个规划的问题。比如:数据是同步还是异步呢?这些都需要根据你自己的应用来讲。

这篇空逗槐斗友文章应该对你有用:指禅

数据磁盘阵列技术的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于数据磁盘阵列技术,数据磁盘阵列技术:高效存储,数据保障,什么是磁盘阵列?,磁盘阵列分为哪几种,各有什么样的优缺点的信息别忘了在本站进行查找喔。


数据运维技术 » 数据磁盘阵列技术:高效存储,数据保障 (数据磁盘阵列技术)