服务器|数据|数据库MyCollege.Net中数据库服务器安装部署
目录
一. 前言…………………………………………………………………………1
二. 应用意义……………………………………………………………………1
三. 相关技术……………………………………………………………………2
四. 系统配置……………………………………………………………………6
五. 系统特点……………………………………………………………………8
六. 小结…………………………………………………………………………9
摘要
该系统采用SAN存储技术应用于数据库服务器,以提高访存速度的方式来提高系统的整体速度,并为系统提供广阔的扩展空间。
This system, which use SAN storage technic,used in this system’s database server to improve the system’s speed.It provides the system a wide expand area.
关键词 SAN,磁盘阵列,RAID
一. 前言
该系统包括用户统一身份验证系统和公共资源管理系统,其中身份验证系统主要是存储用户登录的用户名和密码信息,主要涉及到的是数据库的查询操作,不会存在一个信息被多个用户访问的情况,只有在多个用户同时登录的时候才对数据的访问速度要求不是很高。公共资源管理系统存储学生的学号、姓名、选课信息等,还包括教师的一些相关信息,除了很可能出现的多用户对整个系统的访问的情况外,还有可能出现多个用户对其中一个学生或者教师的信息的访问,对存储设备的访问速度、响应时间的要求相当高。并且这两个系统的数据影响到学生和教师的切身的利益,意外的数据丢失或者破坏都会对用户的利益造成不可预料的影响,甚至会导致学校的管理的混乱等严重后果,所以数据的安全性及其的重要。同时由于诸如新生的入校等造成注册信息的增多等,对存储容量就有更高的要求,所以系统的扩展空间成为一个值得考虑的问题,因此我们采取具有高读写速度、高扩展性的SAN存储系统。
二. 应用意义
SAN存储系统用于对数据存储量大,读写速度快、实时性要求高的计算机系统中,对提高整个系统的性能起到了极其重要的作用。该系统采用把磁盘阵列通过控制器后,作为本地硬盘,然后再把在这些“本地硬盘”共享,要读取阵列的数据的服务器(工作站)把这些盘衍射到本地硬盘,在读取数据的时候,磁盘阵列的数据就从光纤交换机通过光纤直接传输到相应的服务器(工作站)。由于是采用光纤直接传输,速度快,并且是每个服务器(工作站)都是专门的光纤传输,不会因为其他的工作站或者服务器的读写而影响该工作站(服务器)对磁盘阵列数据的读写,实时性很高、传输速度也稳定。读取数据过程由磁盘阵列控制器完成,大大减轻了服务器的负担,让服务器能做其他更为重要的工作。
三. 相关技术
所用到的技术主要是磁盘阵列原理:
磁盘阵列的技术:磁盘阵列是把多个磁盘组成一个阵列,当作单一磁盘使用,它将数据以分段的方式储存在不同的磁盘中,存取数据时,阵列中的相关磁盘一起动作,大幅减低数据的存取时间,同时有更佳的空间利用率。磁盘阵列所利用的不同的技术,称为RAID level,不同的level针对不同的系统及应用,以解决数据安全的问题。
一般高性能的磁盘阵列都是以硬件的形式来达成,进一步的把磁盘快取控制及磁盘阵列结合在一个控制器或控制卡上,针对不同的用户解决人们对磁盘输出入系统的四大要求:
(1)增加存取速度;
(2)容错,即安全性;
(3)有效的利用磁盘空间;
(4)尽量的平衡CPU,内存及磁盘的性能差异,提高电脑的整体工作性能。
磁盘阵列的原理:
磁盘阵列中针对不同的应用使用的不同技术,称为RAID level, RAID是Redundant Array of Inexpensive Disks的缩写,而每一level代表一种技术,目前常用是RAID 0~RAID 5。这个level并不代表技术的高低,level 5并不高于level 3,level 1也不低过level 4,至于要选择那一种RAID level的产品,纯视用户的操作环境及应用而定,与level的高低没有必然的关系。RAID 0及RAID 1适用于PC及PC相关的系统如小型的网络服务器及需要高磁盘容量与快速磁盘存取的工作站等,因为比较便宜,但因一般人对磁盘阵列不了解,没有看到磁盘阵列对他们价值,市场尚未打开;RAID 2及RAID 3适用于大型电脑及影像、CAD/CAM等处理;RAID 5多用于OLTP,因有金融机构及大型数据处理中心的迫切需要,故使用较多而较有名气,但也因此形成很多人对磁盘阵列的误解,以为磁盘阵列非要RAID 5不可;RAID 4较少使用,因为两者有其共同之处,而RAID 4有其先天的限制。介绍各个RAID level之前,先看看形成磁盘阵列的两个基本技术:
如下图所示,DFTraid 磁盘阵列控制器,联接了四个磁盘:
这四个磁盘形成一个阵列,而磁盘阵列的控制器是将此四个磁盘视为单一的磁盘,如DOS环境下的C:盘,把小容量的磁盘延伸为大容量的单一磁盘,用户不必规划数据在各磁盘的分布,而且提高了磁盘空间的使用率。DFTraid的SCSI磁盘阵列更可连接几十个磁盘,形成容量达几T甚至几十T的阵列,使磁盘容量几乎可作无限的延伸;而各个磁盘一起作取存的动作,比单一磁盘更为快捷。
磁盘阵列是将同一阵列的多个磁盘视为单一的虚拟磁盘,所以其数据是以分段的方式顺序存放在磁盘阵列中,如下图
磁盘0
磁盘1
磁盘2
磁盘3
A0-A1
B0-B1
C0-C1
D0-D1
A2-A3
B2-B3
C2-C3
D2-D3
A4-A5
B4-B5
C4-C5
D4-C5
A6-A7
B6-B7
C6-C7
D6-D7
数据按需要分段,从第一个磁盘开始放,放到最后一个磁盘再回到第一个磁盘放起,直到数据分布完毕。
下面主要介绍几种RAID:
RAID0:
RAID 0使磁盘的输出入有最高的效率。而磁盘阵列有更好效率的原因除数据分段外,它可以同时执行多个输出入的要求,因为阵列中的每一个磁盘都能独立动作,分段放在不同的磁盘,不同的磁盘可同时作读写,而且能在快取内存及磁盘作并行存取的动作,但只有硬件的磁盘阵列才有此性能表现。
RAID 1
RAID 1是使用磁盘镜像的技术。它的方式是在工作磁盘之外再加一额外的备份磁盘,两个磁盘所储存的数据完全一样,数据写入工作磁盘的同时亦写入备份磁盘。不同于普通的磁盘镜像,RAID 1无工作磁盘和备份磁盘之分,多个磁盘可同时动作而有重叠读取的功能,甚至不同的镜像磁盘可同时作写入的动作,这是一种最佳化的方式,称为负载平衡。例如有多个用户在同一时间要读取数据,系统能同时驱动互相镜像的磁盘,同时读取数据,以减轻系统的负载,增加I/O的性能。
RAID 2
RAID 2是把数据分散为位元或块,加入海明码,在磁盘阵列中作间隔写入到每个磁盘中,而且地址都一样,也就是在各个磁盘中,其数据都在相同的磁道及扇区中。RAID 2的设计是使用共轴同步的技术,存取数据时,整个磁盘阵列一起动作,在各作磁盘的相同位置作平行存取,所以有最好的存取时间,其总线是特别的设计,以大带宽并行传输所存取的数据,所以有最好的传输时间。在大型档案的存取应用,RAID 2有最好的性能,但如果档案太小,会将其性能拉下来,因为磁盘的存取是以扇区为单位,而RAID 2的存取是所有磁盘平行动作,而且是作单位元的存取,故小于一个扇区的数据量会使其性能大打折扣。
RAID 3
RAID 3的数据储存及存取方式都和RAID 2一样,但在安全方面以奇偶校验取代海明码做错误校正及检测,所以只需要一个额外的校检磁盘。奇偶校验值的计算是以各个磁盘的相对应位作XOR的逻辑运算,然后将结果写入奇偶校验磁盘,任何数据的修改都要做奇偶校验计算,如某一磁盘故障,换上新的磁盘后,整个磁盘阵列(包括奇偶校验磁盘)需重新计算一次,将故障磁盘的数据恢复并写入新磁盘中;如奇偶校验磁盘故障,则重新计算奇偶校验值,以达容错的要求。
RAID 4
RAID 4是以扇区作数据分段,各磁盘相同位置的分段形成一个校验磁盘分段,放在校验磁盘。这种方式可在不同的磁盘平行执行不同的读取命今,大幅提高磁盘阵列的读取性能;但写入数据时,因受限于校验磁盘,同一时间只能作一次,启动所有磁盘读取数据形成同一校验分段的所有数据分段,与要写入的数据做好校验计算再写入。即使如此,小型档案的写入仍然比RAID 3要快,因其校验计算较简单而非作位(bit level)的计算;但校验磁盘形成RAID 4的瓶颈,降低了性能。
RAID 5
RAID5避免了RAID 4的瓶颈,方法是不用校验磁盘而将校验数据以循环的方式放在每一个磁盘中,磁盘阵列的第一个磁盘分段是校验值,第二个磁盘至后一个磁盘再折回第一个磁盘的分段是数据,然后第二个磁盘的分段是校验值,从第三个磁盘再折回第二个磁盘的分段是数。据,以此类推,直到放完为止。校验值是由各磁盘同一位置的分段的数据所计算出来。这种方式能大幅增加小档案的存取性能,不但可同时读取,甚至有可能同时执行多个写入的动作。
将以上几种策略相比较:RAID0的磁盘利用率高、数据的读写速度快,但是数据的安全的保障差;RAID1的数据的读写速度快、数据的安全有很好的保障,缺点就是磁盘的利用率低;RAID2到RAID5可以说是RAID0和RAID1的结合,读写速度快,数据的安全也有很好的保障,磁盘的利用率比较高,但是RAID2和RAID3适合于大批量数据的批量读写,在数量繁多的小量数据的读写性能不是很好;RAID4解决了以上的问题,但是校验盘容易形成通信瓶颈,RAID5的出现解决了这一问题。因此,在用户身份验证系统和公共资源管理系统中存储的信息都是数目繁多的小块数据,并且数据的安全性要求很高,所以不适合采用RAID0、RAID2和RAID3读取方式,该系统中,特别是公共资源管理系统,有可能存在多个用户同时对某个学生或者教师的信息的访问,如果采用RAID1读写方式,当出现这种情况时可以让互为镜像的磁盘同时读取数据,相对于RAID5来说无疑会大大提高系统的性能。所以在磁盘阵列的读写策略上采用RAID1策略。 (更多技术可参阅http://www.dft.com.cn)
为了保证系统的长时间不间断工作,采用系统设备的冗余来进行保证。磁盘阵列采用双控制器,在通常情况下,双控制器一同工作,提高输入输出数据的速度,提高系统的性能,同时能大大减少因控制器故障造成的系统服务的中断;与此类似,服务器也做成群集服务的方式。
四. 系统配置
该系统的接线图(图 A)
各类服务器除了基本的配置外,这里只介绍一下其特殊的硬件配置。数据库服务器:以太网卡(100M),光纤通道卡(FC卡)。Web服务器:以太网卡(100M),光纤通道卡,光纤网卡(如果要做成群集服务的话就需要额外的一块以太网卡)。以太网交换机和FC交换机(以16口交换机为例)用CISCO或者vixel交换机即可。以太网交换机不需要其他特别的配置,如果要用同一台交换机连接其他的非属于该系统的网络,最好把连接到该存储网络的服务器连接到交换机的接口单独划分为一个VLAN,以避免干扰。对于FC交换机,可以用SAN INSITE等软件进行配置,假定连接磁盘阵列控制器的光纤另一段接在FC交换机的1号和2号接口,则连接其他服务器的光纤的接口要设定成只能同1号和2号接口通信而不能进行相互通信,这样以避免各服务器之间的相互干扰。在配置控制器时,应注意屏蔽掉不必读取该LUN的服务器对该LUN的访问,以提高数据的安全性。
软件上的配置:服务器统一安装WINDOWS 2000 ADVANCE SERVER,装好操作系统和各硬件的驱动程序后,安装SANergy,重启服务器,然后测试服务器对磁盘阵列的读数据和写数据的速度,如果为75M左右说明系统运行正常,对于数据库服务器,安装sql server,并且导入数据。对于WEB服务器,安装IIS服务。以太网卡接的是存储网络的以太网交换机,光纤网卡接入到所在的局域网或者广域网中,负责和用户的通信,所以以太网卡的IP和光纤网卡的IP的设定一定要设定成不在同一网段。对于比如进行公共资源管理的服务器,可以把多台服务器做成群集服务,以提高性能和稳定性。
五. 系统的特点
磁盘阵列上的磁盘可以划分成不同的卷,为了保证数据的安全,把用户统一身份认证系统的数据(用户名和密码)放于一个LUN上面;而把公共资源管理系统相关的数据放在其他的LUN上面,不通的服务器访问与之相关的LUN,这样就可以通过防止不同的服务器的非法访问而导致的数据的破坏。因此磁盘阵列至少划分成两个LUN(LUN0和LUN1),分别存储以上两个子系统的相关的数据,如果空间足够的比较大的话,划分其他的LUN来存放其他的数据。划分的这些卷就成为服务器上磁盘,并设为共享,然后其他的web服务器通过把这些磁盘衍射到本地磁盘的方式访问磁盘阵列上的磁盘,使用方便、直观。数据的传输是通过专门的光纤传输,而不是通过以太网(该功能由SANergy来实现,所以数据库服务器和wed服务器都需要装SANergy),速度快,并且不会有争用传输通道的情况发生,因此,响应时间短,数据的读写速度也稳定。磁盘阵列的磁盘支持热插拔技术,在磁盘损坏的情况发生时,可以在系统不停机的情况下拔出损坏的磁盘,换上新的磁盘,即可重建损坏的磁盘上面的数据,其他设备,诸如磁盘阵列、服务器等的电源也支持热插拔技术,能保证在系统运行的时候更换掉损坏的部件,保证了系统工作的持续性和数据的安全性。随着数据量的不断增大,当单个的磁盘阵列不能满足需要的时候可以扩展新的磁盘阵列来加倍增加存储容量,并且不用增加新的价格昂贵的控制器,这样就为用户提供了很大的扩展空间,同时扩展需要的成本也大大减少。
六. 小结
这次毕业设计主要是用实习期间学到的网络存储技术,在毕业设计中进行一次实际的应用,是对当时学习的一次考核。在这次设计查询各方面的过程中使我对网络存储技术有了更深刻的了解,掌握了不少的提高数据安全和访问速度方面的思想。同时通过和小组的其他同学的合作,亲自体会到协同合作的主要性。在本文完成之际,衷心感谢指导老师的悉心指导和本组的各位同学对我的大力帮助,此设计能顺利完成,成都索贝数码科技股份有限公司为我提供的实习机会有不可缺少的作用,对此表示衷心感谢。
(图 A)
MyCollege.Net中数据库服务器安装部署
80酷酷网 80kuku.com