用户计算机系统选型参考.docx
- 文档编号:3455420
- 上传时间:2022-11-23
- 格式:DOCX
- 页数:31
- 大小:66.75KB
用户计算机系统选型参考.docx
《用户计算机系统选型参考.docx》由会员分享,可在线阅读,更多相关《用户计算机系统选型参考.docx(31页珍藏版)》请在冰豆网上搜索。
用户计算机系统选型参考
四川电力营销系统数据库服务器
方案建议书
四川启明星信息技术有限公司
二零零三年三月
绪言
数据库服务器系统包括数据处理服务器和数据存储系统。
如何满足一定阶段内数据不断增长的现实需要,并确保数据永远连续地保存下来这是对数据中心硬件平台的最基本的要求。
存储和服务器已经是现代数据中心等价并重的两个主体。
数据是信息系统永恒的主体和灵魂。
计算机硬件水平的发展日新月异,计算机硬件平台的生命周期是屈指可数的几年或十几年。
然而,信息系统的数据将随着数据不断地被收集、加工、完善和更新而不断地增长而变得越来越重要。
随着四川电力营销系统数据集中存储工程的实施,这种数据集中存储在带给企业信息资源管理的整体更加安全、高效、方便的同时,集中后的数据的重要性和安全性也变得越来越高。
据美国国家计算机安全协会统计,每丢失20MB的关键数据,销售/市场营销部门将损失US$17,000,财务部门将损失US$19,000,工程部门将损失US$98,000,而据PCWeek统计,如果丢失关键业务数据超过10天以上,50%的企业将永远无法恢复运营。
因此,如何确保四川电力营销系统的数据在任何情况下(国家正常生活秩序下的)都得到安全、完整保存并提高连续的可访问性将是四川电力营销系统数据存储平台建设首要考虑的问题。
第一章系统高可靠性浅析
系统的可靠性包括平台的可靠性和数据的可靠性。
系统的高可靠性是四川电力营销系统的重要指标,尤其数据的高可靠性是系统必须具备的重要指标。
平台的高可靠性是指服务器、存储设备等硬件设备和操作系统、数据库等软件平台的高可靠性。
其本质是指平台的连续可用,其高可靠性解决措施包括冗余技术,故障检测、隔离和自动纠正技术,Cluster技术等。
平台的高可靠对应用的影响是一次性的或临时的,总是可恢复的。
数据的高可靠性(如数据的丢失)对应用的影响是灾难性的、永久性的。
数据高可靠性可以理解为以下三个层次:
1)、数据能接受不间断的访问。
这是对数据可靠性的最高要求,他要求在国家政治生活秩序正常的情况下,即即使在遇到战争、恐怖袭击,台风地震等自然灾害,火灾、人为破坏等情况只要当地的政治生活秩序正常(以下简称灾难情况),数据存储系统都要能提供连续的可访问服务。
当然,数据更不能丢失。
2)、数据不丢失。
当灾难情况发生时,或存储系统硬件故障发生时,尽管存储系统对外的访问服务停止了,但所有已提交成功的数据均完整保存下来。
并可以很快恢复存储系统的对外访问服务。
3)、数据丢失或破坏后可恢复。
是指当数据丢失,遭到恶意破坏、更改造成数据不完整不正确时,存储系统的数据可以恢复到之前的某一完整、正确的数据存储时间点。
数据集中存储后的数据存储要解决两件事:
即数据的海量存储和数据的安全(高可靠)存储。
第二章数据高可靠性的实现方式
针对上述数据高可靠性要求,数据高可靠存储采取的措施是:
1)、异地容灾。
可抵御地震、火灾、台风等强大灾害。
2)、冗余技术。
包括RAID技术和存储系统硬件平台的冗余技术。
采用RAID1、0+1、5等。
可避免单个硬盘故障造成数据丢失。
特点是数据服务基本不间断。
广泛用于数据保护,并提高系统的可靠性。
不能容灾。
3)、磁带备份,异地保存。
可避免磁盘坏、火灾、地震等意外。
2.1系统容灾方案浅析
系统容灾方案可定义为三种:
异地Cluster、数据异地复制容灾、磁带容灾。
其中异地Cluster是系统和数据的容灾,数据异地实时复制、磁带容灾仅仅是数据冗灾。
2.1.1 异地Cluster容灾
如下图所示,本地的系统或Cluster系统,通过ATM、微波、广域网与相距数十或数百公里的异地系统做Cluster。
两套系统、两套数据、两套应用实时同步。
一旦本地数据中心遇到毁灭性灾难,异地系统将应用接管。
因此要求数据中心和灾备中心的服务器性能相当。
其特点是:
(1)、不但做到了数据不丢失,而且确保应用不间断。
(2)、遇灾后,无须数据恢复,只需要重建容灾系统。
(3)、系统的可用性最高。
(4)、数据实时有完整的异地复制品。
(5)、数据复制对系统应用性能影响很小。
(6)、成本昂贵。
WAN
(7)、如果因错误操作和恶意更改数据造成的数据不正确或不一致时,将无法回到先前的某一数据正确或完整的时间点。
避免这类风险需要使用快照技术或磁带备份等方式协助完成。
异地Cluster容灾示意图
2.1.2 数据异地复制容灾
如下图所示,一套主机系统,两套数据存储系统。
该方案的实施有两种方法,分别如下图所示。
图A采用逻辑卷管理软件,通过异地镜像实现。
两套存储系统间由光纤交换机互连,容灾距离低于10公里。
图B采用容灾软件的卷复制模块,本地的系统或Cluster系统,通过ATM、微波、广域网与相距数十或数百公里的异地复制系统间做数据同步。
两套系统、两套数据。
但备份主机的性能可以选得很低,一套工作站就可以。
一旦本地数据中心遇到毁灭性灾难,数据得以保存。
其特点是:
(1)、遇灾后,应用将中断,但中断时间相对较短。
(2)、遇灾后,需重建系统平台,并与灾备中心数据存储系统连接,无须数据恢复。
(3)、数据可靠性高,数据实时有完整的异地复制品。
(4)、数据复制对系统应用性能影响很小。
(5)、成本较高。
(6)、如果因错误操作和恶意更改数据造成的数据不正确或不一致时将无法回到先前的某一数据正确或完整的时间点。
避免这类风险需要使用快照技术或磁带备份等方式协助完成。
WAN
数据中心服务器
数据中心灾备中心数据中心灾备中心
图A图B
2.1.3 磁带备份容灾
如下图所示,一套主机系统,一套磁盘数据存储系统。
采用两套带库,用容灾备份软件和快照等技术对数据库等应用进行在线备份两套磁带数据。
一套磁带异地保存。
本地数据中心遇到毁灭性灾难,数据异地有完好备份。
其特点是:
(1)、遇灾后,需重建系统平台,恢复备份的磁带数据。
(2)、数据在灾区外有可靠备份。
(3)、数据恢复时间长。
(4)、数据不能实时复制。
(5)、从上次备份到遇灾时的数据不能恢复。
(6)、数据复制对系统应用性能有较大影响。
(7)、成本相对较低。
磁带备份容灾示意图
此外,还有数据库等应用软件厂家提供的远程数据复制工具。
但这类软件只能备份应用数据。
其特点与磁带异地容灾相似。
2.2数据备份方案
数据备份按存储介质划分为:
(1)、磁盘备份。
(2)、磁带备份。
(3)、光盘库备份等。
按备份是否中断应用分为:
、
(1)、在线备份。
(2)、离线备份。
还可以分为本机系统级的简单备份和网络环境的多节点跨平台的企业级备份-----网络备份。
企业级网络备份又可分为:
(1)、LAN备份。
(2)、基于SAN结构的LANFree备份。
(3)、基于SAN结构的ServerLess备份。
其中LAN备份要消耗较高的网络带宽,基于SAN的LANFree备份不消耗网络资源,ServerLess备份时对系统资源消耗很少。
此外,还有数据库等应用软件厂家提供的本地备份工具。
但这类软件只能备份本机数据且通常只能备份应用数据。
数据备份方案的特点是:
(1)、数据复制品在本地保存,不能容灾。
(2)、数据无法实时备份,只能定期备份。
(3)、数据恢复时间长。
(4)、备份时通常对应用的影响较大。
(5)、成本相对较低。
2.3存储系统硬件冗余
数据中心的在线存储系统主要指磁盘阵列存储系统。
部门级以上的阵列存储系统均采用了许多的硬件冗余技术或措施。
其的硬件冗余包括:
(1)、数据存取通道与接口的冗余。
(2)、数据存取控制及电气单元的冗余。
(3)、阵列配置信息的冗余。
(4)、数据存储介质的冗余。
通常指RAID。
通过以上的冗余技术和冗余器件,确保磁盘阵列存储系统中的数据在部分阵列元器件甚至一半阵列元器件损坏的情况下仍能被读写,或者至少确保已成功记录的数据不丢失。
2.3.1数据存取通道与接口的冗余
下图以SAN存储架构为例,对DAS(直接连接存储系统即主机直接与存储相连)也一样。
主机到存储都有两条或两条以上的数据通道。
利用存储管理软件,在多通道都工作正常时,主机可动态地多路访问存储(负载均衡)。
当某一通道出故障不工作时,存储在磁盘介质上的数据仍能被访问。
要实现数据存取通道的冗余必须建立冗余的FC—AL通道或SCSI通道,它要求:
(1)、主机上要有冗余的HBA(主机与阵列的接口)卡。
(2)、阵列上有冗余的数据接口。
(3)、硬盘有双通道接口。
(4)、阵列控制器对冗余回路的支持。
2.3.2数据存取控制及电气单元的冗余
包括:
(1)、阵列控制卡的冗余。
(2)、电源的冗余。
(3)、风冷系统的冗余等。
2.3.3、阵列配置信息的冗余
一些阵列的配置信息存储在阵列控制卡中。
如果阵列控制卡没有冗余,而阵列配置信息又没有备份。
当阵列卡坏时,阵列上的所有数据将无法恢复,这对数据的可靠性构成致命的威胁。
另一些阵列设计时考虑到这种危险,将阵列配置信息冗余地保存许多副本,只要遵循阵列的维护规则便可避免这类危险。
2.4RAID技术
RAID技术可实现两个目的即改善读写性能和冗错。
RAID实现方式有硬件RAID和软件RAID。
利用RAID1、1+0、5等有冗余措施的RAID级别可确保某个或某些磁盘故障时的数据的高可靠性。
第三章电力系统数据高可靠性实现方案建议
通过上面的阐述,我们认为实现电力系统数据高可靠性的目的是:
实现数据在任何情况下的安全存储(即数据不丢失),并尽量提高数据的连续可访问性。
实现上述目的的建议措施是:
3.1确保正常生产条件下的数据高可靠性解决方案
规避的风险范围:
硬盘坏、磁盘阵列中的部分元器件坏、存取通道坏。
解决方案:
配置技术成熟度好,市场占有率高的企业级存储系统。
配置全硬件冗余的磁盘阵列。
冗余数据通道和接口。
对无冗余阵列配置信息记录的阵列做好配置信息备份。
采用RAID1、1+0、5等磁盘冗余技术。
3.2灾难情况发生时的数据高可靠性解决方案(可以是今后实施)
规避风险范围:
火灾、地震、恐怖袭击等造成的机房设备被毁等。
解决方案:
系统容灾。
其中数据异地实时复制容灾应是电力系统数据中心数据高可靠性解决方案的重点考虑方案。
3.3磁带备份方案
即使采用了其他各种数据高可靠性解决方案,保持适当的数据冗余备份是必要的。
从前面的分析可知,只有磁带备份,才能规避因人为错误和恶意删改造成系统数据不正确和不完整的风险。
在这类风险发生时,只有这种离线的数据复制品才能将系统恢复到先前的某一正常点。
第四章服务器、存储系统选型论述
作为国家基础设施的电力信息系统工程,其计算机的应用属于关键性的企业级应用。
其系统选型要站在技术与市场的最前沿,从系统建设的必要性、合理性、先进性和可行性方面进行分析和考察,把先进性与实用性很好结合。
4.1系统选型的基本依据
系统选型的基本依据是:
广义的性能价格比。
广义的系统性能是指:
1,系统的有效性:
即系统的运行结果必须正确;
2,系统的处理能力:
即系统的运算能力,系统的在线事务处理能力;包括CPU处理能力、系统延迟、系统带宽、I/O带宽;
3,系统的可用性:
即对系统不停机的要求,包括冗余技术、Cluster技术、系统的异地容灾;
4,系统的可扩充性:
指系统的CPU、内存、I/O、存储等的扩展能力;
5,系统的可维护性:
是指系统对硬件故障的处理和对资源的重新分配能力。
如CPU/MEM、I/O设备的热交换,故障隔离,数据的异地容灾等;
6,系统的安全保密性:
是指数据的授权访问机制和抗恶意破坏和攻击的能力;
7,系统的稳定性;
8,系统的开放性和兼容性:
系统采用开放的标准,支持系统和存储的异构环境,并保证服务的安全性;
9,系统的投资保护性:
指系统的生命周期较长,在一定时期内对新设备、新应用的连续支持。
4.2服务器系统比较
CPU和系统互连能力是衡量SMP系统处理能力和数学运算能力的主要指标。
各厂家SMP系统的特性现状和发展趋势如下表:
最大CPU数
最大内存(GB)
系统互连与系统总带宽
目前的最高主频
及其CPUjob2000指标
目前的市场占有率(关键应用成熟度)
(营收额)
CPU未来发展计划
小型机
HP
α
32
256
交换互连
1.45Ghz
56191(4X1.25G)
8%(unix市场)
无下一步研发计划转向安腾
PA
64
256
交换互连
875Mhz
614358(64X875Mhz)
25%(unix市场)
无下一步研发计划转向安腾
IBM
32
交换互连200GB/s
1.3Ghz
339484(32X1.3Ghz)
23%(unix市场)
有下一步研发计划
Sun
106
584GB
多级交换互连200GB/s
1.2Ghz
602270(72X1.2Ghz)
41%(unix市场)
下一代CPU已研发成功,正研发下下代CPU
PC服务器
8
总线互连(《1GB/s》
8Ghz(32bit)
47039(8X2.2Ghz)
安腾服务器
8
分层总线
1Ghz
63414(4X1Ghz)
从上表可看出,在系统和应用上,IBM、Sun、HP的PA及Alpha是非常成熟的产品和技术。
在CPU方面,安腾给大家更多的想象空间。
未来64位CPU市场将是安腾、SunUltraSPARC、IBMP系列角逐的领地,目前和紧接下来的一段时间内,在高端服务器系统领域和关键应用成熟度上IBM和Sun有明显的优势。
可以预见,在未来的5-10年内,在数据中心的高端计算机应用领域里HP、IBM、Sun将共存。
在这期间,谁能强势出头,有许多不确定因素。
如安腾服务器的SMP系统的研发进步情况,安腾服务器上的应用移植整合优化情况,IBM、Sun及安腾CPU各自的研发进步情况等。
4.3PC服务器小型机服务器(UNIX系统)比较
小型机是RISC指令集的64位系统,相同主频时其CPU的SPEC指标为Wintel的2-4倍(尤其是多CPU,如4CPU以上时)。
下面以Dell和Sun的低端服务器为例比较如下表:
小型机(以Sun为例)
pc服务器(以Dell为例)
型号
SunFireV880
PowerEdge8450
PowerEdge6650
Cpu数
8
8
4
主频
900Mhz
700Mhz(2MBCacheXeon)
(2.0GHzXeonMP)
SPECCFP2000Rates
53.3
9.21
20.2
2,小型机的系统带宽、I/O带宽为微机服务器的10-100倍,决定了小型机更强的SMP能力(如Sun的SunFire15K可达106CPU/SMP);
3,小型机在系统RAS(有效性、可用性、可维护性等)等性能方面有绝对的优势;
4,小型机运行在健壮、稳定、企业级的64位的UNIX系统上,专为多用户、多任务应用设计,至少是C2级安全。
良好的防病毒机制。
小型机(以Sun为例)
pc服务器
CPU特性
体系结构:
RISC
字长:
64bit
体系结构:
CISC
字长:
32bit
SMP能力(Cpu数)
2-106
2-8
Cache/CPU
8MB、16M/CPU
2MB/CPU(Xenon)
最大内存
8GB/576GB
1-4GB
系统带宽
9.6GB/s/CPU
<1GB/s/cpu
I/O带宽
2.4GB/s
<200MB/s
最大系统总带宽
21.6-200GB/s
SPECCFP2000Rates
16.8(2X900Mhz)
6.16(2X1000Mhz)
OS
专为多用户、多任务、企业级应用设计,复杂应用下仍能保持稳定、高效
在单用户、单任务的基础上不断改进来实现多任务,复杂任务下资源调度、管理差,不稳定
安全
基于角色的安全管理机制,至少C2级安全
OS源代码开放
源代码开放、二进制兼容
源代码不开放
RAS
高
低
病毒防御
Os安全监督高,基于角色的安全管理机制。
病毒难发作,难传染
眉山生产中心和成都管理中心的数据库服务器对四川启明星铝业来说是至关重要的关键设备,无论是出于上述理由还是基于实用性、稳定性、安全性、可靠性、开放性、高性能性、可扩充性的观点,选择小型机UNIX系统是唯一的。
对于应用服务器可选择PC服务器。
4.4目前各厂家小型机主流产品特性比较
衡量系统性能的指标有许多,下面以Spec、tpc指标加以比较。
其中SPECfp_rate2000衡量系统的数学运算能力有较好的代表意义。
以下资料均来自各厂家的公开站点及spec、tpc站点
有关术语:
SPECinit_2000:
单CPU计算机系统执行以整数运算为主应用软件的性能指标;
SPECfp_2000:
单CPU计算机系统执行以浮点运算为主应用软件的性能指标;
SPECinit_rate2000:
多CPU计算机系统执行以整数运算为主应用软件的性能指标;
SPECfp_rate2000:
多CPU计算机系统执行以浮点运算为主应用软件的性能指标。
部门级(低端)服务器
SunFire280/480/880
COMPAQDS20L
IBM640/620(F85)
HPrp5470
Cpu数
2/4/8
2
1,2/2,4,6
1-4
CPU主频
750、900Mhz
667,833、
450,750/450,600,668Mhz
650、750Mhz
Cache/CPU
8MB/CPU
8MB/CPU
4/8MB
1.5-2.25MB(L1)
最大内存
8GB/32GB/32GB
4GB
16GB/64GB(750Mhz)
16GB
系统带宽
2.4GB/s/CPU
1.8GB/s/cpu
2.4GB/s
I/O带宽
2.4GB/s
532MB/s
1GB/s
2.1GB/s
系统总带宽
12/21.6/21.6GB/s
PCI槽数
4/6/9pci
5pci
5pci
5pci/10pci
TPC-C(推算)
21114(2X900Mhz)
186237(2X833Mhz)
19115(2X668Mhz)
17530(2X750Mhz)
SPECint2000
529/531/507(1X900Mhz)
571(1X833MhzCpu)
410(750Mhz)/433(750Mhz)
549(750Mhz)
SPECint2000Rates
11.9(2X900Mhz)/
24.1(4X900Mhz)/
47.6(8X900Mhz)
13.1
(2X833MhhzCpu)
7.7(2X450Mhz)/
20.5(4X750Mhz)
24.5(4X750Mhz)
SPECCFP2000
700/727/697(1X900Mhz
cpucu)
784(1X833Mhzcpu)
433(450Mhz)/
410(750Mhz)
522(750Mhz)
SPECCFP2000Rates
14.3(2X900Mhz)/
29.9(4X900Mhz)/
53.3(8X900Mhz)
15.9(2X833Mhz)
14.1(4*450Mhz)/
15.6(4*750Mhz)
18.7(4*650Mhz)
企业级(中档)服务器SunFire4800、IBMM85、HPrp7140特性比较
SunFire3800/4800
IBMM85
HPrp7410
Cpu数
2-12
500Mhz:
2、4
750Mhz:
2、4、6、8
2-8
CPU主频
900,1050,1200Mhz
500、750Mhz
650、750、875Mhz
设计CPU最高主频
1.5Ghz
750Mhz
875Mhz
Cache/CPU
8MB/CPU
4MB(500Mhz)
8Mhz(750Mhz)
1.5MB(L1)
最大内存
96GB
32GB(500Mhz)
64GB(750Mhz)
32GB
最大I/O带宽
2X2.4GB/s
4X1GB/s
未公布
系统总带宽
33.6GB/s
23.2GB/s
16GB/s
最大PCI槽数
2X8PCI
4X14pci
16pci
TPC-C(Oracle8i)
>120128(保守估算值)(12X900Mhz)
66750
SPECint2000
>507
(SunFireV8801X900Mhz)
458((750Mhz)
SPECint2000Rates
>47.6
(SunFireV8808X900Mhz)
38.5(8X750Mhz)
42.6(8X750Mhz)
SPECCFP2000
>697
(SunFireV8801X900Mhz)
376(750Mhz)
524(750Mhz)
SPECCFP2000Rates
>53.3
(SunFireV8808X9000Mhz)
30
(8*750Mhz)
36.8
(8*750Mhz)
SpecWEB99
>2503(参考值)
(Zeus4.0SunFire280R2X900Mhz)
2500
(Zeus4.02X750Mhz)
2507(参考值)
(zeus4.0rp5470,2X750Mhz)
SUN、IBM、HP中高档服务器的其它参数比较
Sun
IBM
HP
说明
Cpu是否采用
铜技术
900Mhz以上是
铜芯片
CPU是否支持混速度
是
否
是
影响投资保护
时钟、系统互连是否冗余(主版)
是
否
否
影响RAS
是否支持硬件分区
是
是
是
影响RAS
是否支持CPU/memory热交换
是
否
是
是否支持故障硬件在线隔离
支持(很成熟、5年历史)
支持
支持
影响RAS
是否支持I/O设备的热交换
支持(很成熟、5年历史)
支持
支持(比SUN晚4年)
影响RAS
是否支持OS热升级与热补丁
是
否
否
影响RAS
根据以上比较和论述,结合行业特点数据库服务器可选择Sun、HP的小型机服务器。
4.5数据存储系统选型
数据存储技术类型可分为内部存储、直接连接(DAS)、网络连接存储(NAS)、存储局域网(SAN)存储。
根据该系统的应用和数据存储特点,数据存储采用直接连接(DAS)的光纤磁盘阵列。
4.6双机软件选择
根据IDC的2002年统计,数据管理市场的份额如下图所示。
市场份额是一个产品的技术成熟度、性能价格比等因素的综合反映。
我们推荐专业存储软厂家Veritas的双机软件。
该双机软件支持数据库在各群集节点间负载均衡。
2001年数据管理市场份额
VERITAS
40.8%
IBM20.8%
Legato
8.3%
CA7.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 用户 计算机系统 选型 参考