intel NehalemEP处理器首发深度评测 第四部分.docx
- 文档编号:11345716
- 上传时间:2023-02-28
- 格式:DOCX
- 页数:34
- 大小:2MB
intel NehalemEP处理器首发深度评测 第四部分.docx
《intel NehalemEP处理器首发深度评测 第四部分.docx》由会员分享,可在线阅读,更多相关《intel NehalemEP处理器首发深度评测 第四部分.docx(34页珍藏版)》请在冰豆网上搜索。
intelNehalemEP处理器首发深度评测第四部分
intelNehalem-EP处理器首发深度评测第四部分
两个大方形铝散热器下方就是Nehalem-EP处理器
Nehalem-EPXeonX5570
型号为XeonX5570,是目前Nehalem-EP种规格最高的处理器型号,频率达到了2.93GHz,比它高的W5580(3.20GHz)属于Nehalem-WS2S系列,不属于Nehalem-EP系列。
Nehalem-EP/GainestownXeonX5570处理器,主频2.93GHz。
QPI总线频率3.2GHz,传输速率是6.4GT/s
主板正中央的扁平铝散热器下方就是Tylersburg-EP芯片
IntelTylersburg-EP芯片组实物
这个IntelTYlersburg-EP芯片型号为Intel5520,属于Tylersburg-36D系列,提供了36条PCIExpress信道,其结构如下:
Intel5520/Tylersburg-36D结构图
Intel5520/Tylersburg-36D结构图
Intel提供的测试样机实际型号上由华硕生产,型号为RS700-E4
这是一台1U高度的机架式Nehalem-EP服务器,个头虽小,动力却是非常澎湃
4个3.5英寸热插拔SAS硬盘槽,一个超薄DVDRWMulti光驱
两个前置USB端口。
这是一个很具华硕风格的前面板……
IntelNehalem-EP官方评测样机,配置了双路XeonX5570处理器和24GBDDR3内存
后面板比较特别的地方是具有三个RJ-45端口——除了两个千兆以太网端口之外,另外一个是100Mbps的远程IPMI管理端口
这台测试样机支持冗余电源配置,从这个电源的个头和重量来看,功率不低
著名厂商台达出品,最大总功率770W,+12V输出电流62.5A,输出功率737.5W(主要输出功率都在+12V这里了)
数一数,共7个热插拔冗余风扇,个头很小——声音很吵
主板是华硕的Z8PS-D12-1U,两个大方形铝散热器下方就是Nehalem-EP处理器
Nehalem-EP:
XeonX5570,主频2.93GHz,QPI频率3.2GHz
Nehalem-EP集成了内存控制器,因此内存插槽分布在处理器两旁。
Nehalem-EPXeonX5570处理器支持三通道DDR3-1333
自然,官方评测样机搭配的也就是DDR3-1333(小把戏:
写成PC3-10600的10600代表的是传输带宽),共6条,合六个内存通道。
规格为R-ECC。
Nehalem-EP也能支持普通的不带R也不带ECC的内存,这样的胃口适应度就比其上一代好多了
官方评测样机板载了两个IntelG82574L千兆网络芯片,这是一种成熟的千兆网络解决方案
这个RealtekRTL8201N提供的百兆网络实际上是用来提供远程管理界面的
ASPEEDAST2050是支持IPMI2.0的iKVM模块芯片,集成200MHz的ARM926EJ处理器和32KBL1缓存(16K+16K),其下方的Qimonda芯片是其运行内存
由于是1U高度,因此半高的LowProfile外形的插卡都无法使用——需要用到RISER组件才行
这就是那个RISER组件,评测样机提供并且最多支持两个全高度的PCIExpressx16插槽——不过仅支持单插槽宽度,或许想用1U服务器用作工作站的用户可以插两块单槽的显卡来CrossFire或者SLI……
主板上还有几个特别的插槽,看起来很像PCIExpress插槽
他们使用类似这样的桥
连接的是这样的一块卡,这块卡连接的是磁盘背板,不过这块卡上面没什么线路,因此磁盘控制器实际上是在主板上面
使用了两个Seagate的3.5英寸硬盘
认真一看,原来是Barracuda7200.11320GBSATA硬盘。
对于服务器应用来说,性能一般
在2005年度服务器横评之后,我们认为当时的网络实验室无法满足今后继续发展的服务器测试的需要。
所以,2006年我们IT168评测中心又斥资几十万对于IT168网络实验室的服务器测试平台进行了大幅度的升级,为思科Catalyst4500千兆交换机(WS-X4013+SupervisorEngineII-Plus和WS-X4548-GB-RJ45)增加了一个思科全千兆24口模块WS-X4424-GB-RJ45,可同时连接72个千兆铜缆设备和2个光缆设备。
另外,我们还购置了29台DellPowerEdgeSC430塔式服务器和原来的32台主流配置PC一起为服务器测试平台的提供负载。
2007年,我们又采购性能更强的部分客户端,来确保为新一代的服务器提供足够的测试负载。
2009年初,我们又对所有客户端的内存子系统进行了全面的升级。
Catalyst4500千兆交换机
部分DellPowerEdgeSC430服务器
在新的测试环境下,我们进一步完善了服务器性能测试方案:
SPECCPU2006v1.0.1
SPEC是标准性能评估公司(StandardPerformanceEvaluationCorporation)的简称。
SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPECCPU2006是SPEC组织推出的CPU子系统评估软件最新版,我们之前使用的是SPECCPU2000。
和上一个版本一样,SPECCPU2006包括了CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能,SPECCPU2006中对SPECCPU2000中的一些测试进行了升级,并抛弃/加入了一些测试,因此两个版本测试得分并没有可比较性。
SPECCPU测试中,测试系统的处理器、内存子系统和使用到的编译器(SPECCPU提供的是源代码,并且允许测试用户进行一定的编译优化)都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPECCPU2006的影响非常的小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。
SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
我们在被测服务器中安装了当前最新版本的IntelC++10.1.025Compiler、IntelFortran10.1.025Compiler这两款SPEC CPU2006必需的编译器,通过最新出现的QxS编译参数,IntelCompiler10版本开始支持对IntelSSE4指令集进行优化(假如只支持SSE3,则使用QxT编译参数)。
我们另外安装了MicrosoftVisualStudio2003SP1提供必要的库文件。
按照SPEC的要求我们根据自己的情况编辑了新的Config文件,使用了较多的编译选项。
我们根据被测系统选择实际可同时处理的线程数量,最后得到SPECratebase测试结果(基于base标准编译,SPECbaserate测试代表系统同时处理多个任务的能力)。
和其它测试部件不同,SPECCPU2006需要大量的系统物理内存,我们的SPEC测试在64bitWindowsServer2008Enterprise下完成,对于每个运算核心,配置1.5GB内存。
Iometer2006.7.27
Iometer是一款功能非常强大的IO测试软件,它除了可以在本机运行测试本机的IO(磁盘)性能之外,还提供了模拟网络应用的能力。
在这次的测试中,我们仅仅让它在本机运行测试服务器的磁盘性能。
为了全面测试被测服务器的IO性能,我们分别选择了不同的测试脚本。
Max_throughput(read):
文件尺寸为64KB,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取吞吐量
Max_IO(read):
文件尺寸为512B,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取操作IO处理能力
Max_throughput(write):
文件尺寸为64KB,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入吞吐量
Max_IO(write):
文件尺寸为512B,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入操作IO处理能力
SiSoftwareSandra v2009
SiSoftwareSandra是一款可运行在32bit和64bitWindows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。
从2007开始,Sandra的Arithmeticbenchmarks增加了对SSE3&SSE4SSE4的支持,在Multi-Mediabenchmark中增加了对于SSE4的支持,另外还升级了FileSystembenchmark和RemovableStoragebenchmark两个子项目。
对于新的硬件的支持当然也是该软件每次升级的重要内容之一。
SiSoftwareSandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台,这也是我们选择这款软件的原因之一。
NetBenchv7.03
NetBench是针对文件服务器的性能测试软件,影响NetBench性能的主要是服务器的磁盘子系统,服务器磁盘控制器、条带大小、读写缓存、硬盘类型、组建磁盘阵列模式、内存容量、网络拓朴结构等都会对测试结果有明显的影响。
我们在被测服务器上设立了文件服务器,NetBench通过网络实验室中60个客户端来模拟网络中的PC向文件服务器所发出的文件传输请求,文件服务器则将存储在磁盘上的文件数据发送给相应的客户端。
在测试过程中,客户端会以每四台一组的步进依次增加并且向服务器发送文件传输请求,测试结束后控制台收集数据并绘制出服务器的数据传输变化曲线。
BenchmarkFactory4.6
大部分的服务器应用都同数据库有着密切的联系,因此我们今年开始着手在在服务器测试中加入对于数据库性能的测试。
我们选择了BenchmarkFactory4.6软件和MicrosoftSQL2005SP3来测试不同的硬件平台在数据库应用中的表现。
我们选择了BenchmarkFactory内置的标准测试脚本AS3AP,这项测试可用于对于ANSI结构化查询语言(SQL)关系型数据库进行测试,它可用于测试DBMS(单用户微机数据库管理系统),也可用于测试高性能并行或者分布式数据库。
CineBenchR10
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,在服务器测试平台中显示子系统不重要,因此就只有前两个的成绩具有意义。
和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
ScienceMark2.0
ScienceMark2.0可以用来评估测试对象在执行科学计算时的运算效能,这部分效能主要和处理器子系统和内存子系统相关。
我们主要用来评估测试对象的内存子系统的性能。
系统功耗监测
我们使用UNI-TUT71E智能数字万用表对于被测服务器系统的整体功耗进行了监测,利用随机附带的接口程序,我们可以记录被测服务器任意时间段内的功率变化。
本次Nehalem-EP评测基于一台曙光的服务器,配置的是双路Nehalem-EPXeonE5540处理器,测试结果并会与我们IT168评测中心的DELLPowerEdge2900III服务器进行对比,测试对比平台的详细参数如下:
测试平台、测试环境
测试分组
类别
IntelNehalem-EP官方送测样机
华硕RS700-E4服务器
双路IntelGainestown
XeonX5570
DawningA650服务器双路AMDShanghaiOperton2378
双路XeonE5430基准平台
DELLPE2900III服务器
处理器子系统
处理器
双路IntelXeonX5570
双路AMDOperton2378
双路IntelXeonE5430
处理器架构
Intel45nmNehalem
AMD45nmShanghai
Intel45nmPenryn
处理器代号
Gainestown
Shanghai
Harpertown
处理器封装
Socket1366LGA
SocketF1207
Socke771LGA
处理器规格
四核
四核
四核
处理器指令集
MMX,SSE,SSE2,SSE3,SSSE3,
SSE4.1,SSE4.2,EM64T,VT
MMX,3DNow!
SSE,SSE2,SSE3,SSE4A,
AMD-64,AMD-V
MMX,SSE,SSE2,SSE3,SSSE3,
SSE4.1,EM64T,VT
主频
2.93GHz
2.40GHz
2.66GHz
处理器外部总线
2xQPI
3200MHz
6.40GT/s
单向12.8GB/s(每QPI)
双向25.6GB/s(每QPI)
2xHT
1000MHz
2.00GT/s
单向4.0GB/s(每HT)
双向8.0GB/s(每HT)
FSB
333MHz
1333MT/s
10.6GB/s
L1D-Cache
4x32KB
8路集合关联
4x64KB
2路集合关联
4x32KB
8路集合关联
L1I-Cache
4x32KB
4路集合关联
4x64KB
2路集合关联
4x32KB
8路集合关联
L2Cache
4x256KB
8路集合关联
4x512KB
16路集合关联
2x6144KB
16路集合关联
L3Cache
8MB
16路集合关联
2MB
32路集合关联
主板
主板型号
ASUSZ8PS-D12-1U
TyanS2932-E
DELLPE2900III
芯片组
IntelTylersburg-EP
IOH:
Intel5520(Tylersburg-36D)
ICH:
Intel82801JR(ICH10R)
NVIDIAnForcePRO3600
MCH:
Intel5000X
ICH:
IntelESB6321
芯片特性
2xQPI
VT-dGen2
1xHT
2xFSB1333
12MBSnoopFilter
VT-dGen1
内存控制器
每CPU集成三通道R-ECCDDR31066
每CPU集成双通道R-ECCDDR2800
北桥集成四通道FBDDDR2667
内存
4GBR-ECCDDR31333SDRAMx6
2GBR-ECCDDR2667SDRAMx4
2GBFBDDDR2667SDRAMx4
系统磁盘子系统
磁盘控制器
LSIEmbeddedMegaRAIDSAS RAID Controller
LSI MegaRAIDSAS RAID Controller
DELLPerc5/iRAIDController
磁盘控制器规格
8xSAS3Gbps
8xSAS3Gbps
8xSAS3Gbps
磁盘控制器设置
RAID0
RAID5
RAID5
磁盘控制器驱动
LSIMegaSR
13.06.0212.2009
LSISAS
3.8.0.64
LSISAS
3.8.0.64
磁盘
Fujitsu
MBA3300RCx2
Fujitsu
MBA3147RCx3
Seagate
Cheetah15K.5
ST314655SSx3
磁盘规格
15000RPM
300GB
SAS3Gbps
16MBCache
15000RPM
147GB
SAS3Gbps
16MBCache
15000RPM
146GB
SAS3Gbps
16MBCache
磁盘设置
SAS3Gbps
50GB系统分区
SAS3Gbps
30GB系统分区
SAS3Gbps
20GB系统分区
网络子系统
网卡
Intel82574GigabitNetworkControllerx2
NVIDIAnForcePro3600integratedMACwithMarvell88E1121PHYGbEControllerx2
BroadcomBCM5708C
PCI-E千兆网卡x2
网卡设置
PCIExpressx1@ICH10R
I/OAT
IntelTeaming
LoadBalancing
ForcewareTeaming
LoadBalancing
PCIExpressx1@ESB6321
BroadcomNICTeaming
LoadBalancing
网卡驱动
IntelPROSet
13.5
NVIDIANIC/LANv67.76.1
BroadcomNetXtreme2
11.04.01
软件环境
操作系统
Microsoft
WindowsServer2008EnterpriseEditionSP1x64
Microsoft
WindowsServer2003R2EnterpriseEditionSP2x64
Microsoft
WindowsServer2008EnterpriseEditionSP1x64
用来对比的45nmShanghaiOpteron2378(左)
Nehalem-EP:
XeonX5570,主频2.93GHz,QPI频率3.2GHz
Nehalem-EP/GainestownXeonX5570处理器,主频2.93GHz。
QPI总线频率3.2GHz,传输速率是6.4GT/s
64KBL1,256KBL2,8MB共享L3
ASUSZ8PS-D12-1U主板,采用Intel5520+ICH10R芯片组,也就是IntelTylersburg芯片组
D12就是具备12个DIMM的意思,1U就是专门为1U机架服务器设计
24GBR-ECCDDR31333内存,NBFrequency是Nehalem-EP处理器Uncore部分的频率(实际上就是L3的频率),而不是Tylersburg芯片组的频率:
这个XeonX5570的Uncore频率(也就是L3频率)是2.67GHz
每条内存4GB,总共6条DDR3-1333内存
SiSoftwareSandra是一款可运行在32bit和64bitWindows操作系统上的分析软件,它可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。
SiSoftwareSandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。
我们利用了其中多个性能测试模块对于被测系统的性能进行了快速的测试。
有一点需要说明的是,Sandra的处理器架构性能测试是根据处理器所能支持的所有指令集中选择进行的,不同的处理器支持的指令集不同,测试使用到的指令集也就不同。
例如,Nehalem在这个测试当中就可以使用SSE4.2,而Penryn就只能使用SSE4.1,而Opteron可能就只能使用SSE3了。
一般而言,由于可以使用SSE4,Intel的处理器理论性能会比较好。
SiSoftwareSandraProBusiness2009
测试对象
IntelNehalem-EP
双路IntelGainestown
XeonX5570
2.93GHz
DawningAS650
双路AMDShanghai
Operton2378
2.40GHz
DELLPE2900III
双路IntelHarptown
XeonE5430
2.66GHz
ProcessorArithmeticBenchmark
处理器架构测试
DhrystoneALU
142977MIPS
63082MIPS
91006MIPS
DhrystoneALUvsSPEED
48.75MIPS/MHz
26.28MIPS/MHz
34.21MIPS/MHz
WhetstoneiSSE3
124035MFLOPS
62993MFLOPS
78385MFLOPS
DhrystoneiSSE3vsSPEED
42.29MFLOPS/MHz
26.25MFLOPS/MHz
29.47MFLOPS/MHz
ProcessorMulti-MediaBenchmark
处理器多媒体测试
Multi-MediaIntx16iSSE4.1
296.85MPixel/s
Multi-MediaIntx8aSSE2
187.70MPixel/s
Multi-MediaIntx8iSSE4.1
199.33MPixel/s
Multi-MediaIntx16iSSE4.1vsSPEED
101.21kPixels/s/MHz
Multi-Media
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- intel NehalemEP处理器首发深度评测 第四部分 NehalemEP 处理器 首发 深度 评测 第四 部分