服务器

  |  手机版

收藏网站

投稿QQ:1745232315

IT专家网,汇聚专业声音 解析IT潮流 IT专家网,汇聚专业声音 解析IT潮流

网络

专家视点在现场环球瞭望
IT专家网 > 服务器

评测:DL385p Gen8实现虚拟化性能跨越

作者:DOIT出处:论坛2013-01-06 08:56

  今年7月,惠普正式发布基于AMD皓龙6200系列处理器的ProLiant Gen8服务器,这不仅延续了惠普与AMD长期的——始自1994年的——全面合作关系,也让惠普ProLiant Gen8成为横跨业界两大最新主流处理器产品的x86服务器产品线。

  惠普此次发布了两款新的ProLiant Gen8服务器,型号分别为HP ProLiant DL385p Gen8和HP ProLiant BL465c Gen8,加上之前ProLiant G7服务器家族中已经从AMD 皓龙6100升级到皓龙6200处理器的部分产品型号,惠普已经成为行业内屈指可数的,拥有一系列多款AMD处理器平台x86服务器的厂商,对于AMD来说,惠普在ProLiant Gen8家族中加入AMD皓龙6200并在ProLiant G7的产品线中升级皓龙6200处理器,当然是对AMD产品的认可。

  虽然x86服务器产品在市场上已经很丰富,从单路入门级服务器到四路、八路机架、刀片服务器应有尽有,但是AMD的皓龙处理器仍然有其独特的市场地位:首先,市场上有不少皓龙6100处理器的企业用户,新的皓龙6200处理器能够让他们基于现有服务器平台升级新的处理器获得服务器性能的大幅度提升,在今年1月份ProLiant G7换装AMD皓龙6200之后,采用AMD皓龙 6200系列处理器的HP ProLiant G7服务器曾拥有全球最高等级的核心密度,每机架使用2048个内核(比传统产品多33%)以支持经常并行发生的高性能计算工作负载,性能较传统产品提高35%。

  其次,皓龙6200处理器是业界收购十六核心x86服务器处理器,拥有业界最高密度核心,这对于不少敏感于多核心、多线程的应用有不小的益处,而且对于按CPU个数购买License的应用来说,皓龙6200处理器更是能够在单颗处理器上提供更好的软件授权经济性。

  在皓龙6200身上,AMD集中了其近几年来研发的不少新处理器技术,比如说AMD智能超频技术和Flex FP技术;AMD-P节能技术套件,如TDP Power Cap和C6 power state(C6深度节能)技术帮助客户最大化数据中心每瓦特性能并能降低电源和散热成本;HyperTransport3.0技术(HT3)拥有出众的核心间连接速度、缓存和支持1600MHz DDR3内存的四内存通道。

  性能提升来自“内功”:皓龙6200架构解析

  AMD皓龙6200处理器采用AMD两年前就已经预览过的新一代处理器架构Bulldozer(推土机)架构,AMD当初开发Bulldozer架构的初衷在于,经调查发现日常的IT应用主要集中于整数运算,而浮点运算相对较少。为了提高多线程处理的性能,AMD设想可不可以用2+1的方式来解决,即两个整数处理核心+1个浮点处理单元,以组成一个新架构的处理单元——Module(模块)。

  由于这种2+1的核心设计,在Bulldozer的架构中,其核心(Core)的概念已经与传统认识有了较大的不同,单一的核心并不是一个具备完整功能的处理单位,所以AMD一直在用Bulldozer Module来表示Bulldozer处理器的处理单元,所以在后文的介绍中,对于Opteron 6200我们也将用模块和核心两个概念表述——在这里,核心是指组成模块中的整数处理单元,它们共享一个弹性浮点处理单元(Flex FP)。

  在Bulldozer架构中,非常值得一提的是由两个整数处理核心共享的Flex FP处理单元与新增加的独家指令集。这一Flex FP由两个128bit FMAC(Fused Multiply–Add Capability,混合乘加)处理单元组成,之所以称为弹性(Flex),是因为这两个单元可以各自独立,为每个整数核心提供独享的128bit浮点处理单元(此时可以认为是两个具备有整数运算+128bit浮点运算单元的处理核心,组成了Bulldozer Module),也可以组合成一个256bit的浮点处理单元为一个模块提供服务,这其实给编程人员提供了很好的弹性,但也预示着对现有的应用需要进一步的优化。

  简单来说,这种两个128bit单元弹性组合的方式,提供了有多种指令处理的模式,比如对于同时执行两个128bit的AVX指令,SandyBridge单一的256bit FP单元就不行了,而Flex FP则可以,同样的,这也适用于SSE指令。所以,AMD强调,除非是256bit的AVX指令环境,否则6200的单周期浮点处理能力是SandyBridge的两倍,显然灵活的可分拆也可组合的Flex FP功不可没。

  而为了发挥Flex FP的强大的威力,AMD也专门开发了两套针对浮点运算的指令集FMA4与XOP,两者可以说都是为高性能计算所服务,但侧重点不太相同,FMA4更有针对性,比如向量和矩阵计算、多项式评估、数据信号处理等,而XOP则针对数学、多媒体应用等。目前,主流的编译器大多已经全部或部分支持AMD的新指令集,因此在发挥Bulldozer的浮点威力方面,还是很让人期待的。

相关文章

关键词:DL385p,Gen8,虚拟化,惠普,AMD

责任编辑:邵海宏

网警备案