中国有句俗话叫“又想马儿跑得快,又想马儿不吃草”,这一不近人情的悖论,在高性能计算领域正在被打破。在要求服务器越来越快处理海量数据的前提下,人们对高性能计算系统单位面积的功耗、造价,系统的自动化、人性化及系统总体拥有成本等全方位的要求越来越苛刻。
曙光TC2600刀片服务器是专为突破计算机系统规模增加与效能增加不成比例的难题而开发设计的第三代双核/四核刀片服务器产品,采用了世界领先的服务器设计理念,是集高性能、低能耗、高密度、高稳定性、高可管理性“五项全能”于一体的新一代刀片服务器产品。在实现了由“高性能”向“高效能”跨越之后,曙光TC2600刀片服务器把用户对海量动算“跑得快、吃得少”的期望变为现实。
高性能
出色的性能是衡量高性能计算机产品的首要指标,高性能不仅仅是指服务器产品拥有高的计算能力,更要求服务器产品具有很高的系统整体性能,曙光TC2600刀片服务器通过采用整体优化的设计策略,不仅可为用户提供更加卓越的计算处理性能,更可显著提高服务器产品的整体应用性能。
首先,作为高性能计算机的核心,处理器对于服务器性能的提高具有至关重要的作用,直接关系到高性能计算机以及以此为基础的超级计算机机群的数据处理速度,而数据处理速度是衡量高性能计算机性能的一个重要指标。曙光TC2600的每个刀片包含了两颗AMD Opteron2000系列双核/四核高性能处理器,AMD Opteron处理器提供集成的内存控制器,并使用超传输总线和直连架构,可以提高许多应用程序的运行效率,并且TC2600刀片服务器内部的两颗处理器采用连接南北桥的创新架构设计,增加了HT总线数量,大幅度提高了服务器的整体性能。
其次,在高性能计算中,高性能计算机需要不间断地与外界进行大规模的数据交换,这对于服务器系统的I/O交换是一个极大的挑战,曙光TC2600刀片服务器采用了高效的IB高速交换模块,该交换模块采用第三代Infiniband Switch 芯片,提供高达800Gb/s的交换带宽;具有高带宽、低延迟、全互联特性的Infiniband交换模块可提供10个传输速率为20Gb/s外联端口,支持铜缆和光纤接头的转换,可轻松应对大规模计算过程中的海量数据交换。
再次,服务器产品往往面临着I/O扩展能力的挑战,刀片服务器产品在需要扩展的时候,往往借助于主板子卡的扩展形式,这种做法的弊端是只能进行单一功能的扩展,而曙光TC2600拥有创新性的I/O扩展模块,打破了刀片服务器I/O扩展方式的限制。TC2600为每个刀片独立配置了PCI-E扩展插槽,能够兼容网卡、FC HBA、iSCSI HBA、Infiniband HCA等业界绝大部分PCI-E板卡,为系统的I/O扩展提供了更为灵活的选择,从而为曙光TC2600刀片服务器提供了强大的I/O性能。
低能耗
刀片服务器面临的一个很大的问题是散热,由于散热问题所导致的高能耗成为高密度服务器发展的一个瓶颈。而曙光TC2600刀片服务器所拥有的另一大突出特点是节能,该特点是由曙光TC2600刀片服务器创新的结构设计所决定的。
首先,TC2600刀片服务器的散热技术采用了曙光最新研发的线形预补偿散热模块LPCM,它能够根据温度变化,线性平滑调整风扇转速,减弱噪音;同时还可以通过预测下一阶段温度变化的趋势,提前进行转速调整补偿,保证风扇转速平稳和噪音平稳,从而有效降低高性能计算机工作过程中由于散热和噪音问题所引起的不必要的功耗。
其次,曙光TC2600刀片服务器采用了自动智能调节电源模块SRPM,它可以通过用户选择手动优化和自动智能调节两种工作模式,能够做到根据功耗变化,自动调节电源系统的管理策略,始终保持电源模块工作在效率曲线的高点,减少不必要的功耗损失,并可大幅增加电源的使用寿命,从而有效降低用户的使用和维护成本。
通过创新的设计,曙光TC2600刀片服务器的系统整体能耗有了大幅度的降低,真正做到了由“高性能”向“高效能”的转变。
高密度
刀片服务器最大的特点是高密度的机箱设计,先进合理的机箱构造是衡量刀片服务器性能的重要指标。曙光TC2600刀片服务器的机箱采用7U10片刀的超高密机构设计,在7U的机架空间内可提供 10 个刀片托架,最多支持20颗双核/四核64位高性能处理器、160GB DDR2内存和2.94TB的内部存储容量,使整个机箱增加了42.8%的计算密度,可以最大限度地提升数据中心和高性能计算中心的处理能力;同时,曙光TC2600刀片服务器内置冗余高速I/O链路,应用最新的高速I/O技术,成倍增加I/O带宽、减少I/O延迟;每刀片提供42Gbit/s的I/O带宽,每机箱总计高达420Gbit/s的累计I/O吞吐量;此外,曙光TC2600刀片服务器集成并融合了计算系统、存储系统、网络系统、电源系统、散热系统、监控管理系统、KVM等模块于一身,采用全模块化的设计方式,可以节省86%以上的电缆,从而大大节省高性能计算机安装部署的时间和电缆的成本,并且能够通过管理模块的自动优化调节,能够达到最佳的运行状态,发挥最优的整体性能。


