2009年:英特尔与AMD服务器市场对对碰
为很值得期待,但我们也没有忘记在x86服务器CPU市场中,并不是英特尔的独角戏,它顽强的竞争对手AMD仍然在这个市场中拥有着自己可观的支持者。而在2008年里,AMD推出了其第一代45nm处理器“上海”(Shanghai),虽然仍然属于第三代Opteron(晧龙)家族,但也有很多细微的变化,这无疑将使得2009年的服务器市场越发精彩。那么我们就来看看在新的一年中,英特尔与AMD将呈现出怎样的竞争态势。
AMD新军“上海”:神秘与困惑并行
在2008年的11月13日,AMD正式推出了其首款45nm Opteron处理器,但并没有以第四代Opteron自居,从中可以看出它与第三代Opteron仍然是一家人,也就预示着其在内部结构上并没有质的变化,而更多的是一种“量变”式的增强。不过,在AMD的介绍中,笔者倒是觉得有些困惑,也让这款处理器显得有些神秘。
首先,我们知道AMD引以为荣的点对点处理器互联架构是其一大法宝,这个架构的基础就是AMD主导开发的开放式点对点总线技术HyperTransport,简称HT。从早前的第三代65nm Opteron(即Barcelona,巴塞罗那)的介绍中,我们可以看出它就已经采用了3条HT总线的设计,而在这一点在“上海”身上并没有变化,可是在一些规格上却有了不同
在Barcelona的设计中,双路的2xxx中3条HT总线中有一条负责与另外的CPU互联,另外两条负责I/O处理,8xxx的3条HT都可用于CPU的互联,每条HT总线的总位宽是16bit。根据AMD的计划,将会全面推行HT 3.0标准,那么以现有的规格计算,采用2GHz时钟的HT 3.0在16bit总位宽下的带宽正好是8GB/s,三条共24GB/s,与其宣传相符。也就是说,Barcelona用于CPU间互联的带宽为8GB/s,可是在Shanghai的新特性介绍中,我们看到的数值却远高于此AMD给出的Shanghai新特性介绍,包括了45nm工艺带来的好处(比如更高的主频,更节能)、可支持DDR2-800(Barcelona只支持到DDR2-667)、可以更节能的智能预取、增强的快速虚拟化索引(RVI)以及更高的CPU间互联带宽,上图标注的17.6GB/s明显高于Barcelona的8GB/s
这点让笔者有些琢磨不透,而在上海的发布会上,我们也确定了其并没有在HT频率上做什么明显的手脚,仍然在HT 3.0的范围内。那么我们的疑问来了,在4.4GTs的传输率下,如何达到17.6GB/s的总带宽呢?显然位宽是32bit,可Barcelona的设计是3条各16bit的HT总线,每条最高8GB/s的带宽。如果Shanghai是在Barcelona的基础上改进而来,那么在总体的架构上就不可能很大的变动,但CPU间互联带宽提升如此之大,我们也就有足够的理由怀疑了。对此,笔者分析有两种可能:
1、AMD的介绍有些误导,17.6GB/s是指CPU的I/O总带宽而不是CPU间互联的带宽,如果这么考虑,那一切也就顺理成章了(两条HT总线,总位宽32bit,传统率为4.4GTs)。
2、Shanghai将两条HT用在CPU间的互联,只有一HT用在了I/O。
如果细分析,我认为,第二种可能性很小,因为Shanghai还有4路/8路的设计,但HT总共就3条,若是用两条HT来联接CPU显然是不合理的,所以笔者最终断定Shanghai的CPU互联带宽现在仍然是8GB/s,到2009年第二季度全面升级后将提升至8.8GB/s。
对比英特尔的Nehalem架构,我们就能看出来Opteron原先的HT优势在2009年面对前者的QPI总线(Nehalem-EP的CPU间互联与I/O带宽均为25.6GB/s)时以处于下风,这主要体现在传输位宽小,传输频率低。当然,HT也是在进步的,在2008年7月23日,HT组织发布了最新的HT 3.1标准,从中可以看出至于在频率上与QPI已经相当了,可是Opteron
特性比较 | HT 1.0 | HT 2.0 | HT 3.0 | HT 3.1 |
最大时钟频率 | 800Mhz | 1.4Ghz | 2.6Ghz | 3.2Ghz |
最大传输速率 | 1.6GT/s | 2.8GT/s | 5.2GT/s | 6.4GT/s |
最大总线带宽(每项32位,双向合计) | 12.8GB/s | 22.4GB/s | 41.6GB/s | 51.2GB/s |
AC操作 | NO | NO | Yes | Yes |
通过AD/DC自动检测与配置进行电容遇合 | ||||
链路分割(非固定连接) | NO | NO | Yes | Yes |
每个HT链路可分割为两个1/2位宽的链路 | ||||
热插拔 | No | No | Yes | Yes |
动态链路时钟/带宽调整 | No | No | Yes | Yes |
DirectPacket数据流 | 仅1.1 | Yes | Yes | Yes |
可增加16个虚拟通道(总共22个),支持对等网络联接,本地封包处理 | ||||
PCI Express影射 | No | Yes | Yes | Yes |
其次,另一个让比较迷惑的一点就是仍然采用DDR2内存,这在当前大谈绿色节能的背景下,显得有些不可思议。DDR2的接班人DDR3在节能方面有着更好的表现(工作电压降低了0.3V,理论能耗降低了16.7%),而且传输频率比DDR2要高出近一倍。如果说DDR3因为成本的原因不会在台式机市场过快的普及,但对于更注重能耗的移动和服务器市场,DDR3理应更受关注(当初DDR2内存也是率先在这两个市场普及的)。也许Shanghai是为了最大限度与现有市场兼容,历史上AMD也向来是稳扎稳打的,勇于挑起产业变化的是其竞争对手英特尔(如Rambus DRAM和FB-DIMM的采用,此次DDR3也走在了前面)。但我们可以注意到,在HT总线上,虽然AMD宣称Shanghai可以向下兼容,可是如果要想达到最佳的效果,还是必须要有新的支持4.4GTs的平台,那么为什么不能勇敢的采用DDR3呢?按照AMD的路线图,到2010年才会转向DDR3平台,我甚至有些怀疑是不是AMD在技术开发能力上出现了什么问题?
总之,AMD长期以来最值得骄傲的两大优势——点对点传输总线与集成内存控制器,在Shanghai这一代将不复存在,反而将要开始追赶后来居上的对手,这的确让笔者有些感叹。
因此不得不说,Shanghai的发布在笔者的眼中有些神秘和困惑。当然相对于Barcelona的进步肯定是有的,主频与内存带宽的提升无疑对性能有直接的帮助,只是如果自己进步的步伐不如手快的话,那么就要相当小心了。