|
正文:一、64位平台的争夺战才刚刚打响 曾经传闻Intel会在下一代处理器Pentium
V,也就是Prescott核心中使用AMD X86-64的兼容指令集,关于Prescott的细节,INTEL一直三缄其口,不肯透露风声 ,可以了解的只有它带有SSE3使用1MB的L2缓存,改进过的缓存结构和新的分支预测技术。不过最近从Linux
Business Week中透露出的消息是Prescott会使用和AMD64不兼容的64位扩展指令集,也就是说INTEL会推出自己的X86 64位扩展指令集,这对AMD来说,绝对不是一个好消息。早先,Intel下一代的NetBurst
CPU,内部研发代码是Prescott的核心架构就被证实带有64位扩展,不过Intel也许不会太早把它激活,就好象代号“Jackson”的超线程 (Hyper_Threading)技术一直隐藏在Northwood中一样。Intel会在某个时间激活Prescott和Tejas处理器中的64位扩展,这个时间可能在2005年,当然也要看AMD的64位处理器的销售情况。显然这个X86
64位扩展就是已知的Yamhill技术,现在看来它是不兼容AMD的64位扩展指令集,这和先前的报道不太一样,之前的传闻是Intel会使用兼容AMD X86-64的64位扩展。AMD64已经被使用在Opteron和Athlon
64处理器中,而且微软也推出了Windows XP 64 Bit Edition。 Intel公开表示32位和64位处理器是独立的,针对不同的市场,并且从没有证实过在IA32中加入64位扩展。Intel的Itanium处理器能够模拟X86指令,但是速度很慢。至于64位扩展在桌面PC和入门服务器中的发展,还要看64位软件的发展情况,INTEL对在IA32中使用64位扩展相当慎重。即便是如此,Prescott还是具有和Athlon
64一样的40位物理寻址和48位虚拟寻址,从这点来看Athlon 64的吸引力进一步缩小。Athlon 64的发展情况如何与Intel下一代的处理器息息相关。
2004年中期,AMD推出新的Socket 939,用于Athlon 64 FX处理器,不过我们相信,明年第一季AMD就会把新的Socket设计给他的合作伙伴。Athlon
64 FX-53也会在哪个季度发布,而采用Socket 940设计的Athlon 64 FX也会延续到明年年底。Socket 939和Socket 940并存的处理器包括Athlon
64 FX 53,55和57。AMD此举是为了区分Athlon 64 FX和Opteron的市场定位,防止Athlon 64侵蚀Opteron的服务器市场。
采用Socket 939设计的主板会使用更便宜的四层PCB板设计,相对的Socket 940主板会采用六层PCB板设计。明年的主板会引入PCI Express总线,这也会加入到Socket
939主板中。AMD会继续加大Athlon 64的力度,在圣诞节前会有更多的Opteron处理器和Socket 754的Athlon 64被卖出,Athlon
64的PR值也会提高到达3400+。
| |
Athlon 64 |
Athlon 64 FX |
Opteron 100系列 |
Opteron 200系列 |
Pentium 4 |
Pentium 4 EE |
Xeon MP |
Xeon MP |
| Socket | Socket
754 | Socket
940 | Socket
940 | Socket
940 | Socket
478 | Socket
478 | Socket
604 | Socket
603 | | 核心频率(GHz) | 2.0 | 2.2 | 2.0 | 2.0 | 3.2 | 3.2 | 3.2 | 2.8 |
| 总线带宽(GB/s) | 6.4 | 6.4 | 6.4 | 6.4 | 6.4 | 6.4 | 4.2 | 3.2 |
| L1 Cache 尺寸 | 128KB | 128KB | 128KB | 128KB | 8KB+12K
mOPs | 8KB+12K
mOPs | 8KB+12K
mOPs | 8KB+12K
mOPs | | L2
Cache 尺寸 | 1MB | 1MB | 1MB | 1MB | 512KB | 512KB | 512KB | 512KB |
| l3 Cache 尺寸 | - | - | - | - | - | 2MB | 0-1MB | 1-2MB |
| 多处理器支持 | - | - | - | +(2) | - | - | +(2) | +(4) |
| DDR控制器通道 | 1 | 2 | 2 | 2 | 2 | 2 | 2 | 4 |
| 内存类型 | DDR400 | DDR400
Registered | DDR333
Registered | DDR333
Registered | DDR400 | DDR400 | DDR266
Registered ECC | DDR200
Registreed | 目前AMD和INTEL处理器的对峙情况

CPU的详细参数比较 需要提到是的Pentium 4 Extreme Edition这颗处理器,它的出现感觉就是针对目前的Athlon
64 FX。P4EE实际上同Xeon MP是一样的东西,但它是针对桌面平台的处理器,从Xeon MP的Socket603到桌面平台的Socket478,它使用了先进的800MHz的FSB总线。但是P4
EE不支持SMP(多处理器)系统,实际上也没有Socket478的多处理器主板可用。P4 EE使用普通的(unregistered,no ECC)DDR400
SDRAM,这样可以很容易的使用在普通的Socket478主板上。很难说P4EE的核心有没有重新设计过,也许它只是Xeon MP换了个包装。P4 EE是Athlon
64 FX的劲敌(除了价格……)。 二、AMD64的前世与今生,AMD64包括了Athlon 64;Athlon 64 FX;Opteron 
我们知道Athlon 64的核心与Athlon非常的接近,打个比方说,从K6到Athlon的核心变更比从Athlon到Athlon 64还要大得多。这也说明了Athlon的系列所采用的核心是非常优秀的,Athlon有九个执行单元,三个整数处理单元(算数/逻辑单元,ALUs),三个地址生成单元(AGUs)和三个浮点处理单元。Athlon
64继承了这一点,但是做了64位的扩展,在寄存器上,Athlon 64有了较大的变化,它包括16个64位的整数寄存器,16个128位SSE寄存器,比起Athlon来,Athlon
64增加了八个128位的SSE指令寄存器,另外二级高速缓存的位宽也增加到128位,这样就可以在一个时钟周期内传输128位的SSE数据。原来堆栈式的X87寄存器被保留下来,X87处理器是80位,一共有八个。虽说X86指令只能使用八个整数和八个浮点寄存器,但是通过寄存器重命名技术,增加的寄存器就能够大幅增加指令处理速度,如果运算都能够在寄存器中完成就不需要使用速度相当慢很多的高速缓存。
 AMD64的寄存器结构,注意这是AMD64的架构,Athlon
64在寻址方面有所削减,Athlon 64和Opterons仅仅提供了48位的虚拟寻址和40位的物理寻址,不象INTEL的Itanium,它提供了64位的虚拟寻址和60位的物理寻址。不过这对于近期的应用还是绰绰有余了,AMD的Hammer架构允许提供完全的64位寻址,也许在未来的某个版本会提供。 Athlon
64支持INTEL的SSE2指令集,但是执行效率比起Pentium4差了很多,因此在视频压缩等多媒体处理领域还是Pentium4绝对领先。有趣的是在Windows
XP 64位版本下运行的64位应用程序必须使用SSE2形式的浮点,是不是很神秘,X87浮点已经不能动行在原生的64位Windows下。AMD使用INTEL的SSE2指令集,INTEL使用AMD的X86-64指令集,这样取长补短也很好:) Athlon
64在每个时钟周期解码三个X86指令并把它分派为9个ROPs(微代码),ROP被发送到9个执行单元,大多数ROPs都可以直接执行,有少数还需要经过转换,把CISC指令翻译成微代码的效率关系到处理器的执行速度。Athlon
64的管线长度为12级,比Athlon的10级增加了一些,这个增加的两级管线可以帮助Athlon 64提高频率,如果流水线预测失败后造成的损失也更大。比起Northwood的20
stage pipeline,Athlon 64是无论如何也赶不上Pentium 4的工作频率。现在发售的Athlon 64 3200+工作频率是2GHz,Athlon
64 FX-51的工作频率是2.2GHz。Athlon 64仍然采用PR性能指标,把Pentium4做为性能参考。Athlon 64 FX采用了新的性能标识,如FX-51。 Athlon
64最大的优势莫过于引入了X86-64指令集,它可以平滑的从32位过渡到64位环境。支持AMD64的操作系统包括Linux、FreeBSD还有Windows
XP 64Bit Edition,我安装了Windows XP for AMD64的测试版,感觉还是很不错的,正式版会在明年第一季度推出。不过在64位环境下运行现有的32位软件,往往性能都会有所降低,只有采用X86-64指令的软件才会获得大幅的性能提升,我们测试了一款采用X86-64指令的压缩软件,性能提升了二倍多,发挥了64位指令的优势。由于和Athlon
64结构的相似性,因此在目前32位平台上性能并不会有质的飞跃。 第二个优势是把内存控制器加入CPU内部,这样一方面可以把芯片组对系统性能的影响减小,另一方面可以大幅减小内存的延迟,这在测试中表现的非常明显。由此一来,CPU对芯片组的依赖性减小,不至于象Athlon那样被芯片组拖后腿。但这样做也有很大的弊病,在每次内存规格提升的时候,都要重新修改CPU,例如明年DDR2上市后,AMD必须重新修改内存控制器才能支持,周期肯定会长一些。这样对内存的要求也高了,Athlon
64 FX需要使用双通道的Registered内存,成本高昂。 第三个优势是采用HyperTransport代替的来的EV6前端总线,Athlon就一直受到EV6总线的限制,因此前端总线一直比INTEL要慢,这对性能影响极大。Athlon
64把内存控制器加入CPU核心,淡化了前端总线的概念。和芯片组连接采用了最高带宽可以达到6.4GB/s的HyperTransport总线。HyperTransport总线具有动态平衡技术,HyperTransport使用了自己的低电压差分信号技术(LVDS)架构,这样只需更低的管脚电压,有利于提高抗干扰性。而HyperTransport使用了1.2V的信号电压,这比一般的LVDS
2.5V的信号电压要低很多,再加上内存映射结构,HyperTransport几乎能实现消息的即时传输。 有了这三大优势,再加上芯片组厂商的鼎立支持,Athlon
64的前途很美好。 Athlon 64 
研发代号ClawHammer的Athlon
64,封装是Socket 754,Family:F;Model:4;Stepping为8。它支持的指令集包括MMX(+);3DNow(+);SSE;SSE2;X86-64,比Athlon增加了SSE2和X86-64指令集,不地Athlon
64的SSE2指令执行效率有些差强人意。Athlon 64 3200+ FSB频率是200MHz(图中显示的202MHz,是由于主板超频的缘故),10倍频,工作频率是2GHz。 
L1
Data Cache采用二路互联,64字节线宽,L1 Instructions Cache也是二路互联,64字节线宽。比较起来,Pentium4的L1 Data
Cache采用了四路互联,64字节线宽。Athlon 64的L2 Cache大小是1024KB,16路互联,64字节线宽,全速工作。它的总线宽度是128位,具有预取(Prefetch)逻辑。Pentium
4的L2 Cache采用了8路互联,线宽是64字节,但是它的总线宽度有256位 Athlon 64 FX 
代号SledgeHammer的Athlon
64 FX-51,Brand ID:9;它采用Socket 940封装,我们注意到Athlon 64 FX的Model为5,这点和Athlon 64的Model
4不一样。支持的指令集是一样的,FSB频率为200MHz,11倍频,主频是2.2GHz。  Athlon
64 FX的缓存结构完全和Athlon 64一样 三、性能测试 测试平台
| CPU | Athlon 64 3200+ Athlon 64 FX-51
Pentium 4 3.2GHz Hyper-Threading | | 主板 | 华硕KV8
Deluxe 硕泰克 SL-K8AV2-RL 技嘉 K8NNXP 硕泰克SL-K8AN-RL 华硕SK8N INTEL
D875PBZ | | 内存 | ADATA DDR400
256MB×2/Registered DDR400 512MB×2 | | 硬盘 | 西捷酷鱼四
40G | | 显卡 | 七彩虹 Radeon 9700 Pro
| | 操作系统 | 英文Windows XP Professional
+ SP1 英文Windows XP for AMD64 Build1033 | | 驱动 | DirectX
9,Catalyst 3.8 | | 桌面设置 | 1024×768像素
32bit色彩 85Hz刷新率 | Athlon 64 3200+的工作频率是2GHz,Athlon
64 FX-51的工作频率是2.2GHz,INTEL P4打开了Hyper-threading 评测主板的主要特征
| | 处理器接口 | 芯片组 | 总线时钟频率 | 支持内存 |
| 华硕KV8 Deluxe | Socket
754 | K8T800 | 200.3
MHz | 单通道unbuffer DDR400 |
| 硕泰克 SL-K8AV2-RL | Socket
754 | K8T800 | 201.4
MHz | 单通道unbuffer DDR400 |
| 技嘉 K8NNXP | Socket
754 | nForce3 PRO150 | 202.0
MHz | 单通道unbuffer DDR400 |
| 硕泰克SL-K8AN-RL | Socket
754 | nForce3 PRO150 | 202.0
MHz | 单通道unbuffer DDR400 |
| 华硕SK8N | Socket
940 | nForce3 PRO150 | 200.0
MHz | 双通道Registered DDR400 |
| INTEL D875PBZ | Socket
478 | i875P+ICH5R | 200.0
MHz | 双通道unbuffer DDR400 |
总线时钟频率是比较重要的参数,现在主板厂商一般都会稍微提高总线频率来增加主板性能,因此在比较主板性能时,也要参照处理器总线频率。 
Windows
XP 64Bit Edition支持AMD 64 cacheman内存子系统性能测试
| | cachemem
Main Memory 读性能 | cachemem
Main Memory 写性能 | | 华硕KV8 Deluxe | 2719.7
MB/s | 1186.8 MB/s | | 硕泰克 SL-K8AV2-RL | 2746.2
MB/s | 1189.5 MB/s | | 技嘉 K8NNXP | 2847.4
MB/s | 1195.9 MB/s | | 硕泰克SL-K8AN-RL | 2846.9
MB/s | 1193.5 MB/s | | 华硕SK8N Athlon
64FX | 3371.4 MB/s | 1823.7 MB/s |
| INTEL D875PBZ | 3239.3 MB/s | 1230.3
MB/s | Cachemem测试软件是一款在DOS环境下工作的内存子系统测试工具,这里取得的是主内存读写性能测试,这方面是INTEL平台的强项。Athlon
64 FX-51取得了最高成绩,这和他内建的双通道DDR400控制器有关,Athlon 64 FX-51的内存延迟很低,这对提高内存读写速度很有帮助。 Pcmark2002 这是一个综合性能测试软件,由FuterMark出品,可以方便快捷的测试系统的综合性能
| | CPU | Memory | HDD |
| 华硕KV8 Deluxe | 6473 | 8456 | 834 |
| 硕泰克 SL-K8AV2-RL | 6565 | 8597 | 893 |
| 技嘉 K8NNXP | 6585 | 8650 | 912 |
| 硕泰克SL-K8AN-RL | 6590 | 8641 | 924 |
| 华硕SK8N Athlon 64FX | 7129 | 11125 | 887 |
| INTEL D875PBZ | 7946 | 9307 | 885 |
Athlon 64 FX-51的内存性能让人侧目,不过INTEL 875P也紧随其后。在磁盘性能方式,nForce3
Pro 150的成绩优异,这和它的单芯片设计有关。 Multimedia Content Creation Winstone 2003
| | CCWinstone
2003 Score | | 华硕KV8 Deluxe | 45.5 |
| 硕泰克 SL-K8AV2-RL | 45.9 | | 技嘉
K8NNXP | 46.1 | | 硕泰克SL-K8AN-RL | 45.5 |
| 华硕SK8N Athlon 64FX | - | | INTEL
D875PBZ | 53.3 | ZD的Content
Creation Winstone 2002是一款综合系统测试软件,通过运行一些流行软件的脚本来体现系统的整体性能,它更加注重多媒体性能的测试。在侧重多媒体性能的内容生成(content
creation)测试中,INTEL的P4的SSE2发挥了作用,在这项测试中INTEL一直是遥遥领先。 Business Winstone
2001
| | Business
Winstone 2001 | | 华硕KV8 Deluxe | 80.1 |
| 硕泰克 SL-K8AV2-RL | 79.2 | | 技嘉
K8NNXP | 89.5 | | 硕泰克SL-K8AN-RL | 88.2 |
| 华硕SK8N Athlon 64FX | 95.9 |
| INTEL D875PBZ | 83.3 | Business
Winstone偏重于商业应用软件测试,更加偏重CPU的整数性能,对浮点要求较低。在这个测试中,使用nForce3 Pro 150芯片组的平台取得了好性能,同样是Athlon
64 3200+处理器,使用nForce3 Pro 150的平台要领先使用K8T800的平台10%左右,这是一个相当显著的差距了,这可能是由于nForce3
Pro 150优化的驱动程序的作用。不出所料,性能最高的还是Athlon 64 FX。 Sysmark 2002
BAPCo Sysmark 2002类似于ZD的Content Creation Winstone,它们都是通过运行各种脚本软件来真实模拟用户的使用情况,包括键盘输入和鼠标点击的动作,这样得出的结论具有很好的参考作用。Sysmark
2002一共有两个测试项目,Office Productivity是测试常用的办公软件的性能,它包括了微软的Office软件,浏览器、杀毒工具、压缩工具等。另一个测试项目Internet
Content Creation是一个模拟网页制作的软件,它通过Photoshop制作图片,通过Dreamweaver进行网页设计,还通过Adobe Premiere插入视频剪缉,此外还运用到了微软的媒体压缩工具和Macromeadia
Flash,可以说很有代表性,体现了系统整体的多媒体性能。
| | Sysmark2002
Rating | Internet
Content Creation | Office
Productivity | | 华硕KV8 Deluxe | 288 | 361 | 229 |
| 硕泰克 SL-K8AV2-RL | 292 | 368 | 232 |
| 技嘉 K8NNXP | 294 | 368 | 235 |
| 硕泰克SL-K8AN-RL | 296 | 368 | 238 |
| 华硕SK8N Athlon 64FX | 320 | 409 | 251 |
| INTEL D875PBZ | 312 | 431 | 226 |
Sysmark2002测试中,总分是Athlon 64 FX平台最高,Internet Content
Creation测试对多媒体性能比较侧重,因此P4 3.2取得了最好性能,Office Productivity的测试中,Athlon 64表现的较好,Athlon
64 FX-51取得最高性能。 3DMark2001SE build330 测试没有开AA和AF,画质采用驱动程序的缺少设置
| | 800×600
32bit | 1024×768
32bit | 1280×1024
32bit | | 华硕KV8 Deluxe | 18993 | 16586 | 13520 |
| 硕泰克 SL-K8AV2-RL | 19204 | 16779 | 13534 |
| 技嘉 K8NNXP | 19124 | 16636 | 13585 |
| 硕泰克SL-K8AN-RL | 19165 | 16627 | 13568 |
| 华硕SK8N Athlon 64FX | - | - | - |
| INTEL D875PBZ | 17707 | 15654 | 12981 |
在图形性能测试中,Athlon 64平台表现的比较好,可见Athlon 64非常适合游戏 3DMark03
bulid320
| | 800×600
32bit | 1024×768
32bit | | 华硕KV8 Deluxe | 6227 | 4826 |
| 硕泰克 SL-K8AV2-RL | 6249 | 4831 |
| 技嘉 K8NNXP | 6256 | 4846 |
| 硕泰克SL-K8AN-RL | 6246 | 4831 |
| 华硕SK8N Athlon 64FX | 6309 | 4879 |
| INTEL D875PBZ | 6205 | 4844 |
QuakeⅢArena 1.17 DEMO 001
| FPS | 800×600
32bit | 1024×768
32bit |
1600×1200 32bit | | 华硕KV8 Deluxe | 388.0 | 341.5 | 184.8 |
| 硕泰克 SL-K8AV2-RL | 393.2 | 352.3 | 184.8 |
| 技嘉 K8NNXP | 396.6 | 351.3 | 184.8 |
| 硕泰克SL-K8AN-RL | 398.3 | 355.2 | 184.8 |
| 华硕SK8N Athlon 64FX | 417.5 | 363.8 | 184.8 |
| INTEL D875PBZ | 393.2 | 352.3 | 184.8 |
Quake3是经典的OpenGL测试软件,Athlon 64 FX表现出很好的性能 Serious
Sam 2:The Second Encounter 英雄萨姆测试了显卡的OpenGL引擎性能,测试软件版本为Serious Sam
2:The Second Encounter,测试场景为“Little Trouble”
| FPS | 640×480
32bit | 1024×768
32bit | 1600×1200
32bit | | 华硕KV8 Deluxe | 262.3 | 232.3 | 133.5 |
| 硕泰克 SL-K8AV2-RL | 267.1 | 234.0 | 133.9 |
| 技嘉 K8NNXP | 276.5 | 234.6 | 132.4 |
| 硕泰克SL-K8AN-RL | 276.1 | 235.1 | 132.2 |
| 华硕SK8N Athlon 64FX | 283.9 | 244.1 | 132.7 |
| INTEL D875PBZ | 205.2 | 187.3 | 123.0 |
Athlon 64在英雄萨姆中表现出很强的优势 AquaMark3 AquaMark3是新推出的DX9测试软件
| | GFX | CPU | 得分 |
| 华硕KV8 Deluxe | 4860 | 8800 | 38080 |
| 硕泰克 SL-K8AV2-RL | 4842 | 8950 | 38124 |
| 技嘉 K8NNXP | 4755 | 9124 | 37736 |
| 硕泰克SL-K8AN-RL | 4770 | 9025 | 37736 |
| 华硕SK8N Athlon 64FX | 4722 | 9665 | 37951 |
| INTEL D875PBZ | 4806 | 9326 | 38225 |
在这个测试中,P4 3.2扳回一成 SuperPI
一百万位测试
| | SuperPI
一百万位 | | 华硕KV8 Deluxe | 44
秒 | | 硕泰克 SL-K8AV2-RL | 44
秒 | | 技嘉 K8NNXP | 43
秒 | | 硕泰克SL-K8AN-RL | 43
秒 | | 华硕SK8N Athlon 64FX | 39
秒 | | INTEL D875PBZ | 45
秒 | Athlon 64 FX的性能最高,nForce3 Pro150又要比K8T800强一些 POV
Ray 3.5
| | POV
Ray 3.5 | | 华硕KV8 Deluxe | 55.32
PPS | | 硕泰克 SL-K8AV2-RL | 55.64 PPS |
| 技嘉 K8NNXP | 55.85 PPS | | 硕泰克SL-K8AN-RL | 55.84
PPS | | 华硕SK8N Athlon 64FX | 60.76
PPS | | INTEL D875PBZ | 83.27 PPS |
在这个实时渲染工具中,由于可以利用到Hyper-Threading技术,因此INTEL P4的性能遥遥领先 SPECViewperf
7.1 这是SPEC最新推出的OpenGL测试软件,在原来SPECViewperf
7.0的基础上对脚本做了一些升级
| | 3dsmax-02 | drv-09 | dx-08 | light-06 | proe-02 | ugs-03 |
| 华硕KV8 Deluxe | 10.86 | 41.09 | 60.76 | 13.01 | 13.42 | 23.29 |
| 硕泰克 SL-K8AV2-RL | 10.92 | 40.54 | 61.23 | 13.17 | 13.35 | 23.37 |
| 技嘉 K8NNXP | 10.90 | 38.91 | 61.77 | 13.25 | 13.13 | 23.26 |
| 硕泰克SL-K8AN-RL | 10.92 | 39.58 | 61.85 | 13.28 | 13.29 | 23.31 |
| 华硕SK8N | 11.68 | 42.77 | 67.86 | 14.90 | 14.56 | 23.78 |
| INTEL D875PBZ | 11.34 | 37.89 | 56.32 | 13.55 | 13.71 | 12.93 |
Athlon 64 FX取得了最好的成绩,各项全面领先,INTEL P4在3dsmax-02,light-06和proe-02测试中表现较好,其它几个测试就不如Athlon
64表现出色了。 Codecreature
| FPS | 1024×768
32bit | 1280×1024
32bit | 1600×1200
32bit | | 华硕KV8 Deluxe | 38.5 | 30.2 | 23.3 |
| 硕泰克 SL-K8AV2-RL | 38.5 | 30.2 | 23.3 |
| 技嘉 K8NNXP | 38.4 | 30.2 | 23.3 |
| 硕泰克SL-K8AN-RL | 38.4 | 30.2 | 23.4 |
| 华硕SK8N Athlon 64FX | 38.4 | 30.2 | 23.3 |
| INTEL D875PBZ | 38.5 | 30.2 | 23.3 |
Codecreature大家的表现都不相上下 SiSoftware Sandra 2004 内存性能测试
| | Int
Buffered带宽 | Float
Buffered带宽 | | 华硕KV8 Deluxe | 3014
MB/s | 3014 MB/s | | 硕泰克 SL-K8AV2-RL | 3036
MB/s | 3034 MB/s | | 技嘉 K8NNXP | 3116
MB/s | 3118 MB/s | | 硕泰克SL-K8AN-RL | 3118
MB/s | 3120 MB/s | | 华硕SK8N Athlon
64FX | 5454 MB/s | 5412
MB/s | | INTEL D875PBZ | 4590 MB/s | 4579
MB/s | 内建了双通道DDR400控制器的Athlon 64 FX的内存性能表现出色,875P的双通道DDR400也可以轻易战胜Athlon
64的单通道内存控制器 CPU Arithmetic Benchmark,CPU 数学运算成绩
| | Dhystone
ALU | Whetstone
FPU/iSSE2 | | 华硕KV8 Deluxe | 8268
MIPS | 3136/4068 MFLOPS | | 硕泰克 SL-K8AV2-RL | 8409
MIPS | 3177/4149 MFLOPS | | 技嘉 K8NNXP | 8444
MIPS | 3200/4179 MFLOPS | | 硕泰克SL-K8AN-RL | 8418
MIPS | 3198/4179 MFLOPS | | 华硕SK8N
Athlon 64FX | 9174 MIPS | 3466/4526
MFLOPS | | INTEL D875PBZ | 9869 MIPS | 4029/7060
MFLOPS | CPU Multi-Media Benchmark,CPU的多媒体性能
| | Integer
iSSE2 | float-point
iSSE2 | | 华硕KV8 Deluxe | 14833
it/s | 19565 it/s | | 硕泰克 SL-K8AV2-RL |
15040 it/s | 19839 it/s |
| 技嘉 K8NNXP | 15132 it/s |
19965 it/s | | 硕泰克SL-K8AN-RL | 15132
it/s | 19982 it/s | | 华硕SK8N Athlon
64FX | 16407 it/s |
21624 it/s | | INTEL D875PBZ |
24563 it/s | 34679 it/s |
在SSE2测试中,INTEL P4 3.2更是遥遥领先,Athlon 64虽然支持SSE2,但是效率比Pentium
4差多了。 ScienceMark 2.0 缓存/内存带宽比较
| | L1
Cache | L2 Cache | Memory |
| 华硕KV8 Deluxe | 23067.31 MB/s | 6424.47
MB/s | 2940.79 MB/s | | 硕泰克 SL-K8AV2-RL | 23194.57
MB/s | 6439.30 MB/s | 2964.72 MB/s |
| 技嘉 K8NNXP | 23278.14 MB/s | 6493.15
MB/s | 3021.51 MB/s | | 硕泰克SL-K8AN-RL | 23274.27
MB/s | 6497.40 MB/s | 3020.30 MB/s |
| 华硕SK8N Athlon 64FX | 25197.28 MB/s | 10715.92
MB/s | 5373.10 MB/s | | INTEL D875PBZ | 16159.83
MB/s | 19776.53 MB/s | 4039.68 MB/s |
Athlon 64在一级缓存带宽上要高于Pentium 4,但是在二级缓存和内存上都要低于Pentium,这也不奇怪,Athlon
64的L2 Cache的总线宽度只有Pentium4的一半,而且实际工作频率也要低不少。Athlon 64是单通道内存架构,带宽要低于875P的双通道DDR400结构。Athlon
64 FX的L2缓存带宽有所提高,但是由于位宽仅为P4的一半,因此性能还是大幅落后于P4,不过Athlon 64 FX的内存带宽是最高的,这和前面的测试结果一致。
| 内存延迟 | Athlon
64 3200+ | Athlon
64 FX-51 | Pentium
4 3.2GHz | | 4 byte 步幅 | 4
cycles/2 ns | 4 cycles/1.82 ns | 4 cycles/1.25
ns | | 16 byte 步幅 | 14 cycles/6.99
ns | 13 cycles/5.91 ns | 16 cycles/5.01 ns |
| 64 byte 步幅 | 53 cycles/25.97 ns | 52
cycles/23.64 ns | 65 cycles/20.36 ns | | 256
byte 步幅 | 98 cycles/48.93 ns | 118 cycles/53.64
ns | 236 cycles/73.94 ns | | 512
byte 步幅 | 104 cycles/51.93 ns | 125 cycles/56.82
ns | 253 cycles/79.26 ns | 内存延迟是Athlon
64表现的最好,Athlon 64 FX次之。 结论: 从这次Athlon 64的横测来看,Athlon 64的表现相当不错,它保持了AMD处理器传统的强项,如在游戏和商业应用中的性能很好。做为一颗X86-64位的扩展指令集CPU,它目前的表演舞台还是32位的操作系统和应用程序,和Athlon相比,Athlon
64增加的二级缓存和SSE2指令集在32位系统下发挥了作用。不过我认为对Athlon 64性能更加关键的是它集成的DDR内存控制器,集成的内存控制器的延迟很低,可以大幅提高内存读写速度,Athlon
64 FX的双通道Registered DDR SDRAM控制器在这次测试中发挥出了最佳的性能,可以说是目前在游戏和商业应用领域最佳的桌面处理器了。但是大家也要注意到,INTEL和Athlon
64 FX竞争的是P4 EE处理器,这颗处理器已经正式上市,只是我们没有拿到测试样品,希望在以后的测试中可以拿Athlon 64 FX和P4 EE来较量一下。我们也注意到,Athlon
64 FX和Opteron基本上是一样的东西,而P4EE和XEON MP也是一样的东西,有趣的是Opteron和XEON MP都是针对服务器的产品,这种现象在以前是不多见的。Athlon
64 FX的系统成本相当高,对于大多数用户来说选择Athlon 64还比较实际一些。在多媒体测试方面,P4还是绝对的性能领先者,这主要靠Netbrust出色的架构,超长的流水线,高主频,SSE2指令和先进的分支预测技术,这些对于执行多媒体程序的SIMD指令相当有益。对于侧重多媒体应用的,如视频和音频压缩,还是选择P4更加合适。
| | 64位
X86-64 | 32位
X86-32 | | 文件压缩 | 4.718秒 | 10.796秒 |
| 文件解压 | 0.328秒 | 0.718秒 |
minigzip for AMD64版本测试 我们也进行了64位环境下的测试,在Windows
XP 64Bit Edition for AMD64环境下,运行现在的32位程序都不同程度的出现性能降低,只有真正使用了X86-64指令编码的程序才会有出色表现,目前这种应用程序还比较少,对于程序开发人员来说,Athlon
64会有一些吸引力。 明年第一季Intel Prescott正式上市时,Athlon 64会遇到强劲对手,Prescott也拥有Athlon 64的寻址能力,而且隐藏了INTEL自己的X86-64位扩展,这对AMD可不是好消息。AMD只有现在解决Athlon
64的产能问题,降低价格,快速扩大市场才有可能在未来从容应对Prescott的挑战。
|