新萤火虫论坛

 找回密码
 注册
查看: 8233|回复: 6

HD4870血拼GTX260 八大顶尖显卡大会战

[复制链接]
发表于 2008-7-31 12:28:26 | 显示全部楼层 |阅读模式
冤家聚头 GTX260直面HD4870
  ● 第二代DX10显卡 A/N思路分道扬镳?
        在显卡进入DirectX 10时代后,AMD-ATI和NVIDIA两家GPU芯片级厂商都加快了产品的更新换代速度,几乎是以半年一代的频率的发布新品。这样的做法不仅加强了自身竞争能力,还能为用户带来功能更多、性能更强的显卡。
        目前,AMD-ATI的全新代表作为Radeon HD 4800系列,它们的优势在于明显改进了的架构设计和庞大的流处理器。当然直击底价的田忌赛马式行销策略,再次帮助AMD-ATI成功掠取用户关注,目前1399元的Radeon HD 4850成为了中高端产品中极具性价比的产品之一,备受玩家追捧。
        而NVIDIA在第二代DirectX 10产品中,主攻产品的绝对综合性能,例如已经大量铺货的Geforce GTX 280/260,这两款产品综合性能毋庸置疑,不过它们需要面对的敌人并非Radeon HD 4800系列,而是自己本身的价格,上市之初设定5000元和3000元零售价确实令很多消费者望而却步,这也给对手的Radeon HD 4800有机可乘。
  ● 好戏还在后面 第2回合对决揭幕
  

Radeon HD 4870 vs GeForce GTX 260
        正如前文提及过的价格因素,NVIDIA决定调整Geforce GTX 280和Geforce GTX 260的价格,用以增强产品竞争力。目前Geforce GTX 280官方定价559美元,Geforce GTX 260定价369美元,折合成人民币后已经抵达2500元左右,和Radeon HD 4870价格十分接近,形成短兵相接之势。在Radeon HD 4850和GeForce 9800 GTX/GTX+的第一轮大战之后,AMD和NVIDIA的第二轮厮杀现在正式开始。

最近一年来的中高端显卡市场格外热闹
        不过,无论AMD-ATI和NVIDIA在产品定位和市场策略上有何相同、有何不同,用户更为关心的是在自己能够承受的价格区间内什么产品最适合自己。而且当前正值新老两代产品交替之际,很多用户在价格、性能、功能、规格等多方面权衡,所以有些无从下手,本文将围绕AMD-ATI和NVIDIA两家的全新产品和上一代顶级产品展开,让广大用户能够更加直观的了解到产品综合性能,以便选出适合自己的产品。本文将选择AMD-ATI和NVIDIA的如下产品进行对比:
AMD-ATI产品:Radeon HD 4870、Radeon HD 4850、Radeon HD 3870x2和Radeon HD 3870
NVIDIA产品:Geforce GTX 280、Geforce GTX 260、Geforce 9800GX2和Geforce 9800GTX+
RV770 GT200核心架构大比拼
         AMD-ATINVIDIA两家公司的产品在设计思路上迥异,下面就让我们浅析一下GT200和RV770二者的架构。
        首先,新一代的产品势必会要争取更强大的性能,在进入DirectX 10时代后,显卡除了增加自身频率外,大规模增加流处理器数量是一个立竿见影的做法。RV770就是如此,相对于上一代RV670的320个流处理器,其翻倍增至800个。
        其次,增加显存位宽和显存容量。RV770在这点上相对RV670没有做改动,也许是吸取了在Radeon HD 2900系列产品中教训。反观GT200核心不仅着手增加流处理器,还激进的首次采用512bit显存位宽,这样通过增加流处理器和显存位宽,从而降低显卡对频率的依赖,毕竟14亿晶体管构建的576mm2核心发热量、功耗太大了。
         ● 以组为单位 性能浅析


AMD-ATI产品SP架构设计
         众所周知,现在在进入DirectX 10时代后启用了统一架构,但是AMD-ATI和NVIDIA在设计上略有差别,例如上图中的架构可以看出AMD-ATI的产品采用4D+1D的SIMD方式,而NVIDIA再用1D标量MIMID方式,这就是很多网友为什么说AMD-ATI产品流处理器要除以5再和NVIDIA产品比较的原因。
   
AMD-ATI(左)NVIDIA(右)每组流处理器架构
        我们可以把4D+1D的组合看做一个SP(Streaming Processor 流处理器),AMD-ATI每16个SP构成一个叫做SIMD Core的组,这点与NVIDIA的SM(Streaming Multiprocessor)结构相类似,其是由8个SP构成一组SM。

RV670核心共有4组SIMD Core

RV770核心共有10组SIMD Core

GT200核心流处理器阵列共有10组TPC
        在核心宏观角度考虑,RV770相对于RV670仅是增加了2.5倍的SIDM Core,基本宏观设计思路变化不大。反观GT200的核心架构,首先大刀阔斧的将每组TPC扩容至3组SM(之前产品为2组SM),从而增加线程管理作用。
        那么,GT200的1D标量MIMD架构和RV770的4D+1D向量SIMD架构在运算上分别有何长处呢?
NVIDIA GT200AMD RV770AMD RV670
SP Issue Width1-way(1D)5-way(4D+1D)5-way(4D+1D)
# of SPs24016064
Worst Case Dependent Instruction Throughput24016064
Maximum Scalar Instruction Throughput480800320
        从表中不难看出,GT200的1D标量MIMD架构相对而言更加适合单线程运算,此时相对于RV670和RV770有更多的执行线程。而在运行负载运算时,AMD-ATI的4D+1D向量SIMD架构得以发挥,例如RV770此时800流处理器运算,而GT200即使调用SFU实现Dual-Issue技术,也仅有480线程计算量。

NVIDIA Geforce GTX 280

AMD-ATI Radeon HD 4870
        对比RV770和GT200核心中每组流处理器架构,我们能够很容易看出RV770共有160个SIMD Core(每SIMD Core由5个流处理器组成,即160*5=800个流处理器)分成10组,每组SIMD Core有16个SP。反观GT200核心的240个流处理器,由于NVIDIA采用MIMD的流处理器形式,所以每个流处理器拥有独立的指令发射器。而这240个流处理器分为10组TPC,每组TPC又分成3组SM,每组SM拥有8个流处理器。
        两款核心及产品在宏观架构设计上平分秋色,在微观单元设计及技术应用上二者都较上一代产品有了大踏步的前进,尤其是RV770融入了很多AMD在通用处理器上的技术,使其工作效率更佳。
RV770威力极限—HD4870整装待发
   全球的Radeon阵营支持者最近一个月无疑都沉浸在Radeon HD 4850阶段性胜利的喜悦中,AMD及Radeon依靠这款性价比极高的产品重新得到了PC图形硬件玩家们的关注,它准确的击中了目前NVIDIA产品布局的软肋,并使其不得不大幅降价GeForce 9800 GTX并追加GeForce 9800 GTX+来应对。现在,Radeon HD 4850的兄弟产品Radeon HD 4870也来到了我们面前,和上代的xx50/xx70产品编号相似,Radeon HD 4870是Radeon HD 4850的极限版本,发生的主要变化是提升GPU频率并换用了速度超快的GDDR5本地内存,但它仍然基于RV770 GPU
  ● 首款GDDR5显卡
  Radeon系列显卡一直是新式内存芯片的先锋验证者,这一代的Radeon HD 4870也当仁不让的在业内率先使用最新显示内存GDDR5,让显卡的内存带宽提升幅度逼近100%!


Qimonda GDDR5内存芯片
  目前AMD统一出货的第一批官方版本Radeon HD 4870上均使用了Qimonda IDGV51-05A1F1C-40X GDDR5内存芯片。和GDDR3相比,GDDR5内存芯片内的预读取I/O翻番,以同样的内核频率前提下实现加倍的外部频率,当然同时也付出延迟更高的代价,但在庞大带宽支持下获得性能提升仍然是十分明显。
  Radeon HD 4870 BIOS设定的内存频率为3600MHz(QDR),远远超出现有其他显卡的内存频率,十分夸张。GDDR5的默认工作电压为1.5V,目前工艺下整体功率较GDDR3稍高。
  ● 回顾RV770 GPU

AMD RV770 GPU
   RV770由台积电以55nm工艺制造,晶体管数目9.56亿、核心表面积260平方毫米,在Radeon HD 4870的750MHz频率设定上,它需要比较强力的散热器来进行散热。RV770的其他特点还有内置256bit位宽的内存控制器及符合PCI Express 2.0规范的I/O接口,其800个流处理器和整个GPU运行频率同步。RV770也内置了符合HD Audio规格的音频逻辑,可以直接输出完整的HDMI信号。
  在3D架构方面RV770不是从某个顶级GPU精简规模而来,是在RV670基础上开发的加强版本。

RV770核心架构
  >>着色器
  以上是RV770核心架构图,它仍然基于R600/RV670的4D+1D模式1D*5基本着色器组结构,每5个标量着色器组成一个类似以前的向量着色器样式拥有自己的基本资源进行操作。
  
>>纹理单元
  和着色器树木比例递增的是纹理单元,RV770的纹理单元也增加到了10组,在结构上和RV670完全相同。
  >>
ROPs
  但是在端部分,RV770虽然仍旧使用4组16个ROPs,但这些部分却得到了AMD的改良以增强抗锯齿能力,改良的关键是加倍了Z模板的采样数。

  RV770相对于RV670的底层结构变化并不算很大,增进的主要是着色器的规模,这将直接提升GPU面对着色器编程类图形及其他计算类应用程序时的性能,最主要的改善就是最新的复杂3D游戏速度。同时剧增的着色器规模用于MSAA的计算配合ROPs的改进,Radeon HD 4000系列的抗锯齿性能也得到了加强。


AMD图案乍现—HD4870显卡PCB详解
  ● Radeon HD 4870公版
  目前我们拿到的Radeon HD 4870均为AMD设计定制分派到各个品牌的官方版本,拥有完全相同的硬件设计和性能规格,这些Radeon HD 4870均为512MB本地内存配置版本。
  按照惯例,这款显卡整个PCB仍采用典型ATI风格的火红色涂装,绝大部分元件安装在PCB正面,包括8枚内存芯片,背面元件为少量小型贴片型,没有预留更多的内存芯片焊位,扩展成1GB本地容量需要换装1Gb的内存芯片。其BIOS默认核心/内存频率设定为官方规格的750MHz/3600MHz

   

Radeon HD 4870 PCB状况
   Radeon HD 4870的GPU/内存频率更高,对布线和供电的要求急剧提升,PCB整体设计和元件的使用也复杂更昂贵了,以下是Radeon HD 4870和Radeon HD 4850的PCB正面对比,两者的区别一目了然,Radeon HD 4870的PCB较大,使用更强力的供电元件和双6pin外部电力输入接口。

Radeon HD 4850和Radeon HD 4870的PCB对比

AMD logo清晰可见
  另一个细微的变化是“AMD”的logo,自ATI被AMD收购以来,Radeon系列显卡的外部特征和品牌标识一直都还保持着原来的样式几乎没有变化,这第一次在Radeon显卡PCB上出现的“AMD”意味着什么呢?
  ● 3+2 豪华供电电路
   为了支持高频GPU和内存芯片的稳定运行,并保持低矮外形便于整体散热,AMD给Radeon HD 4870使用了成本不菲的一体式电感和小型化CSP封装的高性能电源元件,类似的方案在Radeon HD 2900 XT上曾经出现过。

   
Radeon HD 4870的供电电路元件
  给750MHz RV770 GPU供电的是三枚VOLTERRA VT1195SF PWM/MOSFET整合电源芯片外加一只VITEC并联一体式电感,共可以同40A*3最高达120A的电流支持。  给3600MHz GDDR5供电的是两枚VOLTERRA VT235MF PWM/MOSFET整合电源芯片外加两只PULSE电感,应付8颗内存所需的大电流绰绰有余。
  ● 设计精良的散热方案
  因为需要照顾内存芯片和供电元件散热,Radeon HD 4870的散热器相对复杂,主要一块铝质内存、供电元件散热兼固定板+铜质GPU吸热散热块和鳍片组+离心式风扇及导流罩构成,完全拆解它们也并不麻烦。

显卡散热器拆解
  GPU吸热散热块部分和我们熟悉的CPU散热器结构类似,和GPU核心表面接触的铜底吸热储热,通过热管元件内部工质相变迅速把热量传递给密集的铜鳍片,由离心式风扇提供流动空气,把热量排出机箱。
  散热器带来了整块显卡的双槽厚度,配置Radeon HD 4870需要主板有较为宽阔的空间。产品介绍部分到此为止,接下来我们来对这款显卡的性能进行初步的探索。


[ 本帖最后由 共相语 于 2008-7-31 12:43 编辑 ]
 楼主| 发表于 2008-7-31 12:30:34 | 显示全部楼层
HD4870-蓝宝/迪兰恒进/七彩虹
也许在当前用户最为关注的焦点,莫过于AMD-ATI的RV770核心和NVIDIA的GT200核心二者孰强孰弱,可是苦于双方产品定位、定价不同,无法在同一起跑线上进行对比测试。不过由于AMD-ATI的Radeon HD 4800系列产品呼声逐渐增高,NVIDIA适时的改变了Geforce GTX 200的产品定价,首先是Geforce GTX 280的90美元大降价,其次是Geforce GTX 260降价直接对位Radeon HD 4870。
        在种种机缘巧合造就的环境下,我们终于可以从AMD-ATI和NVIDIA两家全新产品中找到一对具备可比性的产品——Radeon HD 4870 PK Geforce GTX 260
        ● Radeon HD 4870 我是A卡顶梁柱
        AMD-ATI最新一代显卡的首款核心为RV770,它从出生到成功基本都是在复制“RV670的经历”,但是RV770的成功要远大于RV670。这是因为RV770同样采取“田忌赛马”的市场策略,并同时加以直接低价的政策,但是由于RV770在规格、性能上的出类拔萃,令其影响力远大于RV670的Radeon HD 3800系列。

        与Radeon HD 3800系列一样,Radeon HD 4800系列中的两款产品Radeon HF 4870和Radeon HD 4850,影响二者性能差距的主要因素是频率,也就是说公版的Radeon HD 4870和Radeon HD 4850拥有完全相同的硬件规格。不过值得一提的是Radeon HD 4870拥有傲人的GDDR5显存颗粒,所以在显存频率及带宽上远大于Radeon HD 4850。
        在AMD收购ATI后,这家原通用处理器公司拥有了GPU这块协处理器领域技术,并且值得一提的是AMD将自己在通用处理器中的优势技术融入到GPU中,并且在RV770这款产品上得到了很好的效果。例如在GPU中抛弃了RV6X0产品中使用的RingBus总线,改用AMD更为擅长的Crossbar总线,这样的好处是可以大大降低延时和执行效率。
AMD-ATI中高端产品规格表
显卡型号Radeon HD 4870Radeon HD 4850Radeon HD 3870x2Radeon HD 3870
核心代号RV770RV670
制造工艺55nm
核心晶体管数目9.56亿6.66亿 *26.66亿
DirectX 版本支持DirectX 10.1
着色器数量
(标量通用着色器)
800320 *2320
纹理拾取单元数量4016 *216
光栅处理器数量1616 *216
着色器
理论计算能力
1200GFLOPS1000GFLOPS528GFLOPS *2496GFLOPS
核心频率750MHz625MHz825MHz775MHz
着色器频率750MHz625MHz825MHz775MHz
GPU I/OPCI-Express 2.0
内存频率3600MHz2000MHz1800MHz2250MHz
内存位宽256bit256bit *2256bit
内存带宽115.2GB/s65GB/s57.6GB/s *272GB/s
内存类型GDDR5GDDR3GDDR3GDDR4
内存容量512MB512MB512MB *2512MB
视频加速相关Avivo UVD IIAvivo UVD
        这是本次参加对比测试的4款AMD-ATI产品规格,不难看出RV770相对RV670拥有2倍以上的流处理器和纹理拾取单元,尤其是Radeon HD 4870搭配GDDR5后显存带宽及频率得到质的飞跃。
        ● 首批发布产品:蓝宝/迪兰/七彩虹

蓝宝Radeon HD 4870

迪兰恒进Radeon HD 4870

七彩虹Radeon HD 4870
GT200降价夺市—GTX260蓄势待发
        与Geforce 8800GTS-512MB和Geforce 8800GT-512MB一样,Geforce GTX 280和Geforce GTX 260两款产品仅是硬件规格和频率上的区别,在PCB布线、技术支持,甚至在GPU使用上都采用了相同的核心。
        那么就先让我们了解一下对于显卡来说,两个最影响性能的组建——GPU规格和显存规格。
        ● Geforce GTX 260核心揭秘


Geforce GTX 260搭载G200-100-A2 GPU
        Geforce GTX 260使用了台积电采用65nm工艺制造的G200-100-A2核心,与G200-300-A2核心(用于Geforce GTX 280)相同都是由14亿晶体管构成,核心面积高达576mm2。在核心制程、核心面积上,笔者不得不对Geforce GTX 200系列产品在功耗及发热量上的问题心存疑虑,也许在G92试水55nm成功后,GT200核心会快速转投55nm制程,从而解决高温、高功耗、高成本的“三高”诟病。
        Geforce GTX 260的G200-100核心采用了第二代统一架构,在核心运算效率上得到很大改观。G200-100核心、Shader频率分别为576MHz、1242MHz,GPU:Shader频率比例约为1:2.16。

Geforce GTX 260核心架构图
        通过架构图不难看出相对Geforce GTX 280产品,Geforce GTX 260做了硬件规格屏蔽,例如流处理器、光栅处理单元和显存等。

GPU-Z识别截图
        GPU-Z v0.2.4版本已经能够正确识别Geforce GTX 260,通过结果我们能够看到G200-100核心拥有192个流处理器和28个光栅处理器,当然随之也缩减纹理拾取单位至64个,G200-100相对于G200-300缩减了48个流处理器、4个光栅处理器、16个纹理拾取单元。
        ● Geforce GTX 260本地内存

Geforce GTX 280标配显存
        Geforce GTX 260仍然保守的采用了GDDR3颗粒,其使用14颗规格为16M*32bit的hynix H5RS5223CFR N0C颗粒,构成448bit/896MB的组合,默认显存频率为1998MHz,显存带宽高达111.9GB/s。
        由于Geforce GTX 260与Geforce GTX 280使用相同PCB,所以可以看到在PCB正反两面上均有一个显存空焊位。
        在hynix官方网站可以查到H5RS5223CFR N0C的相关资料,其属于hynix的最高端GDDR3显存颗粒,单颗芯片 规格为16M*32bit=512Mbit,官方标称这款芯片最佳频率为1000MHz(等效频率为2000Mbps/pin)。可以说,Geforce GTX 260公版产品预设的1998MHzX显存频率,已经达到了标配显存颗粒的理论极限值。
酷似GTX280—GTX260奢华做工
        看过本页标题,也许很多读者已经能够清楚Geforce GTX 260会有怎样的奢华做工,而且在前文中笔者也提及过Geforce GTX 260使用了与Geforce GTX 280相同的PCB,也就是说Geforce GTX 260在价格、规格和性能上不济Geforce GTX 280,但是在做工、用料品质上绝对向Gefroce GTX 280看齐。

  
Geforce GTX 260官方样卡
        上图为本站收到的Geforce GTX 260官方样卡,咋一看想必很难有人能够分清其是Geforce GTX 280,还是Geforce GTX 260。
   
Geforce GTX 280 PCB特写
        Geforce GTX 260使用了NVIDIA为Geforce GTX 260/280独立设计的P651公版PCB,这款PCB采用了豪华的10层PCB设计,整体PCB尺寸为4.376英寸*10.5英寸。如果想要把其装进机箱中,必须购置一个拥有较大空间的机箱。
        由于G200-100的晶体管数量之多和核心面积之大的共同作用下,GPU不得不舍弃一切功能采用独立芯片提供支持。与Geforce 8800 Ultra的NVIO芯片一样,Geforce GTX 260标配的NVIO第二代产品——NVIO2,主要功能仍然是包括两个400MHz的RAMDAC、两个Dual Link规格的TDMS和HDCP,并协助显卡输出10bit色彩。
   
         为了保证现在的稳定运行供电模组可谓极尽豪华,为了在有限的PCB面积上设置更多相供电滤波模组,P651公版使用了优质屏蔽电感搭配QFN封装的VT1165SF芯片4颗和VT238AWF芯片1颗 。值得一提的是Volterra生产的VT1165SF和VT238AWF内置Mosfet场效应管,从而达到节省PCB空间和增强供电滤波的目的。
        为了满足Geforce GTX 260的整卡供电需求,显卡标配8pin+6pin的4路12V外接供电。
        Geforce GTX 260标配的散热器采用了全包裹设计,正面为离心式风扇加被动散热器鳍片的组合,GPU散热部分采用纯铜材质搭配热管散热,散热器同时为GPU、显存及供电模组降温。散热器背盖同时为PCB背部7颗显存颗粒散热,同时起到加强PCB硬度的作用,确保PCB在重力因素下不变形。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-7-31 12:34:21 | 显示全部楼层
        ● Geforce GTX 260 我是N卡普及钦差
       在G80和G92两款旗舰核心大获全胜后,NVIDIA依然继续走着性能之王的套路,而且GT200没有辜负大家期盼再一次荣登绝对性能的王座。但是由于过分注重性能,GT200核心动用了14亿晶体管来构建,高价成本严重制约了Geforce GTX 200系列产品的亲民路线。

        与AMD-ATI产品划分策略不一样,NVIDIA的每个系列产品都是通过缩减硬件规格来划分,由此也能够在一定程度上降低成本。例如目前第一款非全规格GT200核心产品G200-100核心,就被用于Geforce GTX 260。而且由于收到Radeon HD 4800系列价格打压,目前Geforce GTX 260降至369美元。
        虽然在价格上与Radeon HD 4870想接近,但不得不说的Radeon HD 4870拥有一颗完整的“芯”,而Geforce GTX 260是屏蔽48个流处理器及一系列规格而得。不过不得不说的是此次NVIDIA激进的采用了512bit显存位宽设计,即使缩减规格的Geforce GTX 260也拥有448bit,这为GPU与显存间数据吞吐提供便利,而且GT200核心的总线模式也是采用Crossbar。
NVIDIA中高端产品规格表
显卡型号Geforce GTX 280Geforce GTX 260Geforce 9800GX2Geforce 9800GTX+
核心代号G200-300G200-100G92-450 *2G92-420
制造工艺65nm55nm
核心晶体管数目14亿7.54亿 *27.54亿
DirectX 版本支持DirectX 10
着色器数量
(标量通用着色器)
240192128 *2128
纹理拾取单元数量806464 *264
光栅处理器数量322816 *216
着色器
理论计算能力
622.1GFLOPS476.9GFLOPS384GFLOPS *2470GFLOPS
核心频率602MHz576MHz600MHz738MHz
着色器频率1296MHz1242MHz1500MHz1836MHz
GPU I/OPCI-Express 2.0
内存频率2214MHz1998MHz2000MHz2200MHz
内存位宽512bit448bit256bit *2256bit
内存带宽140.8GB/s111.9GB/s64GB/s *270.4GB/s
内存类型GDDR3
内存容量1024MB896MB512MB *2512MB
视频加速相关PureVideo HD IIPureVideo HD
        架构、规格均有大幅升级的Geforce GTX 200系列,性能自然强劲,相较自家上一代产品会有大幅提升。那么相对AMD-ATI全新产品,尤其是Radeon HD 4870上会有如何表现,下文自然会有结果。
         ● 首批发布产品:讯景/索泰/影驰/七彩虹

讯景Geforce GTX 260

索泰Geforce GTX 260

影驰Geforce GTX 260

七彩虹Geforce GTX 260

映众Geforce GTX 260
       ● 测试系统硬件环境
  显卡性能测试使用的硬件平台由Core 2 Extreme X9770 CPU、X48 Chipset主板和1GB*2双通道DDR3-1333内存构成。细节及软件 环境设定见下表:

[tr][td=1,1,108]中央处理器[/td][td=1,1,385]Intel Core 2 Extreme X9770(四核 / 400MHz*8 / 12MB共享L2缓存 [tr][td=1,1,108]内存模组[/td][td=1,1,385]PNY DDR3 1333 1GB*2
1333 8-8-8-20-2T
[tr][td=1,1,108]主板[/td][td=1,1,385]ASUS P5E3
(Intel X48 BIOS版本 : 0601)
[tr][td=1,1,108]显示卡[/td][td=1,1,385]Geforce GTX 260
(G200 / 896MB / 核心:576MHz / Shader:1242MHz / 显存:1998MHz)
Radeon HD 4870(RV770 / 512MB / 核心:750MHz / Shader:750MHz / 显存:3600MHz)
[tr][td=1,1,108]硬盘[/td][td=1,1,385]Seagate Barracuda 7200.10 SATA
320GB / 7200RPM / 16M缓存  / 30GB NTFS系统分区
[tr][td=1,1,108]电源供应器[/td][td=1,1,385]Topwer TOP-900W
ATX12V 2.0 / 900W[tr][td=1,1,108]显示器[/td][td=1,1,385]DELL 3007WFP
(30英寸LCD / 2560*1600分辨率)
系 统 硬 件 环 境
        测试系统的软件环境
操 作 系 统 及 驱 动
操作系统
Microsoft Windows vista Ultimate SP1
(中文版 / 版本号6001)
主板芯片组 驱动
Intel X48 for Vista
(WHQL / 版本号 9.0.0.1008)
显卡驱动
AMD-ATI Catalyst for Vista
(WHQL / 8.6 + Hotfix)
NVIDIA Forceware for Visa
(WHQL / 版本号 177.41 MOD)

桌面环境
2560*1600_32bit 60Hz
  测试内容包括D3D合成测试软件3DMark 06和3Dmark Vantage,及4款最新DirectX 9 3D游戏6款DirectX 10游戏。合成测试软件3DMark用总分衡量性能,3D游戏用平均fps来衡量性能,两者都是越高越好。
合 成 测 试 软 件 和 游 戏
3D合成测试软件3Dmark06
(Futuremark / 版本号1.10)
3Dmark Vantage
(Futuremark / 版本号1.00)

3D游戏DirectX 9[size=-1]Call of Duty 4:Modern Warfare
(Activision / BenchMark Demo)
Half-Life 2 Episode 2
( Valve / 版本号1.0.0.0 )

Need for Speed:Pro Street
(EA / 版本号1.0)

Unreal Tournament 3
(Epic / Benchmark Demo)

DirectX 10Assassin's Creed
(Ubisoft / 版本好1.0)
BioShock
(2KGames / 版本号1.0)

Company of Heroes
(Relic / 版本号1.7.1)

Call of Juarez DirectX 10 Benchmark
(Ubisoft / 版本号1.0)

Crysis
(Crytek / 版本号1.2.1)

PT Boats Knights of the Sea Benchmark
(Akella / 版本号1.0)

测试辅助软件
速度记录软件Fraps
(beepa / 版本号 2.9.4)
       ● DX9性能测试:3DMark 06
  3Dmark 06作为上一代3DMark系列巅峰之作,所有测试都需要支持SM3.0的DirectX 9硬件,并且支持HDR特性,这款软件的最终得分里CPU性能占有不小的权重,因此它更适宜分析整个系统的3D加速能力。

        在3Dmark06测试中,笔者选择了9个画质及分辨率设置,为的是让读者能够更加设呢的了解目前AMD-ATI和NVIDIA两家的主流中高端产品性能。
        通过第一张默认设置的柱状图我们能够了解到Radeon HD 3870x2成为了当之无愧的跑分王。分析Geforce GT 260和Radeon HD 4870两款产品性能,二者平分秋色,在开启AA反锯齿特效后Radeon HD 4870表现优于Geforce GTX 260,尤其是开启8X AA特效后成绩相差最大,通过本环节测试证明Radeon HD 4870在反锯齿特效上更佳见长。
        ● DX10性能测试:3Dmark Vantage
        3DmarkVantage是Futuremark最新推出的一款显卡3D性能测试,该款软件仅支持DirectX 10系统及DirectX 10显卡。测试成绩主要由两个显卡测试和两个CPU测试构成,整个测试软件各家偏重整机性能。

        在3Dmark Vantage测试中,由于NVIDIA的G92核心和GT200核心支持PhysX物理引擎加速,所以N卡在本环节占据极大优势。
        Geforce GTX 280凭借规格及驱动上的先天优势轻松拿下本环节第一名。对比Geforce GTX 260和Radeon HD 4870两款产品性能,前者以10%左右的成绩优势领先后者。
        也许很多网友认为Geforce GTX 260使用物理驱动获胜胜之不武,不过笔者需要说的是显卡支持物理引擎加速是未来的一个发展趋势,而且最新消息称NVIDIA和AMD-ATI已经就PhysX引擎和CUDA等技术的授权问题展开会晤。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-7-31 12:37:38 | 显示全部楼层
       ● Call of Duty 4 Modern Warfare
    经典战争游戏续作Call of Duty 4 Modern Warfare由原一、二代制作公司Infinity Ward重新操刀,背景跳出二次世界大战战场,将前线拉至近现代中东地区的战争中。该游戏3D引擎执行效率很高,在实现接近DirectX 10级别火焰烟雾等环境特效的基础上,保证了游戏速度,是不折不扣的第一人称射击游戏重量级作品。

  >>游戏类型:DirectX9 第一人称射击游戏
  >>测试方式:黑夜室外/室内场景,沿同一固定路线跑完3次取平均值,Fraps计速
  >>画质设定:可设置的全部最高
        在Call of Duty 4:Modern Warfare(使命召唤4:现代战争)中8款产品均有出色表现,即使在2560*1600 4X AA / 16X AF画质下所有产品也能保证游戏流畅运行。本文两位主角Geforce GTX 260和Radeon HD 4870性能可谓旗鼓相当,每子项测试基本都是以可忽略不计的性能差距结束。
        ● Half-Life 2 Episode Two
  本游戏是Valve 2006年Half-Life2 Episode 1的续集,带来了最新故事情节和更优秀的画面表现,但游戏仍然使用Source引擎,提升的画面品质来自于更为复杂的纹理和少量新增特效,对系统负载不大,整体速度较高。

  >>游戏类型:DirectX9 第一人称射击游戏
  >>测试方式:白天室外/室内场景,开始场景一段游戏的自行录像回放
  >>画质设定:可设置的全部最高
  >>AA、AF设定:AA和AF均在游戏中开启
        第一人称设计游戏对游戏流畅度要求非常高,不能以最低的25帧流畅度来衡量,以许多玩家的实际视觉感官认为平均40帧为达标、60帧以上为佳。
        就整体而言,Geforce GTX 280和Radeon HD 4870两款目前各家的的顶级产品,分别在各自品牌中产品获得第一。不过在价位上相近的Geforce GTX 260和Radeon HD 4870,二者在本环节依然势均力敌,其中Geforce GTX 260以极微弱优势领先Radeon HD 4870。
         而且值得一提的是,由于RV770在反锯齿效能上做了很大改善,所以在开启反锯齿特效后性能损失相对较小,Radeon HD 4850与Radeon HD 3870x2打成平手。
        ● Need for Speed ProStreet
  最新发布的极品飞车第十一部作品Need for Speed ProStreet一经发布就迅速抢过PC竞速类游戏的No.1人气。ProStreet画面风格返回三代的明亮清爽,画面质量有一定程度的改进,但对PC系统的要求并没有大幅度提高。

  >>游戏类型:DirectX9 竞速类游戏
  >>测试方式:同一弯道竞速场景,人为操作跑完3次取平均值,Fraps计速
  >>画质设定:全部最高
        SLI技术在极品飞车:专业赛道中表现十分抢眼,4项自测试均已绝对优势技压群雄。而AMD-ATI基于CrossFire技术的Radeon HD 3870x2表现失常,尤其是在开启反锯齿特效后,成绩下滑显著。
        反观其他6款单GPU产品,AMD-ATI的新一代Radeon HD 4800表现出色,尤其是Radeon HD 4870,能够与身价高出自己一倍的Geforce GTX 280相抗衡甚至在小幅领先。
        ● Unreal Tournament 3
  万众瞩目的Unreal Tournament 3终于出现了DEMO,这款基于Unreal Engine 3的最新第一人称视角竞技类游戏仍然基于DirectX  9,但在游戏整体画面表现上超越了现有大部分DirectX 10游戏,更让人高兴的是它在中档配置的PC上仍然能够保证非常好的流畅度的效果。

  >>游戏类型:DirectX9 第一人称射击游戏
  >>测试方式:黑夜室外/室内场景,沿同一固定路线跑完3次取平均值,Fraps计速
  >>画质设定:全部最高
  >>AA、AF设定:AA和AF均在控制面板中开启
        Unreal Tournament 3是一款基于自己开发的UE3引擎,该款游戏引擎的特点是画面细腻、色彩绚丽,即使在不开启反锯齿特效画面依然锐利,这就对显卡的本地显存容量提出考验。
        高分辨率高画质2560*1600 4X AA / 16X AF环节测试中,两家上一代单GPU产品纷纷被淘汰。反观其他产品,尤其是本文主角Geforce GTX 260和Radeon HD 4870,整体性能不相伯仲。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-7-31 12:39:51 | 显示全部楼层
        ● Assassin's Creed
        Assassin's Creed(刺客的信条)的3Dk逼真度是不亚于Crysis的一款游戏,值得一提的是这款游戏虽然同时发布了DirectX 10和DirectX 9版本,但是据官方生成同样平台下DirectX 10的游戏效能要高于DirectX 9,这主要是游戏并没使用DirectX 10特效,而仅是使用了DirectX 10部分API优化代码,从而减轻GPU和CPU负担,对于DirectX 10 PC游戏来说这是史无前例。

  >>游戏类型:DirectX10 第一人称冒险游戏
  >>测试方式:黑夜室外/室内场景,沿同一固定路线跑完3次取平均值,Fraps计速
  >>画质设定:可设置的全部最高
        在这款采用UE3引擎的刺客信条DirectX 10版测试中,AMD-ATI单GPU性能表现明显不如NVIDIA产品。Radeon HD 4870不仅以较大优势落后Geforce GTX 260,整体成绩仅能与Geforce 9800GTX+相匹敌。不过需要说明的是,除Radeon HD 3870之外,其他产品均能保证3个分辨率下的流畅运行。
      ● BioShock
  恐怖风格巨作BioShock的Xbox 360版本曾被国外著名游戏媒体评价为满分。这款游戏也在PC上以DirectX 10 API规格出现,操作流畅,画面效果华丽诡异、爆炸火焰烟雾效果逼近真实,并且游戏引擎的执行效率也相当高。

  >>游戏类型:DirectX10 第一人称视角射击游戏
  >>测试方式:黑夜室外/室内场景,沿同一固定路线跑完3次取平均值,Fraps计速
  >>画质设定:全部最高
        BioShock同样是一款采用UE3引擎的DirectX 10游戏,与虚幻竞技场3和刺客信条一样,在高分辨率和高画质下对显卡要求极高。
        不过很多读者会对测试中A卡的成绩产生疑问,为何这款属于NVIDIA“游戏之道”计划的游戏中A卡成绩如此之高,尤其是在开启反锯齿特效后。
       开启反锯齿特效后A卡成绩优异的主要原因是,A卡驱动开启的反锯齿设置在游戏中无效缘故,所以测得的成绩并非4款A卡在该游戏中的真实反锯齿性能。
       不过值得一提的是,在不开启反锯齿特效时Radeon HD 4870表现非常突出,性能堪比Geforce GTX 280,大幅领先Geforce GTX 260。
        ● Call of Juarez
   Call of Juarez是一款较新的DirectX 9西部题材第一人称视角射击游戏,以出色的HDR效果闻名。4月末,Call of Juarez的DirectX 10 Beta版本和测试包问世,它能够支持Radeon HD 2000系列和Geforce 8系列产品,是第一款正式发布的可运行DirectX 10游戏。它的测试内容是Flyby的过场,通过区域分别着重展示最新的3D特效,其中的重点包括几何着色器生成的粒子系统特效,复杂的材质纹理着色、AA+HDR等。

  >>游戏类型:DirectX10 第一人称射击游戏
  >>测试方式:白天室外/室内场景,开始场景一段游戏的自行录像回放
  >>画质设定:可设置的全部最高
        Call of Juarez(狂野西部)对显卡的频率及多线程并行处理能力十分敏感,所以在本环节测试中多GPU产品和高规格、高频率的两家顶级单GPU产品取得了优异成绩。而且在本环节中,Radeon HD 4870再一次战胜Geforce GTX 260,性能直逼Geforce GTX 280。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-7-31 12:41:52 | 显示全部楼层
        ● Company of Heroes
        Company of Heroes(英雄连)是一款即时战略类游戏。二战是几年来长盛不衰的3D游戏题材,Company of Heroes就是从101空降师诺曼底登陆后在欧洲战场血战题材入手的最新战略游戏,不过其自带测试并非针对即时战略的实际场景,反而更像第一人称视角游戏。

  >>游戏类型:DirectX10 即时战略游戏
  >>测试方式:游戏自带性能测试工具,内容为3D实时运算的剧情过场回放
  >>画质设定:全部最高
        英雄连是一款对显存容量十分敏感的游戏,所以拥有1024MB的新产品——Geforce GTX 280大获全胜。再分析Geforce GTX 260和Radeon HD 4870两款产品,由于前者显存容量占优所以在本章节测试中以绝对优势领先后者。
       ● Crysis
  跳票多时、万众期待的DirectX 10游戏大作Crysis,把目前PC 3D娱乐的视觉体验发挥到极致的游戏,大量使用DirectX 10的硬件功能,对显卡的负载也提升至空前水平。

  >>游戏类型:DirectX10 第一人称视角射击游戏
  >>测试方式:游戏自带GPU性能测试工具,为3D实时运算的飞行过场回放
  >>画质设定:全部最高
        Crysis这款无人不知、无人不晓的硬件杀手级游戏,在本次测试中对所有产品展开挑战。
        可以说仅有少数的几款顶级产品能够保证低分辨率下的流畅运行,不过用户可以适当调节画质选项以求获得更加均衡的游戏流畅度和画面效果。
        在本章节测试中Radeon HD 4870以十分微弱的性能优势领先Geforce GTX 260,这对于一款隶属“游戏之道”的游戏来说,Radeon HD 4870取得这样的成绩实属不易。
        ● PT Boats Knights of the Seat
  PT Boats Knights of The Sea游戏由Akella开发,它们曾经制作过Sea Dogs、Pirates of The Carribean等作品。这是一款即时战略游戏,游戏不但支持DirectX10,还支持AGEIA PhysX物理处理卡,游戏画面表现相对平庸,但对系统要求不低。

  >>游戏类型:DirectX10 即时战略游戏
  >>测试方式:游戏自带性能测试工具,内容为3D实时运算的战斗回放
  >>画质设定:全部最高
        PT Boats Knights of The Sea这款游戏对显卡的显存容量敏感,尤其是在开启高分辨率时现象突出。所有AMD-ATI产品在本环节测试中表现不佳,即使表现最好的Radeon HD 4870也仅能与Geforce 9800GTX+打成平手,而且值得一提的是A卡在2560*1600分辨率下表现异常,应该是驱动支持游戏不够完善。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-7-31 12:43:02 | 显示全部楼层
GTX260单挑HD4870 成绩分析
        也许前文的柱状图,能够让读者更加了解目前AMD-ATI和NVIDIA两家的全线高端产品性能,但是针对Geforce GTX 260和Radeon HD 4870二者比较并不直观,所以笔者在此将双方成绩汇总,方便大家对比二者性能。

Geforce GTX 260Radeon HD 4870性能提升幅度
3Dmark06
1280*1024 NA AA / NA AF15445151801.74%
1280*1024 4X AA / 16X AF12152120131.16%
1680*1050 NA AA / NA AF14446142721.22%
1680*1050 4X AA / 16X AF10864110581.79%
1920*1200 NA AA / NA AF13172130720.76%
1920*1200 4X AA / 16X AF9660100103.62%
1920*1200 8X AA / 16X AF808786536.99%
2560*1600 NA AA / NA AF10191101360.54%
2560*1600 4X AA / 16X AF746575270.83%
3Dmark Vantage
Performance9872873113.07%
High6142544712.76%
Extreme3936355910.59%
Call of Duty 4:Modern Warfare
1680*1050 NA AA / NA AF164.9156.15.64%
1680*1050 4X AA / 16X AF126.9123.13.09%
1920*1200 NA AA / NA AF136.7139.52.05%
1920*1200 4X AA / 16X AF105.6102.23.32%
2560*1600 NA AA / NA AF93.890.14.11%
2560*1600 4X AA / 16X AF68.761.112.43%
Half Life 2 Episode Two
1680*1050 NA AA / NA AF151.6149.91.13%
1680*1050 4X AA / 16X AF122.7117.64.33%
1920*1200 NA AA / NA AF130.3125.14.175
1920*1200 4X AA / 16X AF102.399.72.61%
2560*1600 NA AA / NA AF87.879.410.57%
2560*1600 4X AA / 16X AF65.960.98.21%
Need for Speed:ProStreet
1680*1050 NA AA / NA AF67.588.130.515
1680*1050 4X AA / 16X AF60.166.610.81%
1920*1200 NA AA / NA AF58.978.733.62%
1920*1200 4X AA / 16X AF54.260.110.89%
Unreal Tournament 3
1680*1050 NA AA / NA AF123.5118.74.04%
1680*1050 4X AA / 16X AF92.864.843.21%
1920*1200 NA AA / NA AF110.9111.60.63%
1920*1200 4X AA / 16X AF65.560.18.99%
2560*1600 NA AA / NA AF68.867.22.38%
2560*1600 4X AA / 16X AF36.129.920.73%
Assass'in Creed
1680*1050 NA AA / NA AF75.468.310.39%
1920*1200 NA AA / NA AF64.857.113.49%
2560*1600 NA AA / NA AF42.236.914.36%
BioShock
1680*1050 NA AA / NA AF101.9125.623.26%
1680*1050 4X AA / 16X AF58.3117.6%
1920*1200 NA AA / NA AF88.9108.922.49%
1920*1200 4X AA / 16X AF44.2103.7%
2560*1600 NA AA / NA AF54.465.520.4%
2560*1600 4X AA / 16X AF26.563.4%
Call of Juzrez
1680*1050 NA AA / NA AF45.951.512.2%
1920*1200 NA AA / NA AF39.244.313.01%
Company of Heroes
1680*1050 NA AA / NA AF79.463.125.83%
1680*1050 4X AA / 16X AF67.651.331.77%
1920*1200 NA AA / NA AF68.153.726.82%
1920*1200 4X AA / 16X AF55.842.331.91%
2560*1600 NA AA / NA AF44.637.718.3%
2560*1600 4X AA / 16X AF36.428.527.72%
Crysis
1280*1024 NA AA / NA AF28.630.56.64%
1680*1050 NA AA / NA AF22.123.66.79%
1920*1200 NA AA / NA AF18.119.36.62%
PT Boats Knights of The Sea
1680*1050 NA AA / NA AF62.450.423.81%
1920*1200 NA AA / NA AF57.747.421.73%
2560*1600 NA AA / NA AF45.618.8142.55%
        通过本环节有针对性的成绩对比我们能够发现,Geforce GTX 260和Radeon HD 4870性能不相上下、各有优点。
        在两款重量级显示芯片发布之前,GT200留给消费者的期待是前所未有。反观RV770,更多人则认为它是55nm制作工艺的极致体现。猜测永远是站不住脚的,当GT200和RV770来了以后,似乎大出之前的预料。
        且不论独孤求败的Geforce GTX 280,近期最受读者、媒体关注的当属Radeon HD4870和Geforce GTX 260,市场定价及定位逼迫它们必须一决高下。Geforce GTX  260代表了当今最先进的GPU技术,无论CUDA还是全新的统一渲染架构,而HD4870则将包括GDDR5在内最高规格产品提供给了消费者。Radeon HD4870和Geforce GTX 260的对决已无法避免,谁输谁赢已不重要,刺激的过程已经超越了最终的结果。
        为此,本站也采访AIC以及AIB代表厂商,如何看待本次GPU的巅峰对决。

        AIC——HD4870绝非ATI安身立命之本

       不得不承认Radeon HD4870是一款让人值得兴奋的产品。由于AMD提前采用了55nm制造工艺,其上一代Radeon HD3000系列并没有完全发挥出优势。Radeon HD4000系列却惊人的将流处理器数量提升到了800个,并引入了全新的GDDR5显存。这也是影响其性能的根本。
        问题同样出现在AMD“大跃进”式的显卡设计理念,Radeon HD4870公版默认频率达到750MHz,更有甚者号称欲推出“RV770XTX”,即核心频率有望接近1GHz。首先,GDDR5作为行业内少数几家厂商可以提供的显存颗粒,其产量相当让人担忧。其次,如此大胆的“默认频率”设置也会衍生出一定良品率问题。
        在我们看来,犹如当年GDDR4的昙花一现。搭配GDDR5的Radeon HD4870并非AMD的安身立命之本,未来我们不妨大胆设想搭配GDDR3显存HD4870的出现。
        AIB——竞争给了消费者实惠
        花费2000元以上的费用去买一块显卡,对于大部分消费者来讲还是有些昂贵。好在有AMD这样的厂商,相信消费者不久便可以买到“还算实惠”的中高端显卡。这是笔者与某AIB厂商谈话中获悉的。
        从发布至今,基于GT200核心设计的终端产品经历了幅度较大的价格调整。从终端品牌来看,实际上的降价幅度远超过了官方给出的数据。从目前市场和价格来看,Radeon HD4870和GeForce GTX260不约而同的进入了“狭路”。在直接对性能产生影响的对决中,AMD方面用核心整合800个数量级的流处理器及搭配GDDR5显存证明,AMD的产品更加适合实际应用。例如游戏、物理运算等等。当然,在常规测试软件中,AMD在驱动方面还需要逐渐完善。相信每月更新一次的催化剂会很快解决此问题。
        还是回归到为消费者提供实惠的产品,相信在短期竞争中,双方的利润率会逐步下降。消费者买到低于2000元的Radeon HD4870和GeForce GTX260并不是梦想。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|Archiver|手机版|萤火虫

GMT++8, 2024-12-26 18:06 , Processed in 0.414353 second(s), 6 queries , File On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表