导航:
首页>硬件>显卡>评测>正文
|
参数对比
基实显卡的好坏要往深入的地方分析还得从GPU的架构说起,以前的GPU因为采用的是分离式的架构,所以经常会出现数据分配问题,极大的影响了实际游戏运行中的渲染效率。Direct X10的出现改变了这一情况,它最大的改进便是引入了统一渲染架构(unified shader),所谓统一渲染架构,最容易的理解方式就是Vertex Shader(VS)与Pixel Shader(PS)处理单元不再分离,即以前常说的像素渲染管线和顶点着色单元。
新的架构抛弃了传统的Vexter与Pixel Shader独立设计,通过一个统一执行单元(流处理器Stream Processors)运算游戏画面的所有Shader数据(包括Vexter与Pixel数据),这样无论几何图形(VS单元负责处理)过于复杂、或者像素渲染(PS单元负责处理)过于复杂,GPU都能有效的合理分配处理单元,有效的分配硬件资源。所以DX10以后的显卡,流处理器的数量一定种度上决定了GPU的档次高低,GPU的档次高低决定了显卡档次的高低。
| Radeon HD 3600、GeForce 8600Series规格对比列表 | ||||
| Radeon HD 3650 | Radeon HD 3690 | GeForce 8600GT | GeForce 8600GTS | |
| 核心代号 | RV635 | RV670 | G84 | G84 |
| 制程工艺 | 55nm | 55nm | 80nm | 80nm |
| 流处理器数量 | 120 | 320 | 32 | 32 |
| 核心频率 | 725MHz | 668MHz | 540MHz | 675MHz |
| 显存频率 | 1400MHz DDR3 | 1600MHz DDR3 | 1400MHz DDR3 | 2000MHz DDR3 |
| 显存大小 | 256 | 256 | 256 | 256 |
| 显存位宽 | 128bit | 128bit | 128bit | 128bit |
| 接口标准 | PCI Express 2.0 | PCI Express 2.0 | PCI Express 1.0 | PCI Express 1.0 |
| DirectX支持版本 | DirectX 10.1 | DirectX 10.1 | DirectX 10 | DirectX 10 |
| 高清播放 | UVD | UVD | PureVideo HD | PureVideo HD |
| 节能技术 | PowerPlay | PowerPlay | 无 | 无 |
| 2600XT GDDR4 | 2600Pro GDDR3 | 2400XT GDDR3 | 8600GTS GDDR3 | 8600GT GDDR3 | 8500GT GDDR3 | |
|---|---|---|---|---|---|---|
| 芯片代号 | RV630 | RV630 | RV610 | G84 | G84 | G86 |
| 芯片工艺 | TSMC 65nm low-k | TSMC 65nm low-k | TSMC 65nm low-k | TSMC 80nm low-k | TSMC 80nm low-k | TSMC 80nm low-k |
| 晶体管数量 | 390M | 390M | 180M | 290M | 290M | 210M |
| 核心频率 | 800MHz | 600MHz | 700MHz | 675MHz | 540MHz | 450MHz |
| shader频率 | 800MHz | 600MHz | 700MHz | 1450MHz | 1200MHz | 900MHz |
| Processor | 24×Vec | 24×Vec | 8×Vec | 32×Sca | 32×Sca | 16×Sca |
| TMU(TA) | 8 | 8 | 4 | 16 | 16 | 8 |
| TMU(TF) | 10 | 10 | 5 | 16 | 16 | 8 |
| ROP | 4 | 4 | 4 | 8 | 8 | 4 |
| 浮点运算能力 | 192GFlops | 144GFlops | 56GFlops | 106.88GFlops | 85.5GFlops | 43.3GFlops |
| 显存规格 | 128bit | 128bit | 128bit/64bit | 128bit | 128bit | 128bit |
| 显存频率 | 2200MHz | 1400MHz |
1400MHz |
2000MHz | 1400MHz | 800MHz |
| 显存容量 | 256MB | 256MB | 256MB | 256MB | 256MB | 256MB |
但是即便是统一架构,但是NVidia与ATi各自实现统一架构的方式还是不一样的。其实统一渲染架构并不是简单的将PS单元和VS单元整合在一起,而是将GPU的角色由单纯为游戏渲染提升至游戏处理中心的理念,统一架构引擎设计更适合异类运算工作,比如物理运算等等,让显卡的应用范畴大幅提升。
G80有八组统一渲染单元,G84只是减少到二组,每组16个SP
从流处理器的数量上来看,ATi显卡的SP数量远远高于同档次NVidia的显卡。从架构上分析,HD 3650架构沿用了R5XX的架构,属于统一渲染单元打包的形式,每统一渲染单元具有4D+1D的规格,每流处理器可以处理1D的数据,而其中一个流处理器具有执行超越指令的功能,这4D+1D的流处理器可以完成一个完整的统一渲染单元功能,也就是说,换算下来HD 3650的统一渲染单元数量为24个
对于HD 3650显卡,虽然名称上更换为HD 3XXX,不过核心仍然是基于原来的HD 2600,仅仅是在工艺上获得了改进,好处在于可以获得相对较高的频率,同时也有利于成本和功耗。而8600GT虽然没有改进工艺,不过由于核心架构的设计也可以获得足够的性能,核心与处理器的分频设计让它的性能提升更有潜力了。
反观NVIDIA方面的8600GT,虽然工艺落后,但是其默认的统一渲染单元已经达到了32个,是1D纯标量设计,单元运算性能不如AMD的4D+1D矢量统一渲染单元,但是它可以将数据全部拆分成为标量进行运算,效能方面反而更胜一筹。此外,NVIDIA显卡还加入了独特的光栅引擎设计,包含反锯齿AA、HDR和各向异性过滤AF。直观地说,好处就在于能使显卡的抗锯齿效率倍增。
| 相关文章 |
|
显 卡 |