游戏烧包们,准备好钱吧!

可乐罐罐

普通会员
2003-06-02
3,344
0
0
NVIDIA CEO Jen-Hsun 2004年3月7日的一番演讲给笔者留下了深刻的印象,当时他的题目是“Networked Digital Media”(网络数字媒体),当然让我铭记于心的自然并非他那一口流利的英语,而是nVIDIA 想统治桌面多媒体市场的野心。当时他提到nVIDIA 将致力于发展网络数字媒体的三大套件:图形和视频处理单元-GPU;网络、媒体和连接处理单元-MCPs ;数字媒体软件-ForceWare 。而数字媒体中心最重要的就是GPU ,它充当了数字媒体引擎的作用,提供了可编程渲染、高清晰视频处理、图像处理等与我们视觉息息相关的功能,而这也是多媒体的主要形式之一,音频与视频等媒体的交互就是多媒体嘛。





由Jen-Hsun:黄仁勋在上个月关于网络数字媒体的演讲,我们也可以看出nVIDIA 在图形和视频领域的目标。可以这样认为,GeForce FX 5900之前的GPU 主要着重于游戏体验,被称为图形加速卡/3D加速卡/图形协处理器;而NV40:GeForce 6800 后的GPU 则为多媒体功能作了更多的优化,比如除了3D游戏所需要的可编程渲染外,还提供了高清晰视频处理、图像处理等更多与我们生活关系密切的功能,这点在我们稍后的技术细节中将能够体现出来。

NVIDIA 在4月14日正式发布了这一划时代的GPU,它并非是简单的3D游戏加速卡而已,更是nVIDIA 网络数字媒体的引擎,重登性能宝座的秘密武器,由于规格和性能的超前,恐怕它这次是想把所有的竞争对手都置于死地,未免太残忍了点。OK,现在首先带大家领略一下这款让万众期待的NV40,究竟有什么魅力。

 

可乐罐罐

普通会员
2003-06-02
3,344
0
0
NVIDIA CEO Jen-Hsun 2004年3月7日的一番演讲给笔者留下了深刻的印象,当时他的题目是“Networked Digital Media”(网络数字媒体),当然让我铭记于心的自然并非他那一口流利的英语,而是nVIDIA 想统治桌面多媒体市场的野心。当时他提到nVIDIA 将致力于发展网络数字媒体的三大套件:图形和视频处理单元-GPU;网络、媒体和连接处理单元-MCPs ;数字媒体软件-ForceWare 。而数字媒体中心最重要的就是GPU ,它充当了数字媒体引擎的作用,提供了可编程渲染、高清晰视频处理、图像处理等与我们视觉息息相关的功能,而这也是多媒体的主要形式之一,音频与视频等媒体的交互就是多媒体嘛。





由Jen-Hsun:黄仁勋在上个月关于网络数字媒体的演讲,我们也可以看出nVIDIA 在图形和视频领域的目标。可以这样认为,GeForce FX 5900之前的GPU 主要着重于游戏体验,被称为图形加速卡/3D加速卡/图形协处理器;而NV40:GeForce 6800 后的GPU 则为多媒体功能作了更多的优化,比如除了3D游戏所需要的可编程渲染外,还提供了高清晰视频处理、图像处理等更多与我们生活关系密切的功能,这点在我们稍后的技术细节中将能够体现出来。

NVIDIA 在4月14日正式发布了这一划时代的GPU,它并非是简单的3D游戏加速卡而已,更是nVIDIA 网络数字媒体的引擎,重登性能宝座的秘密武器,由于规格和性能的超前,恐怕它这次是想把所有的竞争对手都置于死地,未免太残忍了点。OK,现在首先带大家领略一下这款让万众期待的NV40,究竟有什么魅力。

 

可乐罐罐

普通会员
2003-06-02
3,344
0
0
技术规格

GeForce 6800 除了把一些原来GeForce FX 系列显示卡的技术规范进行升级外,还引入了一些新的特征。下面让我给大家详细地进行介绍:
1. 超标量16-Pipe GPU 架构
2. CineFX 3.0引擎
3. 首款On-Chip 视频处理器
4. UltraShadow II 技术
5. 高精度动态范围(HPDR)技术
6. Intellisample 3.0 技术
7. 统一驱动架构(UDA)
8. nView 多显示技术
9. 数字振动控制3.0
10. 高速GDDR3 内存接口
11. 具备高级内存控制的256-bit 内存接口
12. 128-bit 工作室精度运算
13. 全速32-bit 色彩精度
14. 完全硬件支持MPEG
15. 先进的自适应de-interlacing
16. 视频缩放和过滤
17. 整合TV编码器18.完全支持DirectX 9.0C,并进行优化
19. 完全支持OpenGL 1.5 ,并进行优化
20. 支持AGP 8X
21. 支持PCI Express
22. Dual 400MHz RAMDACs
23. Dual 单连接DVI
24. 0.13微米制造工艺



CineFX 3.0 渲染架构

· 顶点渲染引擎(Vertex Shaders)

1. 支持Microsoft DirectX 9.0C 规范的Vertex Shader 3.0
2. 置换贴图技术
3. 顶点频率的流分割
4. 无限长的顶点程序

· 像素渲染引擎(Pixel Shaders)

1. 支持Microsoft DirectX 9.0C 规范的Pixel Shader 3.0
2. 支持全像素分支
3. 支持多目标渲染(MRTs)
4. 无限长的像素程序
 

· 下一代纹理引擎

1. 每个渲染通道具备16个纹理
2. 支持16-bit和32-bit 浮点格式
3. 支持non-power的两个纹理
4. 支持Gamma 纹理的sRGB 纹理格式
5. DirectX 和S3TC 纹理压缩

· 渲染管线具备128-bit 工作室质量的浮点精度,并完全硬件支持32bpp、64bpp和128bpp渲染模式

NVIDIA 高精度动态范围(HPDR)技术

· 通过管线完全的浮点支持
· 浮点过滤功能,改进了运动图像的质量
· 浮点纹理功能,带来了更清晰的图像,表现更多的细节
· 浮点帧缓冲混合,能带来更多特殊的效果,比如运动模糊和浮雕
· 新的rotated-grid 消除锯齿技术
· 新的roteted-grid 消除边缘锯齿技术,图象边沿具备更好的质量

Intellisample 3.0 技术

· 先进的16x 各向异性过滤
· Blistering-Fast 和压缩性能
· 支持高分辨率和帧率下的颜色、纹理和Z-data 等无损压缩算法
· 快速Z清除
· 高分辨率压缩技术(HCT),通过先进的压缩技术,提升了在高分辨率下的性能

Ultrashadow II 技术

· 可以提升需要生成大量即时阴影游戏的性能,比如id Software 的DoomIII
 

可乐罐罐

普通会员
2003-06-02
3,344
0
0
先进的核心

· 超过2.2亿个晶体管· 支持PCI Express X16技术
· 提供向后的兼容,支持PCI Express 高速互连(HSI)技术
· 完全支持AGP 8X,包括快写和边带寻址

· 支持GDDR3 内存
· 256-bit 先进的内存接口
· 0.13微米制造工艺
· 先进的热量管理和监控
· 40mm x 40 mm,BGA 倒装晶片封装

先进的视频显示功能

· 独立的On-Chip 视频处理器
· MPEG 视频编码和解码
· WMV9 解码加速
· 先进的自适应de-interlacing
· 高质量的视频缩放和过滤
· 整合NTSC/PAL TV 编码器
· DVD和准HDTV MPEG-2 编码,最高1920x1080i 分辨率
· Dual 400MHz RAMDACs ,支持最高2048x1536 @85Hz
· Dual DVD 端口,可以连接到外部TMDS 转接器和外部TV 编码器
· 支持Microsoft 视频混合渲染(VMR),能够在全部视频质量和特征的情况下支持多视频窗口
· Video-in 支持VIP 1.1接口
· 完全兼容nVIDIA nView 多头显示技术

nVIDIA 数字振动(DVC)3.0

· DVC 颜色控制

· DVC 图像锐利控制


GeForce 6800

GeForce6800(左) 和GeForce FX 5900(右)
 

可乐罐罐

普通会员
2003-06-02
3,344
0
0
先进的GeForce 第六代

虽然我没有跟大家提到GPU的核心频率和显存频率,但从以上提到的规格,都能大概明白怎么回事了,GeForce 6800 显示卡将能够大大增加PC游戏的性能、家庭多媒体的体验。例如它是首款具备了超标量16-pipe 架构,并且支持目前最快速GDDR3 内存的显示卡,这些革命性的GPU设计,能够带来更佳的图像质量,还有更高的游戏帧率。与前代GPU 相比,GeForce 6800 可以提供8X 的浮点渲染能力,2X的顶点处理能力,因此可以大大地增加3D图形处理的性能。此外,GeForce 6800 的UltraShadow II 技术,可以增强某些对阴影比较敏感程序的性能,比如id software 的DoomIII ,而且它的阴影处理能力是先前版本UltraShadow 的4X 。

一款GPU 空有强悍的性能,如果没有用武之地的话,那将是非常可悲的,不过nVidia 这次似乎是具备了满腔的壮志、胸有成竹。首先是同时参加发布GeForce 6800 的厂家空前鼎盛,达到了历史最大规模,其次是某些超重量级的游戏都为它作了优化,比如Valve 的Half-Life2和GSC Gamer 的S.T.A.L.K.E.R:Shadow of Chernobyl ,当然还有万众期待的id software 的DoomIII 。据笔者所知,id software 掌门人John carmack 目前使用的显示卡正是NV40 。不过目前的游戏想要发挥出最大的性能,自然少不了Microsoft 的DirectX ,现在nVIDIA 已经支持到了DirectX9.0C ,其中DirectX9.0C 与之前版本的最大区别就是加入了Shader Model 3.0 ,支持没有限制的可编程性和程序长度,这里有个故事想跟大家分享。
当年GeForce FX 的霸气和万众期待是让业界都为之振奋的,可惜的是,根据对产品的测试,却发现性能不尽人意,而且图像质量欠佳。之所以会出现这样的情况,其一是由于台积电0.13微米制造工艺不成熟,导致了良品率过低、发热量过高; 其二是由于采用了DDRII 显存,要知道当时DDRII 内存的生产工艺也并不成熟,导致了发热量过高。最后也是比较重要的原因,当时nVIDIA 由于为微软XBOX 提供显示芯片,导致收入盈利率较低,想与微软算账,使得与微软的关系处于冷战时期,关于某些技术细节,其实就是DirectX 9.0 方面,微软并没有给nVIDIA 什么优惠。根据黄仁勋的说法是,“由于nVIDIA 设计芯片的时候,没有能够获得DirectX 9.0的核心技术,因此GeForce FX 对DirectX 9.0 的支持,很多都是猜测的,导致 某些技术规格大大超出了DirectX9.0 ,因此在测试的时候,比较吃亏。又是CEO 出来澄清问题,黄说,“这次GeForce 6800 将完整地支持DirectX9.0C,不多也不少,因此性能和图像质量都得到了保证”,看来nVIDIA 和Microsoft 又回到了蜜月时期。另外,目前关于nVIDIA GeForce 6800和新ForceWare 驱动测试的结果,也获得了3Dmark03 测试软件官方的认证, 认定为有效,看来nVIDIA 也真正再次获得了业界的支持,当然这和它放下了架子有关。

OK,让我们再回到技术规格的问题,nVIDIA CineFX3.0引擎,在GeForce FX 的时候被首次引入,GeForce FX5900 升级到了2.0版本,现在当然是理所当然地变成了3.0版本,它允许程序员和开发者们创建更高级的可视化效果。其实nVIDIA 在引入CineFX 的时候,一直说,“像看电影那样玩游戏”,而CineFX 正是电影化效果的缩写,Cine=cinema ,FX = effect ,这句话是笔者猜测的,不知道大家以为是否这样子呢?CineFX 3.0 与之前的版本相比,支持更多先进的技术,比如置换贴图,能够创建独特的3D特性和物体,允许开发者在独立的顶点基础上,开发3D模型。通过该项技术,开发者能够在特殊环境,建立具备独特光照的超真实模型。此外,通过Shader Model 3.0 和先进的CineFX 3.0 引擎,游戏开发者能够创建复杂逼真的效果,比如皮肤、头发和眼睛阴影效果,由于GeForce 6800 GPU 的处理能力,这些不可置信的效果都能够实现。

GeForce 6800 GPU 还是首款构建了nVIDIA 高精度动态范围(HPDR)技术的显示卡,使得3D游戏图像质量进一步接近电影效果。NVIDIA 的HPDR 技术,是基于被工业Light&Magic使用的OpenEXR 基础上完成的。




nVIDIA 3个demo 的截图

高性能,高精度效果

过去大家都说,nVIDIA 的显示卡就是快,但图像质量只能算一般,当然nVIDIA 自己其实也深深明白这些诟病,并在不断努力着。GeForce 6系列显示卡可以说是nVIDIA 迈出的艰巨第一步,由于使用了更多的新技术,使得在游戏和其它3D实时应用中能够表现出更好的效果。革新的架构,使得GPU硬件有足够的能力创建细节更丰富、更动人的图像。

超标量的设计

nVIDIA GeForce6 系列显示芯片包含了全新的超标量渲染架构,与传统的架构相比,每个时钟有两倍的处理能力。与单渲染、非标量的设计相比,它自然可以获得显著的性能提升。此外,该架构还提供了完全的32-bit 浮点精度,不过仍然允许工作在16-bit 模式,因此开发者可以根据实际的需要,作出不同的选择--是需要更高的图像质量,还是性能。超标量设计还增加了可编程的灵活性、提升了性能,32-bit 模式使得能够进行更加复杂的运算和像素操作,为最前沿的游戏和其它实时交互程序生产更加完善的图像质量。
 

可乐罐罐

普通会员
2003-06-02
3,344
0
0
NVIDIA 高精度动态范围技术

不知道大家是否想过,其实人类的眼睛在低光线强度的时候会更加敏感,比如在黑的阴影底下,会比高强度的光线,看到更多的细节。在现实中大家可能没有留意,但作为开发者,就不能不考虑这些事情了,他们要尽可能地利用你在现实中习惯的弱光线、纹理和错综复杂的颜色,并把它们应用到游戏中,因此在游戏中你就能够完全沉醉于其中。


Paul Debevec 的图像
上面的图像是使用高动态范围渲染而生成的,大家注意一下光线的质量;几乎就如相片般的逼真,太阳的光线通过窗口,并且进行发射,而黑暗中的图像则表现出了丰富的颜色细节。


不过直到目前为止,能带来如照片般逼真图像的高动态范围(HDR)渲染的能力,仍然受到显示卡硬件的限制。NVIDIA 的高精度动态范围(HPDR)技术,是基于工业的Light + Magic 标准的OpenEXR,硬件的阻碍大大减少,现在开发者能够更多地从高级渲染、混合、过滤和纹理中受益,可以创建彩虹、运动模糊和软阴影等更精确的效果。GeForce 6 系列GPU 新的旋转格子抗锯齿技术能够更精确地描绘像素的颜色。

CineFX 3.0 引擎

假如我们能够像看电影一样玩游戏,那该是多么惬意的事情呀,nVIDIA 也一直在跟我们宣扬这样的思想,但我们想想就好了,因为这根本没法在短时间内实现。我觉得John Carmack 的说法会更加理智些,“现在达到这个目标的症结不仅在硬件,游戏本身的设计也变得更加困难,我们甚至要花费4、5年的时间,才能够更新游戏引擎了。另外,电影和游戏是两个完全不同层次的概念,要知道电影里面的特效是设计师们一帧帧地进行渲染的,而游戏则是大量即时生成的效果,其数据的处理量根本没法比较”。不过当然,nVIDIA 的超前意识还是让我们非常开心的,而CineFX 引擎确实在往这方向努力 着。

CineFX3.0的技术要点

1. 无限长的渲染程序

CineFX 3.0 在渲染程序上再没有硬件的限制。先前,为了适应程序长度的限制,复杂的效果需要分成一系列渲染程序的组合。在某些情况下,由于程序的长度过长,硬件没法渲染,造成性能下降,减慢了游戏的运行速度,还有使得实际效果不尽人意。现在,由于不需要再考虑渲染程度的长度,因此能够写出更复杂的特效,游戏也变得更精美了。不过,在程序代码变长之后,需要花费硬件更多的时间去处理它,不过随着硬件性能的提高,这个问题很快就能够得到解决,而CineFX 3.0 也对长程序作出了优化,确保能够以最快的速度运行。

2、动态流控制

为了让程序员更有效率的撰写渲染程序,NV40增加了一些循环/分支选择 ,子程序调用/返回函数。没有长度限制,增强了流控制,让程序员获得更多的自由,随意发挥,从而有可能写出更具创意的游戏。增加的流控制包括以下的功能:

· 新指令(IFC/BREAKC,IF/BREAK/CALLNZ)

· 用于返回地址和地址寄存器的统一8段堆栈:分支、调用;Push、Pop地址寄存器

· 条件代码选择
3、置换贴图

CineFX 3.0 允许顶点纹理处理,为场景的每个构件、表面和特性提供更佳的深度和真实感。置换贴图的出现,使得程序员只需要用极低的计算消费,就能够让模型表现更多的细节。


使用了网格加亮的3D恐龙头部模型(左),和应用了材质颜色后的样子(右)

置换贴图被加入到图12网格模型后的样子


我们见到,在置换贴图被加入到模型的网格之后,恐龙的头部表现出了凹凸不平,还有丰富的细节。细节反映了光源的角度,能够生成更真实的模型,而这些只需要极少的计算消费。

4、顶点频率的流分割

特效能够更有效率地被应用到场景物体或者多个角色上面,为不同的模型提供各自的特征。

5、多目标渲染(MRT)技术

MRTs 允许延迟渲染,有什么用呢?它可以让所有的几何渲染结束后,再通过场景消除多次处理。由于避免了处理图像不可见部分像素的时间,因此能够产生如照片般真实的光照。
 

可乐罐罐

普通会员
2003-06-02
3,344
0
0
On-Chip 视频处理器

前面我们已经提到了,nVIDIA 的野心就是充当多媒体中心的霸主地位,多媒体中心对于DVD 回放、电视编码和解码,并且在PC 支持高清晰度的电视都是必不可少的。以上提到的这些功能,CPU 都没有能力单独完成,因此NVIDIA 最新的GPU 首次引入了视频处理器的概念,其实也就是集成了对视频处理的支持。

NVIDIA GeForce 6系列GPU 包含了可编程的视频处理器,能够支持高质量的视频特征。之前很多需要CPU或者第二块芯片才能够完成的工作,现在都交由GPU 负责,并提供很多On-Chip 的加速功能。现在GeForce 6 系列GPU 实际上同时充当了玩游戏的3D GPU ,还有进行视频回放、处理的视频处理器。GPU 的视频处理器主要处理两类型视频:回放(解码),和记录模拟视频并转换为定义的数字格式(编码)。GeForce 6 不仅支持最常见的MPEG-2编码和解码格式,还支持未来DVD 规范的Windows Media Video9(WMV9) 格式 。

视频解码

视频解码最至关重要的功能之一就是视频处理,而MPEG-2 又是当前DVD 回放的格式。通过运动补偿和IDCT 等先进的技术,GeForce 6 GPU 能够有效地进行MPEG-2 解码,把CPU 从视频回放的繁重负荷中解放出来。当然由于硬件支持解码,视频质量也更平滑、细致,并减少了电源的消耗。

GeForce 6 的另外一个有利因素是它具备完全的可编程能力,并能够处理WMV9和MPEG-4 等格式。NVIDIA 的运动补偿引擎,能够提供多种视频格式的解压缩加速,其中包括了WMV9、MPEG-2、H.264和DiVX 。在进行MPEG-2 运动补偿的时候,NVIDIA 视频引擎能够执行大部分需要较多运算的工作,而留下最轻松的工作给CPU 。

视频编码

GeForce 6 系列GPU 还具备了硬件的视频编码加速功能。传统上来说,视频编码是非常困难,且需要消耗大量时间的进程,GeForce 6 包括了一项称为运动估计引擎的技术,能够在低比率的情况下提供更佳的视频质量,更少的CPU占用率,提升了系统的性能。

UltraShadow II 技术

精确的阴影能在游戏中生成更逼真和让人可信的场景,光源、对象和特征都能够在精深的编程中实现,做到复杂的互动;但在游戏中的每帧,每个光源都必须与相关的物体进行分析,因此会降低PC的性能和游戏的可玩性。nVIDIA GeForce 6 系列GPU 支持UltraShadow II 技术,构建更佳的视觉效果,并且与周围的数字环境区分开来,由于它能够有效地计算阴影的生成,因此可以提高对阴影敏感程序的性能,比如DoomIII 。其实说也奇怪,nVIDIA 不止一次地提到UltraShadow II 技术可以提高DoomIII 的性能,我想除了id software 游戏的魅力外,还更多的是由于id software 的建议才会如此做吧, 竟然id software 在游戏界中的地位无人可撼,该技术就像专门为id 设计似的。

在需要更多通道光照和阴影计算的场景,使用UltraShadow II 硬件就能获得更明显的性能增益,其中复杂场景的效果最为显著。在每个场景大部分可见目标都使用多光源的游戏,比如id software 即将发布的DoomIII 游戏,将能够获得根本性改进的执行速度。前段时间,很多媒体都提到即使连GeForce FX 5900 运行DoomIII 都会有卡的感觉,而现在GeForce 6 就像为其而优化似的,UltraShaow II 技术可以提高DoomIII 的游戏帧率。根据nVIDIA 公布的数据,在进行大量阴影处理的时候,UltraShaow II 能比前代版本提供4倍的性能。


DoomIII 的游戏截图,需要进行大量的复杂光源处理,看看场景的光照和影子,效果非常逼真

传统上来说,UltraShadow II 通过放弃不必要的区域,比如不可见部分,从而让开发者更迅速地计算出影子。通过定义场景的界线部分(叫做depth bounds),或者着重计算光源最易受到影响的区域,开发者能够加速阴影的生成过程。此外UltraShdow II 还能够和Intellisample 3.0 很好地协作,带来更好的边沿抗锯齿效果。


DoomIII 的游戏截图,使用UltraShaow II 技术能够创建如相片般逼真的图像


Intellisample 技术

过去nVIDIA 的显示卡都被人称呼为速度奇快,而显示质量极差的怪物,而自从GeForce FX 开始图像质量就获得了改观,GeForce 6 的发布,无疑又上了一个新的台阶。抗混淆是平滑3D图像边缘,消除锯齿的主要途径。GeForce 6 GPU 包含了Intellisample 3.0 ,使用旋转格子抗混淆技术,在平滑了多变形边缘的同时,又保证了一定的帧率。GeForce 6系列GPU 支持新的16X 各向异性过滤,带来更优越的图像质量,此外Intellisample3.0 利用nVIDIA 高精度动态范围(HPDR)渲染技术,带来了更好的光照和阴影效果。在HPDR 技术下,用户能够体验到更宽强光照和暗光条件下的图像细节和精确度。




Intellsample 处理还使用了伽玛矫正采样,它考虑到了眼睛和显示器感觉光和颜色的根本物理区别,使得过渡更平滑和自然。第5和6代GPU 还包括了先进和完全透彻的无损深度z-buffer和颜色压缩技术,这些技术可以大大节省带宽,因此在无需降低帧率的情况下,保证了图像的质量。
 

可乐罐罐

普通会员
2003-06-02
3,344
0
0
GDDR3 内存接口
DDRII 与DDRI 相比,最大的优势是可以获得更高的时钟频率;DDRIII 与DDRII 的优势,也是在获得更高的频率,当然高频率带来的发热量提升,大家也知道吧。GDDR 与普通DDR 内存的区别是为显示芯片中的图形数据传输作出优化,比如支持更大的块处理,因此能够获得更优质的速度。不过大家要清楚一点,由于GDDR 内存有项称为on-die termination 的技术,会使发热量增加,大家从很多显示卡上面覆盖着厚厚的散热片就了解吧,而普通PC 内存是没有的。

由于高端显示卡对频率和性能的需求更加迫切,而DDRII 内存的表现不尽人意,当时由于位宽仅为128-bit ,且timing 潜伏期之长大家是知道的,因此造成GeForce FX 5800 Ultra 成了鸡肋。于是ATI 和nVIDIA 干脆在它们的R420和NV40 上直接跳到了GDDR3 内存。

GDDR3采用了0.11微米制造工艺,能耗仅为原来的一半,而时钟频率也从667MHz 起跳,预取数据大于4-bit,寄生干扰也得到了有效的减少。




GDDR3 除了以上的优点,装配需要的配件更少,约束条件更低,综合这些优点,可以生产性能更出色、价格更低廉的显示卡。当然,GDDR3和GDDR2相比还有一些不同的地方,比如GDDR3采用的是单端设计,没有分开数据输入和写出通道,采用了基于电压的“伪开漏”界面技术(pseudo-open drain),不过它的电压仍然与GDDR2一样,为1.8V。

为什么厂商会看好GDDR3?很明显,除了在性能上能得到提升,还能更好地控制成本,厂商的利润也能明显提高,用户也可购买更实惠的产品。我们拿采用GDDR3的FX5700Ultra来看,该显卡显存采用了三星GDDR3 2ns颗粒,容量为128MB,位宽128bit,并且使用了4颗显存颗粒。从这里分析,我们可以得出一个结果:我们知道,先前采用GDDR2的FX5700Ultra使用了8颗4M×32bit的颗粒。对比采用GDDR3的FX5700Ultra,显存编号为K4J55323QF-GC20,从编号我们知道显存颗粒为4 bank 2Mx32bit,也就相当于8Mx32颗粒。这样一来,只需使用了4颗显存就能达到128M/128bit的配置,其最大的优势就是能较好地控制成本。即使现在GDDR3显存的价格较高,由于单颗容量上的优势(目前GDDR2颗粒只有4M×32bit的规格),成本上涨可以控制在10%-20%之间。此外,采用8颗GDDR2显存芯片需要消耗28W功耗,造成了巨大的发热量,减少到4颗后发热量明显降低。


NV40 的核心

GeForce 6800 Ultra 核心的时钟频率为400MHz ,具有6.4GB/s 的峰值纹理填充率,几乎相当于Radeon 9800XT 3.3GB/s 的2倍,而比自家GeForce FX 5950 Ultra 也高出40% 。NV40 图形核心使用了IBM 0.13 微米制造工艺,包含2.22亿的晶体管,而Pentium 4EE 也仅为1.78亿个而已。此外NV40 也使用了IBM 专业的A01 硅技术,这点在前面显示卡都有明确的标示。


GeForce 6800 使用的是GDDR3 内存,不过首次使用GDDR3 内存的却是GeFoece FX 5700 。由于NV40 是最高端的显示芯片,因此Ultra 版本搭配了Samsung 的256MB GDDR 内存,核心频率为550MHz(有效频率1.1GHz),理论上可以提供超过35.3GB/S 的峰值内存带宽。

搭載了16个完美功能的象素管道


NVIDIA的新款GPU“NV40”=“GeForce 6800”终于在人们的翘首期待中粉墨登场。它芯片上集成的晶体管数目达到了2亿200万,DDR3内存(1.1Gtps),支持PS3.0、VS3.0,DirectX 9 Programable Shader 3.0,支持OpenGL,内建HSI(高速连接),是ATI X800最大的竞争对手。

简单地说也就是NV40不但改良了NV3x系列过去出现的所有弱项,还最先支持Shader 3.0,这个成绩不但可以让我们看到新一代显卡王者的魅力,更让我们感觉到GeForce6时代的来临是多么的势不可挡。
 

AD仔

社区贡献者
2003-06-02
16,623
0
0
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

偶从不玩电脑游戏