下一代图形显示技术,Are you ready?

本文作者:admin       点击: 2004-07-12 00:00
前言:

2004年5月份,推迟了近半年的NV40和R420的面市让众多翘首以盼的图形、游戏爱好者激动不已。相较于CPU等PC配件的发布,显卡新品更能直观而感性的激发大家的兴致。
另外,本年度最具悬念的DOOM3正式版也终于要与广大游戏玩家见面,GDC2004上面微软也放出了下一代DX规范的一些内容,NV、ATi更是发布对DX 9全面支持的下一代显示芯片……新的一轮图像革命如箭在弦……
<b>连接的桥梁—DirectX</b> 
(应用程序接口)是用来连接应用程序和操作系统,实现对计算机硬件控制的纽带。DirectX就是微软嵌在Windows操作系统上的API。DirectX在微软的大力扶植之下,已经成为当前显卡性能的一大技术指标。DX的发展同时也影响着显卡芯片的技术走向。没有好的API,再优秀的硬件技术也无法和软件进行协同,更无法呈现给用户精美的视觉享受。
经过2003年一年的筛选,DirectX 9.0和AGP 8×已经得到了广大厂商和用户的支持。未来的市场将是DirectX 9.0的天下。NV和ATi纷纷在高中低端市场推出了完全支持DX 9.0的产品。2004年DX 9.0的普及将是大势所趋。文章最后是由本编辑部整理的2003年度ATi和nVidia的全系列DX 9.0显卡的“全家福”,有兴趣的读者可以作为参考。

<b>ATi R420图形芯片技术详解</b> 
R420图形显示芯片集成1.6亿个晶体管,使用TSMC 0.13微米制程和LOW-K电介质以及铜互连技术,工作频率可以达到600MHz。
<u>1.SMARTSHADER HD</u>
R420渲染流水线采用一种“wide”型管线,任一条管线可以操作4个像素单元的组合,4个被操作的象素被定义为一个2×2(Quad)块,允许隐性采样以及样品和纹理过滤延迟。每条“wide”型管线都是独立工作并拥有各自的资源,材质单元、象素引擎、Shader内存、临时/常量寄存器等。
R420不完全支持Pixel Shader 3.0,不过除了放弃对于动态程序流程分支控制的支持之外,R420拥有Pixel Shader 3.0的其他全部功能。
<u>2.SMOOTHVISION HD</u>
在原有SmoothVision 2.0基础上进行改进,包含全屏抗锯齿以及各向异性过滤功能。新增加的Temporal Anti-Aliasing(随机采样抗锯齿算法),由奇偶帧合成采样方式较之FSAA算法采样点翻倍,因此其效果也比传统FSAA算法更胜一筹。
<u>3.HYPER Z HD</u>
Hyper Z HD是ATi第四代Hyper Z技术。与前三代一样,Hyper Z HD功能也是为了节省宝贵的显存带宽,保证在多边形象素处理上避免浪费过多的GPU资源。
<u>4.3Dc</u>
3Dc技术是ATi全新的法线贴图数据压缩算法。是R420图形显示芯片唯一支持的新功能。
3Dc技术作为一种新的纹理压缩技术,它采纳了目前非常流行而且已经获得广泛应用的S3TC和DXTC的技术特点,再加上算法简单易懂,实施容易,而且ATi对于3Dc的算法是公开的,所以3Dc技术在应用上是非常具有潜力的。

nVidia NV40图形芯片技术详解 
<u>1.超标量设计</u>
NV40引入创新的着色器架构可以将每个周期所完成的操作数目加倍,每个象素流水线具有两个着色单元在任何特定的周期都给象素操作提供两倍的性能提升。凭借两组着色器单元,NV40可以支持真正的并行双处理。另外,NV40体系架构还增加了编程灵活性。NV40正式支持32bit精度级别。
<u>2.nVidia EXR技术</u>
NV40架构提供了NVIDIA HPDR(动态高范围技术),能实现强大高动态范围的渲染技术的需求。NVIDIA EXR在着色渲染、混合渲染以及滤波操作的时候都提供了广泛的数据精度,改善包括静态和动态的画面效果。
动态高范围技术(HPDR)渲染效果就是对存储高精度色彩信息的一个最好应用。在渲染场景时,计算结果首先以高亮度差、高精度的浮点颜色保存在一个离屏表面(Off Screen Surface)中。然后,通过最终的色调映射过程,将这些颜色转换到在屏幕上显示的颜色范围内。这不仅能够使颜色效果显得更丰富、更柔和,还能实现一些类似于瞳孔在不同强度的环境光条件下自动调节大小以调整亮度的效果。
<u>3.旋转栅格抗锯齿算法(Rotated-Grid Anti-Aliasing)</u>
RGAA是新一代GeForce GPU采用的抗锯齿算法,它是基于每个象素4个取样,不同于以往4点取样抗锯齿算法,RGAA每个象素四个子象素取样点位于一个2×2的正规栅格样板内。通过些微旋转四个子象素的栅格,从而达到一个4×4菱形栅格取样信息。
<u>4.CineFX 3.0</u>
CineFX 3.0完全支持微软DirectX 9.0中的Shader Model 3.0,这个最新版本的Model包括大家非常熟悉的VertexShader 3.0以及PixelShader 3.0。
其次,CineFX 3.0完全支持最初由SGI提出的OpenGL 1.5版本,微软的High-Level Shader Language(HLSL,高级渲染器语言)、OpenGL Shader Language(OpenGL渲染器语言)和NVIDIA自己开发的CG着色环境。
<u>5.UltraShadow II</u>
新的NVIDIA GeForce 6系列图形处理器引入了NVIDIA公司的UltraShadowⅡ技术,该技术加速了互动环境中阴影交集侦测的计算。
UltraShadow II可以在生成蜡版式阴影锥时,提供双倍运算能力,让象素处理速度获得双倍提升。结合UltraShadow II技术,编程人员可以通过光源和阴影范围定义一个场景远近界线(深度界线)。把计算限制在受光源影响的范围区域之内。这样就可以充分地降低需要被检查的阴影区域大小和需要考虑的物体数量。
UltraShadowⅡ技术同样能和NVIDIA智能取样3.0版的技术完美配合,确保阴影边缘能获得正确抗锯齿效果,防止斑块或者锯齿观感。

<b>革新的源动力—浅析DOOM3显示技术</b>
谈论图形芯片的发展不可能不提到的还有ID Software公司,1993年DOOM游戏的出现不光改变了整个电脑游戏界,同时也影响了整个图形显示芯片技术的发展。时至今日,到底是3D游戏带动着显卡进步,还是显卡的发展促进着3D游戏的革新这已经没有一个定论。我们只知道作为3D图形显示芯片发展的原动力之一,3D游戏已经得到了大家的认可。
本单元开篇两张图片分别截取之DOOM 3和Unreal 3。由于篇幅原因本文无法向读者详尽介绍这两款次世代游戏引擎的精彩之处,只能摘取部分以飨各位看官。
以DOOM3为例,究竟在下一代游戏中将又会出现哪些技术来实现这匪夷所思的效果呢?
<u>1.动态阴影效果(Shadow Volume)</u>
充分利用GPU可编程流水线的能力,在游戏中产生真实的动态光影效果,这也是目前为止能比较真实地实现统一光照模型的一种技术。不过,就是最新发布的NV40和R420芯片也依然不具备产生新顶点的能力,因此动态阴影效果在现阶段仍然还是要通过CPU来实现,对CPU的依赖太大。Shadow Volume技术已经领先于现阶段的显卡发展,在接下来的几年中,对Shadow Volume的支持将是下一代显卡的一项任务。
<u>2.智能减边</u>
该技术透过电脑计算,直接将复杂的多边形模型进行减边计算,大幅度地降低了CPU浮点运算以及显卡生成多边形的计算强度。从而可以让CPU和GPU能有更充足的运算空间去处理其他特效。
<u>3.整体凹凸映射</u>
该技术就是在标准表面纹理上再映射一层纹理,纹理的内容相同但位置相错,错位深度由深度信息和光源位置决定,再根据表现对象的不同,将下层纹理进一步处理为上层纹理的阴影或底面,这样就逼真地模拟出了真实物体表面的凸凹褶皱效果,再配合光线,光反射和镜像效果在曲面上营造出更逼真模拟真实环境的场景。
<u>4.新一代光源效果</u>
DOOM3中所有光源模型将全部采用真实物理模型,所有光照、阴影都被包含在一个统一的光照模型中,任何效果都将模拟真实世界生成规律。
Ray-tracing、Radiosity、Spherical Harmonic Lighting是DOOM3主要采用的三种光源技术。
Ray-Tracing(光线追踪)是计算机图形学上一项用以计算场景整体照明并处理遮蔽表面和阴影产生的重要技术。它利用反射光以及折射光的特性来追踪光线来源,并同时可将光源照明所传递的能量以及物体间接传递的能量纳入亮度的考量当中,从而创造出完美的反射和折射效果。
Radiosity(混合光源)与Ray-Tracing差不多,也是通过制定在场景中光线来源并根据物体位置和反射属性来计算观察者可以看见的整个光路上的光影效果。
Spherical Harmonic Lighting(球形光源)用于在静态模型中快速计算光照效果。计算效率不受光源个数影响。
下一代的游戏对于显卡的处理速度和计算能力要求是越来越快了,一方面要保证游戏的流畅,即保证一定的FPS值;另一方面又要求显卡能够表现出足够细微的细节部分,即要求显卡显示的分辨率越来越高。DOOM3的推出可以说又开始了一轮新的硬件革新。更细致的细节表现,更逼真的光影效果是图形显示技术发展的目标。

<b>写在最后</b> 
在2001年E3大展上,id Software展示了自己最新的FPS游戏—DOOM3,这款游戏带来了人们以前从未领略过的3D图像,宣告了新一轮3D技术革命以及新硬件测试平台的到来。
2004年6月Intel正式发布下一代图形显卡接口规范PCI-Express,其总带宽较之如今AGP 8×规范已经可以达到4GB/s,整整增加了2倍的带宽。2005年Microsoft下一代DirectX标准也将发布,新一轮的图形显示单元的军备竞争正式拉开了帷幕。2004年又将是图形领域充满期待和盼望的一年。