|
Fermi:新一代CUDA计算与图形架构
在未来的游戏世界里,当显卡的渲染速度足够快后,真正能带给玩家视觉震撼的是流光溢彩的表面效果和栩栩如生的物体动作,比如现在的光线追踪和物理加速技术就是在朝着这个方向努力,然而这需要显卡具备极强的计算能力(GPU Computing),不止是图形渲染能力。
G80架构是NVIDIA公司最初的通用计算GPU架构,即可以做图形渲染,也可以用来做并行计算,后来的GT200架构扩展了G80架构的特点和功能,性能得到进一步提升。新一代的Fermi架构则是继G80架构后的又一重要GPU架构,它站在G80和GT200的肩上,几乎是重新设计了并更注重通用计算的架构。
Fermi继承了上代的特色,同样也是双架构设计,即CUDA计算架构和图形架构,两种架构可灵活切换,比如在游戏中需要进行物理计算时使用CUDA计算架构,需要进行渲染时使用图形架构。

Fermi CUDA计算架构

Fermi图形渲染架构
NVIDIA给Fermi的定义是:新一代CUDA计算与图形架构。它采纳了用户在使用G80和GT200架构时给出的建议,针对双精度运算、ECC内存容错能力、Cache体系结构、上下文切换和原子读写操作等方面进行了全新的设计,通过新的架构设计不仅仅增加了计算能力,并且支持更好的可编程能力和计算效果。
Fermi架构的主要更新如下:
◎ 第三代Streaming Multiprocessor(SM)
• 每个SM包含32个CUDA Core,是GT200的4倍
• 8倍于GT200的双精度浮点性能
• Dual Warp调度策略,一个周期内启动两个warp进行计算
• 每个SM有64KB的RAM,可灵活配置Shared Memory和L1缓存
◎ 第二代PTX ISA架构(PTX 2.0)
• 统一寻址空间,完整的支持C++特性
• 针对OpenCL和DirectCompute进行优化设计
• 完整支持IEEE 754-2008 32bit/64bit精度
• 通过Predication(断言)来提高条件性能
◎ 改进的内存操作子系统
• 可配置的L1和统一的L2并行数据高速缓存
• 首个提供ECC内存支持的GPU
• 原子内存操作性能极大增强
◎ 第三代千兆线程引擎(GigaThread 3.0)
• 10倍于上一代的上下文切换能力
• 并发Kernel(核心程序)执行机制
GF100是首款采用Fermi架构的GPU,旗下的产品包括GeForce GTX 480和GTX 470,它们能够实现所有的DirectX 11硬件特性,包括Tessellation和DirectCompute等,除了上面提到的领先的并行计算能力外,在游戏图形性能方面也很大改善:
◎ 卓越的游戏性能
◎ 超一流的图像质量
◎ 电影级的几何真实效果
◎ 革命性的游戏计算架构
Fermi是相当复杂和庞大的,其晶体管数达到30亿个,规模空前,这也是它迟迟不能推出的主要原因,它实在是太复杂了!
分页浏览:缔造视觉计算王国,NVIDIA Fermi深入解读与测试 |
|