找回密码
 新注册用户
搜索
查看: 10384|回复: 25

变GPU为CPU Nvidia开发GPU计算处理功能

[复制链接]
发表于 2007-5-25 18:20:28 | 显示全部楼层 |阅读模式
http://www.enet.com.cn/article/2007/0525/A20070525606260.shtml

  【eNet硅谷动力消息】5月25日消息,据国外媒体报道,图形处理器制造商Nvidia公司正在力推新的创意:它所制造的图形处理器(GPU)在需要时也可当作新增的中央处理器(CPU),从而大大提高系统的计算能力。

  在加州San Jose召开的微处理器2007论坛上,Nvidia公司架构主管Nicklls称:“图形处理器只是放在一边,许多人都提出了这个伟大的创意:嘿,让我们用GPU做些事情。”

  该架构主管指出,当图形处理器未执行图形相关任务时,GPU可与中央处理器并行执行计算任务。从而使每秒浮点计算次数达到2000亿。

  Nvidia公司发布了名为“统一计算设备架构”软件(CUDA)的测试版,该软件将于今年下半年正式推出。CUDA可让开发商编写指令程序,以便让GPU执行通常由CPU执行的计算任务。Nvidia公司表示,将GPU当作CPU并不一种新思想,但Nvidia公司的新软件能使开发商更容易地实现目标。

  CUDA只能用于一定型号的图形处理器,包括Nvidia的GeForce 8800和8600,还有06年11月发布的FX 4600和5600。

  Nvidia公司指出,用户购买GPU的目的是图形处理,但在PC的绝大部分工作时间中它是闲置的,如果你充分发挥了GPU的功能,你的电脑就能成为一台大功率、高性能的并行计算系统。”
回复

使用道具 举报

发表于 2007-5-25 18:28:41 | 显示全部楼层
R580浮点性能其实都达到300多GFLOPS了
R600接近1T了吧
回复

使用道具 举报

 楼主| 发表于 2007-5-25 18:41:00 | 显示全部楼层
没有1TFLOPS这么高,大概500多GFLOPS

“采用双核心Opteron搭配两块R600实际运算了斯坦福大学为超级计算机应用编写的“万亿次流处理”Demo,测试结果为1018 GF/sec,即系统每秒可进行10180亿次浮点运算。”
回复

使用道具 举报

发表于 2007-5-25 20:31:22 | 显示全部楼层

回复 #3 BiscuiT 的帖子

我记得以前说R600用64个四维矢量单元就600多G
那现在320个标量流处理器,还不得更高?
回复

使用道具 举报

发表于 2007-5-25 20:31:56 | 显示全部楼层
至于双核心Opteron

浮点性能能在R600面前根本不值一提
回复

使用道具 举报

 楼主| 发表于 2007-5-25 21:28:42 | 显示全部楼层
http://www.beareyes.com.cn/2/lib/200704/30/20070430141_3.htm
R600采用的是较为传统的矢量运算单元(Vector ALU),具备64个4D SIMD单元+1D的SISD单元,也即64个Vect5D着色单元,总共可以产生320个标量单元
运行在750MHz,那么它的理论吞吐能力为750MHz×64个×[(1+2)×4]Flops=576GFlops/s


R600着色器
http://www.ityb.net/news/ShowArt ... ID=18349&Page=3

[ 本帖最后由 BiscuiT 于 2007-5-25 21:51 编辑 ]
回复

使用道具 举报

发表于 2007-5-25 22:09:49 | 显示全部楼层

回复 #6 BiscuiT 的帖子


骗人的骗人的
我原来还在惊奇怎么矢量单元这么快就能改成标量单元
原来是等效出来的……
回复

使用道具 举报

 楼主| 发表于 2007-5-25 23:59:08 | 显示全部楼层
这样做应该是考虑到通用计算上,开源驱动,amd的通用高速运算开发包都可以让R600的性能更有针对性的利用起来。
相对的G80彻底的把任何指令拆成1D标量指令,缓存成本高,而且在固有硬件下性能提升潜力有限。

http://www.ityb.net/news/ShowArt ... D=18349&Page=26


也不能说R600更好,最好就是快点让它们跑跑boinc的项目看看哪个表现出色

[ 本帖最后由 BiscuiT 于 2007-5-26 00:03 编辑 ]
回复

使用道具 举报

发表于 2007-5-26 09:43:10 | 显示全部楼层

回复 #8 BiscuiT 的帖子

那不是还要把各种指令都合并成5D么
谁效率高谁效率低还说不好呢……

当然玩游戏的话R600是无敌了
回复

使用道具 举报

 楼主| 发表于 2007-5-26 10:39:17 | 显示全部楼层
R600非常依赖软件优化,开源驱动颇有点分布式意味,弄个低成本高性能的处理器,能否好好利用就要靠大家一起来开发它的潜能
G80直接把硬件资源充分利用,减轻程序员劳动,代价是成本较高性能较低,但是利用率绝对是最高。

R600可塑性应该比较高

[ 本帖最后由 BiscuiT 于 2007-5-26 11:29 编辑 ]
回复

使用道具 举报

发表于 2007-5-26 11:04:51 | 显示全部楼层

NVIDIA科学计算CUDA正式版下月发布

在近日NVIDIA举行的分析师会议上,公司高管表示,其显卡的科学计算软件CUDA将于下月推出正式版,同时还表示其下一代显卡将于今年第四季度上市。

去年11月,NVIDIA公司发布了首款支持GPGPU通用科学计算的显卡GeForce 8800,并在今年2月推出了Beta版的科学运算软件CUDA。现在,NVIDIA计划在下月发布CUDA 1.0正式版。

NV的CUDA计划,可以使开发人员针对NVIDIA显卡的上百个流处理单元使用C语言进行编程,能够给程序员带来“几乎无限的指令带宽”。

NV并未透露公司今后的GPGPU计划,但已经确认下一代显卡将于今年第四季度上市,将支持双精度浮点运算。目前,G80的科学运算已经在多个专业领域获得应用,甚至著名软件MatLAB也可以使用CUDA加速10倍以上。
回复

使用道具 举报

发表于 2007-6-5 21:45:17 | 显示全部楼层
原帖由 lch=gta 于 2007-5-26 09:43 发表
那不是还要把各种指令都合并成5D么
谁效率高谁效率低还说不好呢……

当然玩游戏的话R600是无敌了




哪里看来R600玩游戏无敌了?

连GTS都不能搞定的东西 无敌在哪里啊? 发热还是噪音?
回复

使用道具 举报

发表于 2007-6-7 19:50:23 | 显示全部楼层

回复 #12 nvidia 的帖子

HD2900XT搞定GTS不费吹灰之力

连GTS都搞不定?

莫非你指的是HD2600吧
回复

使用道具 举报

发表于 2007-6-7 20:19:39 | 显示全部楼层

hoho

我的群里的人专门买了两块R600来玩的

不费吹灰之力 摆明了你在YY

瞎吹就没啥意思了
回复

使用道具 举报

 楼主| 发表于 2007-6-7 20:22:08 | 显示全部楼层
HD2900XT 市场定位就是对抗 GTS
跟 GTX 有不少差距,不过是 XTX 要面对的,可能是 R680
感觉 ati 好像想放弃这一战役而转到 R700 多核心去了

[ 本帖最后由 BiscuiT 于 2007-6-8 12:11 编辑 ]
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~
欢迎大家多多支持基金会~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2025-4-22 09:02

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表