找回密码
 新注册用户
搜索
查看: 14875|回复: 22

[分享] 打造论坛CUDA经验及讨论强贴--2009/06/10 11:50更新

[复制链接]
发表于 2009-5-22 10:04:02 | 显示全部楼层 |阅读模式
虽然加入论坛时间不长,不过本人跑SETI也有些年头了,只不过中途因为换工作换城市停过一段,最近趁着机器和时间多了,重新开跑。

其实CUDA是让我重启SETI的诱因和动力,因为本人一向喜欢新事物。

好了,先介绍自己的几套配置:

最先当然是为SETI于2009/5/18配置的i7平台,预计每周运行6.7天
MSI X58M , i7 920 , XFX GTX260+ , OCZ DDR3@1600*3 , OCZ SSD30G

接着是自己之前的测试专用平台,预计每周运行6.7天
GIGA X48-DQ6 , Q9550 , XFX GTS250 , OCZ Raper DDR2@1066*2 , OCZ SSD30G

工作平台机器:一般每天运行10小时
DFI P45 , E5200 , 8600GT , Geil DDR2@1066*2 , ST500G

宿舍上网平台,一般每天运行4小时,最近增加了白天8小时
ASUS G45 , E6320 , ASUS 9400GT-S , Corsair XMS2@1110*2 , WD320G

下载BT机器,一般7*24小时运作,支持远程管理,电话遥控开机 ;-D
HP MCP73a , E1400 , 7100GS , OCZ DDR2@800*1 , ST160G-2.5

为了SETI,所有显卡Nv,原来的3850、4850统统折换,这样Nv的显卡一字排列

GTX260-896M,GTS250-512M(9800),8600GT-256M,9400GT-512M,7100GS

废话多了点,下面是重点的试用部分了
  • GPU的计算速度影响较大的是流处理器的数量,其次是频率(因为差别不大)
    GTX260+:240,GTS250:128,8600GT:48,9400GT:16;
  • CUDA需要CPU帮忙才能干活,流处理器数量越多越占用CPU
    GTX260占I7-920/Q9550的16%,E6320的32%
    GTS250占Q9550/I7-920的14%
    8600GT占Q9550的2%
    9400GT占Q9550的1%,E5200/E6320的2%;
  • 理论的计算能力出来了:
    GTX260 : 96GFLOPS;
    GTS250 : 84GFLOPS;
    8800GS : 50GFLOPS;
    9400GT : 8GFLOPS;
    8600GT : 14GFLOPS.
  • 显存小于256M的任何Nv卡都不能CUDA算SETI;
  • 8600GT以下档次的显卡均不能CUDA算SETI;
  • CUDA运算出错概率明显高于CPU,越低端越明显;
  • CUDA运算某些MB包时间会特别长,正常GTX260计算一个MB包20分钟左右,而特殊情况也会要2.5小时;
  • 换显卡后(包括换个插槽),没有算完的CUDA包会丢,换CPU不会;
  • SETI的GPU运算时间看起来不准,其实还是比较准确,统计的cpu占用时间除以CPU占用比例就是实际使用时间(还在验证)
  • CUDA卡的现象在Q9550平台完全没有感觉,而i7和E6320/E5200配合GTX260+才会出现。另外,无线鼠标也比有线鼠标要卡(怪吧!),另外,优化过的机器跑CUDA会更卡(侧面证明,我的MAC AIR笔记本没有开CUDA,优化前不卡,优化过明显卡)
  • 目前针对CPU v10优化后GPU就接不到包了,而V11优化需要再修改xml文件,而且cpu/gpu都增加了运算错误的概率!
先这些,慢慢补充了,也欢迎大家跟贴补充,我会定期整理的

2009/06/02更新:
cuda计算如果显卡温度超过70度后出错的概率大增,80度的时候75%计算都会出错了。

2009/06/09更新:
cuda计算卡的现象,发现主要是操作系统影响,我的i7平台装了XP配250/260都卡,而装Windows7则完全不卡(已经测试Q9550也如此)

2009/06/10更新:
理论计算能力出来了。

附上cuda2.2 v11的优化地址:
http://tw-dclub.com/forum/downlo ... b6010272baed2d9d925

[ 本帖最后由 eqzero 于 2009-6-10 10:57 编辑 ]
Capture.JPG
Capture1.JPG

评分

参与人数 2基本分 +10 收起 理由
Tynox + 4 原创内容
Youth + 6 原创内容

查看全部评分

回复

使用道具 举报

发表于 2009-5-22 10:14:13 | 显示全部楼层
粗看还以为自己错进了fah区
回复

使用道具 举报

发表于 2009-5-22 11:36:50 | 显示全部楼层
卡的问题,在算某些特别时间长的包 的时候会有。而普通的包着感觉不到。
显卡是88GTS512 ,用的是V11优化+CUDA2.1

[ 本帖最后由 涼宮ハルヒ 于 2009-5-22 11:37 编辑 ]
回复

使用道具 举报

发表于 2009-5-22 12:08:07 | 显示全部楼层
有牛卡的话还是算个GPUGRID或者FAH的实在吧
回复

使用道具 举报

发表于 2009-5-22 12:18:26 | 显示全部楼层
楼主的精神可嘉。
回复

使用道具 举报

发表于 2009-5-22 13:16:25 | 显示全部楼层
发个v11的优化上来吧
回复

使用道具 举报

 楼主| 发表于 2009-5-22 14:44:46 | 显示全部楼层
原帖由 zflowers 于 2009-5-22 13:16 发表
发个v11的优化上来吧


http://setiathome.berkeley.edu/forum_thread.php?id=50829
http://lunatics.kwsn.net/12-gpu- ... 16715.html#msg16715
回复

使用道具 举报

发表于 2009-5-22 15:06:44 | 显示全部楼层
看了半天,说实话没完全看懂。。。还是有劳发到纳米盘什么的吧
回复

使用道具 举报

发表于 2009-5-22 15:18:46 | 显示全部楼层
i7是四核,超线程为8个核心,这样8个任务一起开跑和4个任务一起跑,完成每个任务的时间应该是不一样的吧?两个任务占用一个核心,每个任务的时间应该是一个核心跑一个任务的不到两倍,实际是不是这样?如果是的话,具体差不多是一点几倍的时间?

看截图有个进度91.753%的CPU任务,应该是Q9550的吧?我是好久没用CPU跑SETI了,记得以前也没用这么长时间啊,那时候用2140超频、优化也不过才一个半小时么,啥原因?包大了?

顺便问下楼主,微星那X58的小板超频咋样?这板性价比相当高啊
回复

使用道具 举报

发表于 2009-5-22 15:34:02 | 显示全部楼层
CUDA 2.2 benchmarking results:

1) New CUFFT can't run with 182.50 driver
2) new (2.2) CUDA runtime+ current CUDA MB can operate with 182.50 driver
3) there is small speedup from using CUDA_RT of 2.2 and there is no speedup from rebuilding current CUDA MB sources with CUDA 2.2
4) there is significant speedup (it even offsets lack of OCing on my GPU) from using current drivers (185.85) + CUDA RT 2.2 + CUFFT 2.2 (again, all builds show that speedup, not only freshly rebuilt one).

Summary: for those who can go with new drivers it's worth to upgrade to CUDA 2.2 runtime w/o upgrading current CUDA MB app.
For all others it's worth to try to use new cudart.dll  + old cufft.dll.

(new CUDA 2.2 runtime attached (cudart.dll + cufft.dll )

Don't forget to update video driver to 185.85 version.

--------------------------------------------------------------------------------
CUDA2.2_rt.rar (250.9 KB - downloaded 201 times.)

« Last Edit: 09 May 2009, 01:06:21 am by Raistmer »
回复

使用道具 举报

发表于 2009-5-22 17:54:20 | 显示全部楼层
N卡的185.58驱动有问题,各大论坛网友均有反映,主要是莫名其妙蓝屏。
回复

使用道具 举报

 楼主| 发表于 2009-5-22 18:10:10 | 显示全部楼层
原帖由 beyond-cool 于 2009-5-22 15:18 发表
i7是四核,超线程为8个核心,这样8个任务一起开跑和4个任务一起跑,完成每个任务的时间应该是不一样的吧?两个任务占用一个核心,每个任务的时间应该是一个核心跑一个任务的不到两倍,实际是不是这样?如果是的话,具体差不多是一点 ...


SETI一个任务一个核,没法整合跟拆开的。

x58m这块板子超频只简单测试过,散装C0步进不加压3.2g没问题,板上带了简易超频的DIP开关,还算方便。但是不推荐购买,除非你有充分准备,否则南北桥温度会死人的,我用了2个利民的散热器(加起来超过400块了!),如果不加风扇的话,软件测主板温度5x度,用红外抢测表面也大于5度,太恐怖了,搞得我现在还不敢装进机箱。
回复

使用道具 举报

发表于 2009-5-22 22:26:24 | 显示全部楼层
原帖由 kittyjia 于 2009-5-22 17:54 发表
N卡的185.58驱动有问题,各大论坛网友均有反映,主要是莫名其妙蓝屏。

18250 我还在使用呢。。哈哈
回复

使用道具 举报

发表于 2009-5-22 22:46:01 | 显示全部楼层
原帖由 GQZX35 于 2009-5-22 12:08 发表
有牛卡的话还是算个GPUGRID或者FAH的实在吧


SETI 的 CUDA 确实有问题,我老早就转去算 GPUGRID 了。。。。

在 GPUGRID 下,除了打游戏会卡外,其他基本没有卡的现象出现。。。。
回复

使用道具 举报

发表于 2009-5-23 00:22:01 | 显示全部楼层

回复 #13 eqzero 的帖子

我告别机箱已经一年半了,呵呵,清灰也方便。没事还能养养眼,虽然不是啥好配置...
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2025-5-10 22:42

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表