找回密码
 新注册用户
搜索
楼主: jxbking

ATI 2000 3000系列客户端出来了。。。。赶快试试吧

[复制链接]
发表于 2008-4-17 15:03:29 | 显示全部楼层
CPU 49%,GPU,98-99%......应该全利用了
不过我这个26不好超频,才用驱动带的超频选项超到625/725,默认600/700。。。
回复

使用道具 举报

发表于 2008-4-17 17:38:43 | 显示全部楼层
Q6600+3850
关掉所有后台CPU 25%,GPU依然只能68%

以后有空了测一下提升FSB会不会快一点
回复

使用道具 举报

发表于 2008-4-17 20:17:42 | 显示全部楼层
谁能帮解释下fahlog里面的Completed 15000 out of 1500000 steps 的意思,与frames有关么?
这是我用x1950 在5。03里面1个多小时的数据,好像很慢啊(同x2x00,x3000相比。。)


11:49:34] Writing local files
[11:50:19] Completed 9615 out of 1500000 steps  (1)
[11:50:19] Extra SSE boost OK.
[11:57:32] Writing local files
[11:57:32] Completed 15000 out of 1500000 steps  (1)
[12:17:42] Writing local files
[12:17:42] Completed 30000 out of 1500000 steps  (2)
回复

使用道具 举报

发表于 2008-4-17 21:04:54 | 显示全部楼层
CPU 25%的话GPU 68%很正常啊,你看看50%,也许GPU就全力以赴了。
回复

使用道具 举报

发表于 2008-4-17 21:23:38 | 显示全部楼层
原帖由 zflowers 于 2008-4-17 20:17 发表
谁能帮解释下fahlog里面的Completed 15000 out of 1500000 steps 的意思,与frames有关么?
这是我用x1950 在5。03里面1个多小时的数据,好像很慢啊(同x2x00,x3000相比。。)


11:49:34] Writing local files
[11:50:19] Co ...



这是GPU客户端?怎么看着像cpu,连sse加速都出来了
回复

使用道具 举报

发表于 2008-4-18 11:52:15 | 显示全部楼层
原帖由 sakeki 于 2008-4-17 21:04 发表
CPU 25%的话GPU 68%很正常啊,你看看50%,也许GPU就全力以赴了。

我的是4核,25%意味着一个核占满了
回复

使用道具 举报

发表于 2008-4-18 11:53:03 | 显示全部楼层
原帖由 vmzy 于 2008-4-17 21:23 发表



这是GPU客户端?怎么看着像cpu,连sse加速都出来了

在CPU和GPU之间搬运数据用SSE能快不少
回复

使用道具 举报

发表于 2008-4-18 12:11:27 | 显示全部楼层
原帖由 vmzy 于 2008-4-17 21:23 发表



这是GPU客户端?怎么看着像cpu,连sse加速都出来了



啊,我晚上回家好好看看,我说怎么感觉这么慢呢,1m20s/frames....好象以前用gpu版本要快的多,好象我家cpu/gpu版本的都有,回家看看...
回复

使用道具 举报

发表于 2008-4-18 15:07:36 | 显示全部楼层
原帖由 JUST 于 2008-4-18 11:52 发表

我的是4核,25%意味着一个核占满了


一个核还喂不饱 3850,看来3850性能比3650高不少。

我单核老A64已经可以喂饱 3650了,刚好充分利用,不浪费。
回复

使用道具 举报

发表于 2008-4-18 23:07:20 | 显示全部楼层
3650只有120个ALU,3850有320个
另外我怀疑ATI的驱动在分配ALU时可能效率不高

还有,理论上如果做得好一些,GPU和CPU的通信是可以非常非常小的,F@H的WU不大,完全可以放到显存里交给显卡全权处理。当然要实现这一点编程的难度很高,需要充分利用硬件架构,期待F@H慢慢改进。Windows下的驱动模型,或者说一些“古老”的规则也限制了GPGPU性能。
回复

使用道具 举报

发表于 2008-4-18 23:43:45 | 显示全部楼层
如果能全交给显卡处理,那真是天大的喜讯了,或者CPU负担可以小点也好。
回复

使用道具 举报

发表于 2008-4-19 07:09:30 | 显示全部楼层
原帖由 JUST 于 2008-4-18 23:07 发表
3650只有120个ALU,3850有320个
另外我怀疑ATI的驱动在分配ALU时可能效率不高

还有,理论上如果做得好一些,GPU和CPU的通信是可以非常非常小的,F@H的WU不大,完全可以放到显存里交给显卡全权处理。当然要实现这一点编程的难 ...


我觉得可以优化一下程序的效率 不过完全交给GPU似乎不太可能 GPU目前还没有整数计算能力 虽然我估计FAH的大部分数据都是浮点计算 不过可能仍然有整数计算 我猜测的是FAH把大量的浮点计算交给GPU 然后CPU负责少量的整数计算 然后将2者的数据同步在一起 就是现在CPU的速度如果跟不上的话GPU的效率无发发挥的情况.
回复

使用道具 举报

发表于 2008-4-21 00:01:07 | 显示全部楼层
原帖由 code_asf 于 2008-4-11 23:22 发表
3850 GPU只有3X%的活动,而PD805 就占用50%。是用GPU算还是用CPU算?


GPU负荷低和现在算的WU原子数少,分布程度不高有关。大原子的WU出来就应该有所改善。
回复

使用道具 举报

发表于 2008-4-21 00:32:48 | 显示全部楼层
原帖由 JUST 于 2008-4-15 17:28 发表
要想测试准确的话,应该关掉所有其他的后台程序。
F@H不断地在CPU和GPU之间搬运数据,数据总线是个瓶颈


应该不是瓶颈。虽然不知道具体指标。但FAH的数据绝对达不到GB/s的量级。总线负荷低着呢。另外GPU算的时候CPU负荷高也是一种假相(至少对GPU1 CLIENT来说是如此)。只要CPU不是太差,应该不存在喂不饱GPU的问题。我在别的帖子里有说明。
回复

使用道具 举报

发表于 2008-4-21 00:37:27 | 显示全部楼层
原帖由 jiubian 于 2008-4-13 22:50 发表
用了一会,很失望。

2600的显卡,跑的时候GPU占用98%,但同时竟然占用了50%-60%的CPU,那这样还不如用CPU版本了,这么高的CPU占用率,还干扰了BOINC. ...


GPU2我不知道。但GPU1的FAQ我是仔细读过的。CPU负荷高并非是真的负荷高。或者说它的负荷主要是“poll GPU”(我理解就是不断的询问GPU做完了没有),而不是和CPU算FAH时那样真的在计算。我猜想如果用一块较慢的CPU来配高级GPU,那么CPU的负荷应该可以达到100%。但如果你测一下这时的CPU温度应该明显的比算FAH时的CPU温度低。即CPU并非真的100%被用了。但如果你需要在GPU算的同时也用CPU算,那么这种poll操作对CPU的FAH CLIENT是有很大影响的。所以至少要用双核来实现一个CPU计算FAH CLIENT,另一个喂给GPU数据。否则一定效果不佳。

你会看到如果采用一个GPU进行计算,对于双核CPU,负荷总是50%,四核是25%。而如果你查看每个CPU的负荷,实际是一个CPU100%,而其他CPU负荷却较小。我以前用GPU1的时候有过类似的现象。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~
欢迎大家多多支持基金会~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2025-5-14 05:40

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表