找回密码
 新注册用户
搜索
查看: 4345|回复: 0

[讨论] 关于CC运行的一点问题

[复制链接]
发表于 2014-2-15 16:40:11 | 显示全部楼层 |阅读模式
本帖最后由 xiening813 于 2014-2-15 16:45 编辑

更新到6.04后执行率下降了,当然不知道是不是个人问题,按官网论坛里介绍调整后利用率上去了CPU占用率也高多了,另外就是HD7750的显卡和HD6770的显卡运行起来总时间差不多,7750略快,但是在官网记录里显示的有点不明白这里是两台机器的配置,HIS刀卡HD 7750 900/1250,,蓝宝HD 6770 800/1200


ID: 139967
详细 | 任务
[size=0.9em]跨项目的统计信息:
cc-PC
7,381.14
75,862
7.2.39GenuineIntel
Intel(R) Pentium(R) Dual CPU E2140 @ 1.60GHz [Family 6 Model 15 Stepping 13]
(2 处理器)
[2] AMD ATI Radeon HD 5700/6750/6770 series (Juniper) (1024MB) driver: 1.4.1848 OpenCL: 1.02Microsoft Windows 7
[size=0.9em]Ultimate x64 Edition, Service Pack 1, (06.01.7601.00)
15 Feb 2014, 7:56:18 UTC
ID: 138194
详细 | 任务
[size=0.9em]跨项目的统计信息:
X1-RICH-NING-PC
12,501.49
676,712
7.0.64GenuineIntel
Intel(R) Core(TM) i5-3317U CPU @ 1.70GHz [Family 6 Model 58 Stepping 9]
(4 处理器)
INTEL Intel(R) HD Graphics 4000 (1624MB) OpenCL: 1.01Microsoft Windows 7
[size=0.9em]Ultimate x64 Edition, Service Pack 1, (06.01.7601.00)
15 Feb 2014, 7:27:18 UTC
ID: 138754
详细 | 任务
[size=0.9em]跨项目的统计信息:
jxrich-PChome
136,308.64
2,276,244
7.2.33GenuineIntel
Intel(R) Core(TM) i5-3470 CPU @ 3.20GHz [Family 6 Model 58 Stepping 9]
(4 处理器)
AMD AMD Radeon HD 7700 series (Capeverde) (1024MB) driver: 1.4.1848 OpenCL: 1.02Microsoft Windows 7
[size=0.9em]Ultimate x64 Edition, Service Pack 1, (06.01.7601.00)
15 Feb 2014, 1:21:28 UTC



6770运行记录,,CPU时间和运行时间,这里是几次按官网优化的记录,感觉像是牺牲CPU的处理性能提高了总运行时间,但是CPU也被占用很多
Task
[size=0.8em]点击查看详细
显示名称
任务单元
[size=0.8em]点击查看详细
发送时间结果上报时间
或者上报期限
[size=0.8em]解释
状态运行时间
(秒)
CPU 时间
(秒)
积分计算程序
24966122046115 Feb 2014, 0:41:07 UTC15 Feb 2014, 7:56:18 UTC已完成,通过验证
4,035.80
3,014.69
7,569.52
solo_collatz v6.04 (opencl_amd_gpu)
23377818607714 Feb 2014, 9:06:43 UTC15 Feb 2014, 6:30:00 UTC已完成,通过验证
4,393.77
2,460.72
7,181.25
solo_collatz v6.04 (opencl_amd_gpu)
23376620599114 Feb 2014, 9:06:43 UTC15 Feb 2014, 3:29:04 UTC已完成,通过验证
6,643.40
538.53
7,568.47
solo_collatz v6.04 (opencl_amd_gpu)
23376520599014 Feb 2014, 9:06:43 UTC15 Feb 2014, 4:50:56 UTC已完成,通过验证
6,516.06
465.34
7,533.30
solo_collatz v6.04 (opencl_amd_gpu)
23373420596114 Feb 2014, 9:06:43 UTC15 Feb 2014, 1:47:53 UTC已完成,通过验证
6,924.03
324.17
7,434.23
solo_collatz v6.04 (opencl_amd_gpu)
23373120595814 Feb 2014, 9:06:43 UTC15 Feb 2014, 4:50:56 UTC已完成,通过验证
7,222.07
507.00
7,684.54
solo_collatz v6.04 (opencl_amd_gpu)
23359720582914 Feb 2014, 9:06:43 UTC15 Feb 2014, 7:56:18 UTC已完成,通过验证
4,009.07
2,822.56
7,749.21
solo_collatz v6.04 (opencl_amd_gpu)
23358920582114 Feb 2014, 9:06:43 UTC15 Feb 2014, 6:30:00 UTC已完成,通过验证
4,475.84
2,526.22
7,724.48
solo_collatz v6.04 (opencl_amd_gpu)
23355720579214 Feb 2014, 9:06:43 UTC15 Feb 2014, 3:29:04 UTC已完成,通过验证
6,155.77
534.08
7,895.56
solo_collatz v6.04 (opencl_amd_gpu)
23305020541114 Feb 2014, 8:28:30 UTC15 Feb 2014, 0:41:07 UTC已完成,通过验证
7,985.96
471.97
7,521.74
solo_collatz v6.04 (opencl_amd_gpu)


HD7750的,之前我也发帖子问执行率只有50%,然后优化了就99%了

Task
[size=0.8em]点击查看详细
显示名称
任务单元
[size=0.8em]点击查看详细
发送时间结果上报时间
或者上报期限
[size=0.8em]解释
状态运行时间
(秒)
CPU 时间
(秒)
积分计算程序
23642820847314 Feb 2014, 11:53:18 UTC15 Feb 2014, 1:21:28 UTC已完成,通过验证
2,762.27
2,503.88
7,520.29
solo_collatz v6.04 (opencl_amd_gpu)
23642220846714 Feb 2014, 11:53:18 UTC15 Feb 2014, 1:21:28 UTC已完成,通过验证
2,798.21
2,563.03
7,672.13
solo_collatz v6.04 (opencl_amd_gpu)
23642120846614 Feb 2014, 11:53:18 UTC15 Feb 2014, 1:21:28 UTC已完成,通过验证
2,817.71
2,586.70
7,795.62
solo_collatz v6.04 (opencl_amd_gpu)
23642020846514 Feb 2014, 11:53:18 UTC15 Feb 2014, 1:21:28 UTC已完成,通过验证
2,823.40
2,573.94
7,776.87
solo_collatz v6.04 (opencl_amd_gpu)
23625820830614 Feb 2014, 11:53:18 UTC15 Feb 2014, 1:21:28 UTC已完成,通过验证
2,766.13
2,536.47
7,505.33
solo_collatz v6.04 (opencl_amd_gpu)
23612020817014 Feb 2014, 11:53:18 UTC15 Feb 2014, 1:21:28 UTC已完成,通过验证
2,759.11
2,530.37
7,377.84
solo_collatz v6.04 (opencl_amd_gpu)
22375119697413 Feb 2014, 22:31:35 UTC14 Feb 2014, 11:53:18 UTC已完成,通过验证
2,676.36
2,442.90
7,121.94
solo_collatz v6.04 (opencl_amd_gpu)
22375019697313 Feb 2014, 22:31:35 UTC14 Feb 2014, 11:53:18 UTC已完成,通过验证
2,761.75
2,306.02
7,226.29
solo_collatz v6.04 (opencl_amd_gpu)


优化的设置
verbose=1
items_per_kernel=20
kernels_per_reduction=8
threads=8
sleep=1
build_options=-Werror

--------忘说重点了实际上两种卡性能差不多吧,但是感觉还是有很明显的差距,不知道是不是架构造成的,还是其它什么方法可以优化,大概就是尽量节约CPU性能提高GPU的运算效率,减少总运行时间之类的方法。。。


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-3-29 22:59

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表