发表于 2015-7-18 06:33:17

CC显卡计算效率大幅下滑


55,008.56222.0314,079.36Solo Collatz Conjecture v6.08 (opencl_intel_gpu)

36,797.3740.2014,143.10Solo Collatz Conjecture v6.04 (opencl_intel_gpu)


49,362.4935.4514,152.23Solo Collatz Conjecture v6.08 (opencl_amd_gpu)

27,496.06604.7214,556.60Solo Collatz Conjecture v6.04 (opencl_amd_gpu)

发表于 2015-7-18 06:33:48

http://boinc.thesonntags.com/collatz/results.php?hostid=303350

发表于 2015-7-18 06:38:43


48,195.12814.5314,804.21Solo Collatz Conjecture v6.08 (opencl_intel_gpu)

24,212.48101.7914,437.23Solo Collatz Conjecture v6.03 (opencl_intel_gpu)
另一台机器

vincentdark 发表于 2015-7-18 11:15:17

他们换包了,然后计算时间变长,但分数却没变……

zhouxiaobo 发表于 2015-7-18 12:58:57

得分率如果不高那就换别的GPU项目吧。

kittyjia 发表于 2015-7-18 13:15:04

本帖最后由 kittyjia 于 2015-7-18 15:45 编辑

在BOINC的子目录里,找有关mini,solo,large三个计算程序对应的XML文件,用记事本打开,拷入下面代码:
verbose=1
items_per_kernel=21
kernels_per_reduction=9
threads=10
sleep=1
lut_size=14
build_options=-Werror
保存即可。
这个代码对于cuda55或opencl-nvidia-gpu包通吃。
其来源在CC留言板:http://boinc.thesonntags.com/collatz/forum_thread.php?id=1009
上面代码数值可根据个人的显卡的档次灵活选用。加入此代码后,用750Ti计算large包,耗时78400s左右,用760计算large包,耗时37300s左右。

发表于 2015-7-18 18:30:14

不知道对Intel的GPU咋样、
我的显卡级别比较低
所以速度应该差很多
试试

发表于 2015-7-18 18:48:43

我配了Intel的CPU、和用opencl计算的ATI显卡
目前没出错。
不知道结果咋样
计算2天看看

ATI6570

发表于 2015-7-18 18:49:19

verbose=0
items_per_kernel=20
kernels_per_reduction=9
threads=8
sleep=1
build_options=-Werror

kittyjia 发表于 2015-7-18 22:05:00

lut_size=14语句是利用显卡二级缓存的,从留言板文章看,14的意思是8(2^14)=128K,即显卡的二级缓存L2 cache大于128K就可以用14的数值。显卡L2 cache可用AIDA64软件查看。

发表于 2015-7-18 23:20:52

Intel 显卡。。。。
      Architecture                                    Intel Gen7.5
      Execution Units (EU)                              20
      L1 Instruction Cache                              32 KB
      L1 Texture Cache                                  4 KB
      L2 Texture Cache                                  24 KB
      L3キャッシュ                                    256 KB
      Unified Return Buffer                           256 KB

AMD的
      Architecture                                    ATI Terascale 2 (VLIW5)
      Compute Units (CU)                              5
      SIMD Per Compute Unit                           1
      SIMD Width                                        16
      SIMD Instruction Width                            5
      L1キャッシュ                                    8 KB per CU
      Local Data Share                                  32 KB
      Global Data Share                                 64 KB

可能都没那么大的二级缓存

发表于 2015-7-18 23:23:00

优化过的


已完成,通过验证2,877.931.84922.27Mini Collatz Conjecture v6.08 (opencl_intel_gpu)

之前的

3,424.5018.28973.20Mini Collatz Conjecture v6.08 (opencl_intel_gpu)


3,401.2316.11902.93Mini Collatz Conjecture v6.08 (opencl_intel_gpu)


3,167.465.69861.28Mini Collatz Conjecture v6.08 (opencl_intel_gpu)


Intel的显卡、大体提高12%

发表于 2015-7-18 23:25:19

<configuration>
Unrecognized command: <configuration>
verbose=0
items_per_kernel=20
kernels_per_reduction=9
threads=8
sleep=1
build_options=-Werror
Unrecognized command: build_options=-werror
</configuration>
Unrecognized command: </configuration>

从Log看 这3句是多于的

发表于 2015-7-18 23:41:12

Config:verbose=1 items_per_kernel=262144 kernels_per_reduction=8 threads=64 sleep=1-----------》默认参数
Config:verbose=0 items_per_kernel=1048576 kernels_per_reduction=512 threads=256 sleep=1-----》修改后的参数

发表于 2015-7-18 23:44:32

ATI6570 opencl
优化前

3,126.5313.53938.19Mini Collatz Conjecture v6.08 (opencl_amd_gpu)


3,079.091.33857.74Mini Collatz Conjecture v6.08 (opencl_amd_gpu)


3,100.037.31905.94Mini Collatz Conjecture v6.08 (opencl_amd_gpu)

优化后

2,089.141,935.31897.47Mini Collatz Conjecture v6.08 (opencl_amd_gpu)


2,205.212,047.81887.59Mini Collatz Conjecture v6.08 (opencl_amd_gpu)

大体提升 25%

页: [1] 2
查看完整版本: CC显卡计算效率大幅下滑

论坛官方淘宝店开业啦~