CC显卡计算效率大幅下滑

砜发表于 2015-7-18 06:33:17

55,008.56222.0314,079.36Solo Collatz Conjecture v6.08 (opencl_intel_gpu)

36,797.3740.2014,143.10Solo Collatz Conjecture v6.04 (opencl_intel_gpu)

49,362.4935.4514,152.23Solo Collatz Conjecture v6.08 (opencl_amd_gpu)

27,496.06604.7214,556.60Solo Collatz Conjecture v6.04 (opencl_amd_gpu)

砜发表于 2015-7-18 06:33:48

http://boinc.thesonntags.com/collatz/results.php?hostid=303350

砜发表于 2015-7-18 06:38:43

48,195.12814.5314,804.21Solo Collatz Conjecture v6.08 (opencl_intel_gpu)

24,212.48101.7914,437.23Solo Collatz Conjecture v6.03 (opencl_intel_gpu)
另一台机器

vincentdark 发表于 2015-7-18 11:15:17

他们换包了，然后计算时间变长，但分数却没变……

zhouxiaobo 发表于 2015-7-18 12:58:57

得分率如果不高那就换别的GPU项目吧。

kittyjia 发表于 2015-7-18 13:15:04

本帖最后由 kittyjia 于 2015-7-18 15:45 编辑

在BOINC的子目录里，找有关mini，solo，large三个计算程序对应的XML文件，用记事本打开，拷入下面代码：
verbose=1
items_per_kernel=21
kernels_per_reduction=9
threads=10
sleep=1
lut_size=14
build_options=-Werror
保存即可。
这个代码对于cuda55或opencl-nvidia-gpu包通吃。
其来源在CC留言板：http://boinc.thesonntags.com/collatz/forum_thread.php?id=1009
上面代码数值可根据个人的显卡的档次灵活选用。加入此代码后，用750Ti计算large包，耗时78400s左右，用760计算large包，耗时37300s左右。

砜发表于 2015-7-18 18:30:14

不知道对Intel的GPU咋样、
我的显卡级别比较低
所以速度应该差很多
试试

砜发表于 2015-7-18 18:48:43

我配了Intel的CPU、和用opencl计算的ATI显卡
目前没出错。
不知道结果咋样
计算2天看看

ATI6570

砜发表于 2015-7-18 18:49:19

verbose=0
items_per_kernel=20
kernels_per_reduction=9
threads=8
sleep=1
build_options=-Werror

kittyjia 发表于 2015-7-18 22:05:00

lut_size=14语句是利用显卡二级缓存的，从留言板文章看，14的意思是8(2^14)=128K，即显卡的二级缓存L2 cache大于128K就可以用14的数值。显卡L2 cache可用AIDA64软件查看。

砜发表于 2015-7-18 23:20:52

Intel 显卡。。。。
   Architecture                                  Intel Gen7.5
   Execution Units (EU)                            20
   L1 Instruction Cache                            32 KB
   L1 Texture Cache                               4 KB
   L2 Texture Cache                               24 KB
   L3キャッシュ                                  256 KB
   Unified Return Buffer                         256 KB

AMD的
   Architecture                                  ATI Terascale 2 (VLIW5)
   Compute Units (CU)                            5
   SIMD Per Compute Unit                         1
   SIMD Width                                     16
   SIMD Instruction Width                         5
   L1キャッシュ                                  8 KB per CU
   Local Data Share                               32 KB
   Global Data Share                               64 KB

可能都没那么大的二级缓存

砜发表于 2015-7-18 23:23:00

优化过的

已完成，通过验证2,877.931.84922.27Mini Collatz Conjecture v6.08 (opencl_intel_gpu)

之前的

3,424.5018.28973.20Mini Collatz Conjecture v6.08 (opencl_intel_gpu)

3,401.2316.11902.93Mini Collatz Conjecture v6.08 (opencl_intel_gpu)

3,167.465.69861.28Mini Collatz Conjecture v6.08 (opencl_intel_gpu)

Intel的显卡、大体提高12％

砜发表于 2015-7-18 23:25:19

<configuration>
Unrecognized command: <configuration>
verbose=0
items_per_kernel=20
kernels_per_reduction=9
threads=8
sleep=1
build_options=-Werror
Unrecognized command: build_options=-werror
</configuration>
Unrecognized command: </configuration>

从Log看这3句是多于的

砜发表于 2015-7-18 23:41:12

Config:verbose=1 items_per_kernel=262144 kernels_per_reduction=8 threads=64 sleep=1-----------》默认参数
Config:verbose=0 items_per_kernel=1048576 kernels_per_reduction=512 threads=256 sleep=1-----》修改后的参数

砜发表于 2015-7-18 23:44:32

ATI6570 opencl
优化前

3,126.5313.53938.19Mini Collatz Conjecture v6.08 (opencl_amd_gpu)

3,079.091.33857.74Mini Collatz Conjecture v6.08 (opencl_amd_gpu)

3,100.037.31905.94Mini Collatz Conjecture v6.08 (opencl_amd_gpu)

优化后

2,089.141,935.31897.47Mini Collatz Conjecture v6.08 (opencl_amd_gpu)

2,205.212,047.81887.59Mini Collatz Conjecture v6.08 (opencl_amd_gpu)

大体提升 25％

页: [1] 2

中国分布式计算论坛's Archiver

CC显卡计算效率大幅下滑