找回密码
 新注册用户
搜索
楼主: ONLY

近一周来折腾Gentoo Linux的一点点成果~~~

  [复制链接]
 楼主| 发表于 2012-9-25 09:14:42 | 显示全部楼层
本帖最后由 ONLY 于 2012-9-25 09:18 编辑
回复  金鹏

外频103的成绩?很不错。
帮你整理了一下TPF情况,rr_interval=100的时候也出现了若干次15m31 ...
cuda 发表于 2012-9-24 16:48


劳烦兄弟看下BFS补丁中附带的这个说明文件,貌似rr_interval的值也存在某个“优化范围”?

sched-BFS.txt (19.64 KB, 下载次数: 717)

另外问下兄弟,用ICC编译出的内核,配置基本相同,在启动的时候,提示大致如下:

Decompressing Kernel, Kernel ELF Done.
Starting the Kernel...


于是停在这里不动了,会是什么原因?
回复

使用道具 举报

 楼主| 发表于 2012-9-25 09:21:08 | 显示全部楼层
回复  cuda
103外频 3.193G
意味着设置100值比较合适?
金鹏 发表于 2012-9-24 16:52


这个值对于跑FAH来说,或会存在一个最合理的设置,待CUDA兄弟研究过说明文件后,看看他有什么新发现~~~

(偶昨天晚上看了很久,神马都木有发现)~~~   

另外,金版的机器,内存小参调过了木有?

若能减少小参,也可获得性能提升哦~~~
回复

使用道具 举报

 楼主| 发表于 2012-9-25 09:50:08 | 显示全部楼层
回复 194# 金鹏

金版请测试下这个核心,看能否再获得1秒左右的提升~~~

kernel.3.5.4.full.rar (2.81 MB, 下载次数: 1130)

(别忘了执行lilo)~~~
回复

使用道具 举报

发表于 2012-9-25 11:31:27 | 显示全部楼层
从说明文件看不出有优化范围,似乎就是是这个值越大性能越高,值越小延迟越低。
能否把icc编译的内核贴上来,我也跑跑看。

劳烦兄弟看下BFS补丁中附带的这个说明文件,貌似rr_interval的值也存在某个“优化范围”?
sched-BFS.txt (19.64 KB)
另外问下兄弟,用ICC编译出的内核,配置基本相同,在启动的时候,提示大致如下:
Decompressing Kernel, Kernel ELF Done.
Starting the Kernel...
于是停在这里不动了,会是什么原因?
ONLY 发表于 2012-9-25 09:14
回复

使用道具 举报

发表于 2012-9-25 11:41:54 | 显示全部楼层
本帖最后由 cuda 于 2012-9-25 12:08 编辑

暂时没见到有比金版同频性能更高的,能调一调内存小参就更保险了。
记得金版的2687W以前的成绩中规中矩,但自从用了xiaoren6412的cpu patch以后就突然变快了很多,再加上超外频和ONLY的内核提速,15:31的成绩已经超过很多E5-2690了。
不过,那个CPU补丁是否真的打上了一直还存在疑问,很有意思。

金版的这个成绩算是打破了世界纪录否?
ONLY 发表于 2012-9-25 09:06
回复

使用道具 举报

发表于 2012-9-25 13:51:37 | 显示全部楼层
回复 195# ONLY


    同频下的TPF是不是最高需要CUDA兄弟证实
回复

使用道具 举报

发表于 2012-9-25 13:54:38 | 显示全部楼层
回复 197# ONLY

小参木有调过,很难伺候的,现在跑的默认9 9 9 24 开启NUMA和内存交错
回复

使用道具 举报

发表于 2012-9-25 14:00:32 | 显示全部楼层
回复 200# cuda

microcode.dat这个东东有了以后的确快了一些,也许是我这个ES的U不能被系统完全识别,打了以后起到了鸡血效能?
回复

使用道具 举报

 楼主| 发表于 2012-9-25 14:51:27 | 显示全部楼层
从说明文件看不出有优化范围,似乎就是是这个值越大性能越高,值越小延迟越低。
能否把icc编译的内核贴上来 ...
cuda 发表于 2012-9-25 11:31


ICC编译的内核:

kernel.2.6.36.rar (3.59 MB, 下载次数: 1084)

在偶的机器上,编译了两种不同版本的核心,但都是同样的问题,无法启动~~~

下面的这两个是早前编译的,均无法启动:

Icc.rar (5.89 MB, 下载次数: 1132)
回复

使用道具 举报

 楼主| 发表于 2012-9-25 14:53:36 | 显示全部楼层
本帖最后由 ONLY 于 2012-9-25 15:17 编辑
回复  ONLY

小参木有调过,很难伺候的,现在跑的默认9 9 9 24 开启NUMA和内存交错 ...
金鹏 发表于 2012-9-25 13:54


内存频率多高?DDR3-1600?

可否说下内存型号?

Edit:翻了下金版以前的帖子,看到了内存是金士顿的套装~~~

这个套装超频能力的确一般,还比不过三星的黑条~~~   
回复

使用道具 举报

发表于 2012-9-25 15:31:13 | 显示全部楼层
回复 205# ONLY

骇客神条 Genesis系列 DDR3 1600 32GB(4Gx8条)    KHX1600C9D3K8/32GX
回复

使用道具 举报

发表于 2012-9-25 16:10:10 | 显示全部楼层
回复 204# ONLY

刚才试过了,一样的症状。在编译过程中有没有什么错误提示?
回复

使用道具 举报

 楼主| 发表于 2012-9-25 16:19:42 | 显示全部楼层
本帖最后由 ONLY 于 2012-9-25 16:20 编辑
回复  ONLY

刚才试过了,一样的症状。在编译过程中有没有什么错误提示? ...
cuda 发表于 2012-9-25 16:10


神马都木有~~~   

就停在那里,一动不动~~~

或许是ICH驱动太老的缘故?偶的2600K用置顶的镜像也无法启动安装进程的,是在其他电脑上面写好镜像,再插上跑分滴~~~

或许换台稍旧点的电脑可以试试~~~

(话说Q6600在搬家后又不幸趴下,暂时点不亮,否则可以试试ICC编译的内核)~~~
回复

使用道具 举报

 楼主| 发表于 2012-9-25 22:29:06 | 显示全部楼层
本帖最后由 ONLY 于 2012-9-26 10:02 编辑

回复 201# 金鹏

暂时没见到有比金版同频性能更高的,能调一调内存小参就更保险了。
记得金版的2687W以前的成绩中规中矩,但 ...
cuda 发表于 2012-9-25 11:41


在置顶的1.3.4镜像中施用CPU补丁的正确方法大致应该是:

microcode_ctl.rar (3.24 KB, 下载次数: 1042)

下载上面的压缩包,并解压,得到一个microcode_ctl文件,拷贝到跑分机的fah目录,然后在跑分机上执行下面的命令:
  1. cp /usr/local/fah/microcode_ctl /usr/sbin/
  2. chmod +x /usr/sbin/microcode_ctl
复制代码
然后到下面这个地址下载Intel CPU微代码数据文件:

http://downloadcenter.intel.com/ ... e&DwnldId=21385

下载后解压,得到一个microcode.dat文件,拷贝到跑分机的fah目录,再执行下面的命令:
  1. cp /usr/local/fah/microcode.dat /etc/
  2. microcode_ctl -qu
复制代码
如此便可正确加载CPU微代码文件~~~

(日后一旦有更新的.dat文件,只需下载解压拷贝到跑分机的fah目录,重复执行上面的两行命令即可)~~~

正确加载后,对于使用上面楼层的3.5.4核心来说,可以使用下面的命令检查效果:
  1. dmesg | grep microcode
复制代码
在输出的屏幕中,如果看到有revision=xx后面的内容不一致的情况,那么便可说明加载成功!

另外,为了避免每次启动的时候都需要手动输入命令,可以将microcode_ctl -qu这行命令加入到启动脚本中,让系统启动的时候自动加载!

命令如下:
  1. vi /etc/rc.d/rc.fah
复制代码
移动光标到第86行,“Starting FAH Client......”下面的“cd $FPATH”那行,按“O”键,新建一行,输入下面的命令:
  1. microcode_ctl -qu
复制代码
如此,便可让系统在启动的时候,便自动加载CPU数据文件了~~~   

(偶手头的正式版2600K加载补丁文件后,revision=xx的内容便不一致。这个补丁文件的日期是2012-06-06,貌似对正式版的2600K也加了什么补丁)~~

如下图,为施加补丁前的dmesg | grep microcode命令的输出结果:

快照22.jpg

如下图,为施加补丁后的dmesg | grep microcode命令的输出结果,可以看到多出了数行对CPU施加补丁的提示:

快照21.jpg

施加补丁后,对于同一个p6987小包,跑20%的耗时为44分25秒(40%~60%),LOG如下:

[23:45:48] Completed 190000 out of 500000 steps  (38%)
[23:48:01] Completed 195000 out of 500000 steps  (39%)
[23:50:14] Completed 200000 out of 500000 steps  (40%)
[23:52:28] Completed 205000 out of 500000 steps  (41%)
[23:54:41] Completed 210000 out of 500000 steps  (42%)
[23:56:54] Completed 215000 out of 500000 steps  (43%)
[23:59:07] Completed 220000 out of 500000 steps  (44%)
[00:01:20] Completed 225000 out of 500000 steps  (45%)
[00:03:34] Completed 230000 out of 500000 steps  (46%)
[00:05:47] Completed 235000 out of 500000 steps  (47%)
[00:08:00] Completed 240000 out of 500000 steps  (48%)
[00:10:13] Completed 245000 out of 500000 steps  (49%)
[00:12:25] Completed 250000 out of 500000 steps  (50%)
[00:14:39] Completed 255000 out of 500000 steps  (51%)
[00:16:52] Completed 260000 out of 500000 steps  (52%)
[00:19:05] Completed 265000 out of 500000 steps  (53%)
[00:21:18] Completed 270000 out of 500000 steps  (54%)
[00:23:32] Completed 275000 out of 500000 steps  (55%)
[00:25:45] Completed 280000 out of 500000 steps  (56%)
[00:27:58] Completed 285000 out of 500000 steps  (57%)
[00:30:12] Completed 290000 out of 500000 steps  (58%)
[00:32:25] Completed 295000 out of 500000 steps  (59%)
[00:34:39] Completed 300000 out of 500000 steps  (60%)
[00:36:52] Completed 305000 out of 500000 steps  (61%)
[00:39:04] Completed 310000 out of 500000 steps  (62%)


未施加补丁时,跑同一个p6987小包20%的耗时为44分19秒(70%~90%),LOG如下:

[00:58:35] Completed 340000 out of 500000 steps  (68%)
[01:00:48] Completed 345000 out of 500000 steps  (69%)
[01:03:02] Completed 350000 out of 500000 steps  (70%)
[01:05:15] Completed 355000 out of 500000 steps  (71%)
[01:07:27] Completed 360000 out of 500000 steps  (72%)
[01:09:41] Completed 365000 out of 500000 steps  (73%)
[01:11:53] Completed 370000 out of 500000 steps  (74%)
[01:14:06] Completed 375000 out of 500000 steps  (75%)
[01:16:20] Completed 380000 out of 500000 steps  (76%)
[01:18:32] Completed 385000 out of 500000 steps  (77%)
[01:20:45] Completed 390000 out of 500000 steps  (78%)
[01:22:58] Completed 395000 out of 500000 steps  (79%)
[01:25:12] Completed 400000 out of 500000 steps  (80%)
[01:27:25] Completed 405000 out of 500000 steps  (81%)
[01:29:38] Completed 410000 out of 500000 steps  (82%)
[01:31:51] Completed 415000 out of 500000 steps  (83%)
[01:34:04] Completed 420000 out of 500000 steps  (84%)
[01:36:17] Completed 425000 out of 500000 steps  (85%)
[01:38:29] Completed 430000 out of 500000 steps  (86%)
[01:40:42] Completed 435000 out of 500000 steps  (87%)
[01:42:55] Completed 440000 out of 500000 steps  (88%)
[01:45:08] Completed 445000 out of 500000 steps  (89%)
[01:47:21] Completed 450000 out of 500000 steps  (90%)
[01:49:34] Completed 455000 out of 500000 steps  (91%)
[01:51:46] Completed 460000 out of 500000 steps  (92%)


从以上跑分情况看,打上补丁后,跑20%的时间慢了大约6秒,这是正常的TPF波动还是补丁带来的负面影响?

请有条件的算友一起来进行测试~~~
回复

使用道具 举报

 楼主| 发表于 2012-9-25 22:38:58 | 显示全部楼层
本帖最后由 ONLY 于 2012-9-25 22:48 编辑
回复  cuda

microcode.dat这个东东有了以后的确快了一些,也许是我这个ES的U不能被系统完全识别,打了以后 ...
金鹏 发表于 2012-9-25 14:00


对于3.5.4核心,施加补丁的方法见前一楼层~~~

可以输入下面的命令查看是否对CPU施加了补丁:
  1. dmesg | grep microcode
复制代码
在未加载补丁前,屏幕输出内容大致如下所示(四核机示例):

[    1.964868] microcode: CPU0 sig=0x20655, pf=0x1, revision=0x2
[    1.964976] microcode: CPU1 sig=0x20655, pf=0x1, revision=0x2
[    1.965100] microcode: CPU2 sig=0x20655, pf=0x1, revision=0x2
[    1.965226] microcode: CPU3 sig=0x20655, pf=0x1, revision=0x2
[    1.965679] microcode: Microcode Update Driver: v2.00 <tigran@aivazian.fsnet.co.uk>, Peter Oruba


在正确施加补丁后,上面的命令,输出内容应该大致如下所示:

[    1.964868] microcode: CPU0 sig=0x20655, pf=0x1, revision=0x2
[    1.964976] microcode: CPU1 sig=0x20655, pf=0x1, revision=0x2
[    1.965100] microcode: CPU2 sig=0x20655, pf=0x1, revision=0x2
[    1.965226] microcode: CPU3 sig=0x20655, pf=0x1, revision=0x2
[    1.965679] microcode: Microcode Update Driver: v2.00 <tigran@aivazian.fsnet.co.uk>, Peter Oruba
[    1.965679] microcode: CPU1 patch=0x32,revision=0x4
[    1.965679] microcode: CPU2 patch=0x32,revision=0x4
[    1.965679] microcode: CPU3 patch=0x32,revision=0x4
[    1.965679] microcode: CPU4 patch=0x32,revision=0x4


施加补丁前,会有N行内容(N=CPU个数),施加后,会多出N行内容(示例中蓝色字体)~~~

且可看到revision=xx后面的字符明显不同~~~

(此法或可解决金版ES 5649在原生Linux环境下效能不高的问题)~~~   
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-7-3 15:39

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表