找回密码
 新注册用户
搜索
楼主: ONLY

近一周来折腾Gentoo Linux的一点点成果~~~

  [复制链接]
发表于 2012-9-10 13:41:49 | 显示全部楼层
当然加了。等等看看金版的双路E5效果如何。
回复

使用道具 举报

发表于 2012-9-10 14:54:08 | 显示全部楼层
更正一下:刚才用原先的3.2.9内核再测了一下,结果6901的TPF也是15:53,两个内核成绩完全相同。
这样看来这10几秒的提升是其他原因造成的,有点白高兴了。不知道为什么AVX也没有效果。
回复

使用道具 举报

发表于 2012-9-10 16:22:51 | 显示全部楼层
回复 55# ONLY
回复 61# cuda

进不去系统!DEBUG显示AA
(reserved for ASL (see ASL status codes section below)

1.jpg
回复

使用道具 举报

 楼主| 发表于 2012-9-10 16:43:00 | 显示全部楼层
本帖最后由 ONLY 于 2012-9-10 16:45 编辑

Test第6版:

3213.test6.rar (2.53 MB, 下载次数: 1550)


BFS:
100 Hz
No Tickless
No preemption
CPU frequency scaling, ondemand default
回复

使用道具 举报

 楼主| 发表于 2012-9-10 16:50:57 | 显示全部楼层
Test第7版:

3213.test7.rar (2.55 MB, 下载次数: 1592)

BFS:

300 Hz
Tickless
Full preemption
CPU frequency scaling, ondemand default
回复

使用道具 举报

 楼主| 发表于 2012-9-10 16:52:09 | 显示全部楼层
更正一下:刚才用原先的3.2.9内核再测了一下,结果6901的TPF也是15:53,两个内核成绩完全相同。
这样看来这 ...
cuda 发表于 2012-9-10 14:54


在硬件平台基本相仿的情况下,老外能跑出什么样的成绩?

差距有多大?
回复

使用道具 举报

 楼主| 发表于 2012-9-10 17:09:56 | 显示全部楼层
Kernel 3.6 rc-4版内核,默认设置,GCC使用-Ofast -flto编译参数,未打BFS补丁:

3213.3.6.rar (4.88 MB, 下载次数: 1628)
回复

使用道具 举报

发表于 2012-9-10 17:30:25 | 显示全部楼层
本帖最后由 cuda 于 2012-9-10 17:34 编辑

老外比较懒,大多直接用Linux发行版自带的内核,效率大约比优化配置过的高版本内核略低2-3%。
金版的双路E5-2687W跑8101的15m42s的TPF是目前所见最高效的成绩了,比我测试过的双路E5高。
不过许多老外用写内存SPD的方法调小参,也能提高不少PPD。

在硬件平台基本相仿的情况下,老外能跑出什么样的成绩?
差距有多大? ...
ONLY 发表于 2012-9-10 16:52
回复

使用道具 举报

发表于 2012-9-10 18:31:44 | 显示全部楼层
这个的TPF也是15m53s,看来想要提高1秒都不简单。

Kernel 3.6 rc-4版内核,默认设置,GCC使用-Ofast -flto编译参数,未打BFS补丁:
ONLY 发表于 2012-9-10 17:09
回复

使用道具 举报

发表于 2012-9-10 19:24:07 | 显示全部楼层
>>>不知道为什么AVX也没有效果。

不知道有没有考虑如下因素:
1、内核使用自带的编译参数(和 gentoo 的 make.conf 无关),且设置是很保守的,肯定没有显式支持 AVX,一般也就 -march=core2 / -march=opteron -O2。
2、内核主要是不太适合矢量化的整数运算,即使打开 AVX 也帮不上什么忙 。加密部分是个特例,但应用程序一般会用 user space
的库。
回复

使用道具 举报

发表于 2012-9-10 20:38:29 | 显示全部楼层
回复 67# ONLY
回复 68# cuda


折腾了一个下午,TEST5/6都不能进入,TEST7进入一不小心把LILO折腾崩溃了,3.6折腾到需要输入回车或者继续检测显卡,操作后直接重启,最后换成TEST7也被传染检测显卡然后重启。

明天空了再试试
回复

使用道具 举报

发表于 2012-9-10 20:49:49 | 显示全部楼层
回复 71# 金鹏

这个不大正常,我测试没遇到这个问题。
更新内核后有没有执行lilo语句?会不会是没执行lilo语句带来的副作用?
回复

使用道具 举报

发表于 2012-9-10 20:56:48 | 显示全部楼层
回复 72# cuda


    的确没执行LILO语句,直接替换非要执行么?
我系统是在3.0.1BFS基础上升级的
  1. cp /usr/local/fah/3213.test7.kernel /boot/linux-3.0.1-core2
  2. lilo
复制代码
回复

使用道具 举报

发表于 2012-9-10 21:00:55 | 显示全部楼层
的确如此。FAH采用静态链接,未使用本地库,也不能重新编译。我们想要优化能做的东西不多,只能隔靴搔痒。不过1%量级的提升还是可能的。
AVX内核以前见过有人评测说能提高近5%的效率,现在看来可能有些夸大。

>>>不知道为什么AVX也没有效果。

不知道有没有考虑如下因素:
1、内核使用自带的编译参数(和 gentoo 的 make.conf 无关),且设置是很保守的,肯定没有显式支持 AVX,一般也就 -march=core2 / -march=opteron -O2。
2、内核主要是不太适合矢量化的整数运算,即使打开 AVX 也帮不上什么忙 。加密部分是个特例,但应用程序一般会用 user space
的库。
mrks 发表于 2012-9-10 19:24
回复

使用道具 举报

发表于 2012-9-10 21:06:59 | 显示全部楼层
回复 73# 金鹏

lilo的帮助文档中要求每次更新内核后执行一次lilo,可能是需要在引导区写一些数据。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-9-28 01:05

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表