找回密码
 新注册用户
搜索
楼主: ONLY

近一周来折腾Gentoo Linux的一点点成果~~~

  [复制链接]
发表于 2012-9-18 19:05:39 | 显示全部楼层
回复 147# ONLY

收到,明天到单位试试
回复

使用道具 举报

发表于 2012-9-19 10:47:41 | 显示全部楼层
应该没有其他因素影响,只是在web配置页面选择Nehelem和Sandy Bridge的区别~~~

现在编译的内核编译参 ...
ONLY 发表于 2012-9-10 21:43



    貌似会自动加上一堆 -no-mmx -no-sse -no-sse2 所以march都废了,另外可以直接march=native,自动选择
回复

使用道具 举报

发表于 2012-9-19 13:08:37 | 显示全部楼层
在E5645上似乎有0.1%-0.2%的提高,非常不错,之前用BFS所看到的都是负的效果。
能确定为什么现在BFS有正效果了吗?ONLY还是应该搞一台双路E5进行测试,现在这样等反馈效率太低了。

回复  cuda

147楼有最新的内核,基于最新的3.5.4内核,有请兄弟试用!
ONLY 发表于 2012-9-18 17:47
回复

使用道具 举报

 楼主| 发表于 2012-9-19 15:30:21 | 显示全部楼层
本帖最后由 ONLY 于 2012-9-19 15:38 编辑
在E5645上似乎有0.1%-0.2%的提高,非常不错,之前用BFS所看到的都是负的效果。
能确定为什么现在BFS有正效 ...
cuda 发表于 2012-9-19 13:08


大约是由于CPU Freqency ondemand default的原因~~~

快照3.jpg

早前过于纠结,只追求“Performance”,后来看过了BFS FAQ和其他一些Linux内核配置的文档,知道了设为"ondemand default"的必要性~~~

而且,BFS补丁貌似只会施加到ondemand,不会施加到其他的文件~~~

所以,选择了这个配置示例进行试验~~~

能有起色再来鼓捣其他的优化措施~~~

说到双路E5,天可怜见,偶所处的单位非IT行业,偶所从事的工作非IT相关,仅凭个人兴趣使然~~~

在偶还木有摆脱房奴身份前,是不会有足够的预算用于Folding跑分滴~~~   

当然,贡献自己的能量是必须滴!哪怕有诸多的困难神马地~~~

另外,小声说下,这个内核是针对SNB / SNB-E / SNB-EP优化地,能够在i7平台上也获得性能提升,有点小意外啊,挖哈哈~~~
回复

使用道具 举报

 楼主| 发表于 2012-9-19 15:43:46 | 显示全部楼层
回复  ONLY


    你可以试用pf-sources,目前是3.5.3

pf-sources

The pf-sources kernel brings togeth ...
tomcatzh 发表于 2012-9-5 15:51


这个也试用过了,集成了BFS、BFQ、UKSM等等,太多了~~~

对于专门针对Folding跑分的机器来说,BFQ用处不是很大,UKSM则还要占用1%左右的CPU,不划算~~~

所以~~~

还是手动打补丁更有针对性些~~~
回复

使用道具 举报

发表于 2012-9-19 17:11:24 | 显示全部楼层
回复 154# ONLY


    双路的机器等我周末空下来打包然后寄给你。
回复

使用道具 举报

发表于 2012-9-19 23:13:44 | 显示全部楼层
回复 154# ONLY

上次3.6-rc4内核速度比较快,是不是也用了ondemand default?
回复

使用道具 举报

 楼主| 发表于 2012-9-20 09:58:44 | 显示全部楼层
回复  ONLY


    双路的机器等我周末空下来打包然后寄给你。
Keyco 发表于 2012-9-19 17:11


感谢大神提供折腾的机会!   
回复

使用道具 举报

 楼主| 发表于 2012-9-20 09:59:24 | 显示全部楼层
回复  ONLY

上次3.6-rc4内核速度比较快,是不是也用了ondemand default?
cuda 发表于 2012-9-19 23:13


3.6-rc4内核用的是Preformance default~~~
回复

使用道具 举报

发表于 2012-9-20 15:46:57 | 显示全部楼层
本帖最后由 金鹏 于 2012-9-20 16:01 编辑

回复 147# ONLY

能进入系统正常计算,还是不能识别显卡,看不到那排小企鹅 屏幕字体大得出奇,估计分辨率很低,效能比CUDA的3.2.9快了3秒,
SYS占用平均在6.2%上下,也比CUDA的6.7%好些
首位R21标号8101包跑出15:47 TPF相当给力了


CUDA 3.2.9核心

1.PNG


神医3.5.4核心


2.PNG
回复

使用道具 举报

发表于 2012-9-20 16:35:21 | 显示全部楼层
回复 160# 金鹏

有没有调一下/proc/sys/kernel/rr_interval的值?也许能再快几秒。
不过调这个值后有可能带来难以触发DLB的副作用。
回复

使用道具 举报

 楼主| 发表于 2012-9-20 17:40:22 | 显示全部楼层
回复  金鹏

有没有调一下/proc/sys/kernel/rr_interval的值?也许能再快几秒。
不过调这个值后有可能带来 ...
cuda 发表于 2012-9-20 16:35


9月9日,周末,很确定偶木有远程动2600K上面的任何东西~~~

跑个p6978包,竟然自动触发了DLB,见图:

快照20.jpg

触发后的TPF仅2分11秒,比其他包大约要快上3秒左右~~~

偶木有用The Kraken插件的,最近的核心大战,编译太多核心了,配置文件也太多了,偶还在努力的回溯,希望能找到触发DLB的核心设置~~~   

评分

参与人数 1基本分 +4 收起 理由
muclemanxb + 4 就你自己乱战,加分鼓励^_^

查看全部评分

回复

使用道具 举报

发表于 2012-9-20 17:40:30 | 显示全部楼层
回复 161# cuda

没有调,等稳定几个包后再试试
回复

使用道具 举报

发表于 2012-9-20 18:47:22 | 显示全部楼层
神医你折腾完以后,看看要不尝试使用按摩店家open64 kit和专门优化的lib编译一个kernel对比一下、
回复

使用道具 举报

发表于 2012-9-20 18:48:20 | 显示全部楼层
还有,就是项目管理追溯没建立起来啊,哈哈哈哈哈哈哈哈
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~
欢迎大家多多支持基金会~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-7-1 16:26

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表