找回密码
 新注册用户
搜索
楼主: Youth

Einstein@Home 优化程序介绍 (S4R2, 已失效)

[复制链接]
 楼主| 发表于 2006-3-20 13:40:06 | 显示全部楼层
又出了个s38版本,试图解决之前针对FPU的版本所带来的计算精度方面的问题。
并不是说之前的版本计算精度差,其实精度过高也可能导致计算结果验证失败,因为绝大多数用户用的还是官方的windows版本,结果验证的时候一般也就是参考这个版本的计算结果。

作者原话:

I tried to find the reason of the validation problem.
I know that the precision of C37 has to be very near to the original.
I made a code that gave poor results, but the validator accepted them!
So, I examined the codes again and I saw there is a critical point.
Sometimes the exponent of the number format is not enough.
Probably this is the reason of the validation problem of SSE based linux application too.

exponent size of SSE -> 8 bit
exponent size of SSE2 -> 11 bit
exponent size of FPU -> 15 bit

C37 uses FPU (maximum precision) for the calculation, but it needs about 4 bit longer exponent than original.
I checked C37 on my computers with 70-80 units without any error.
A longer test period would be able to determine the frequency of the faults.

I hope that S38 will solve this exponent problem.
It consists a very aggressive precision combination method to extend the precision.

[ Last edited by Youth on 2006-3-20 at 13:41 ]
回复

使用道具 举报

发表于 2006-3-21 12:44:36 | 显示全部楼层
S38比C37快25%呢
回复

使用道具 举报

发表于 2006-3-21 16:38:51 | 显示全部楼层
引用 lightwing 在 2006-3-21 12:44 时的帖子:
S38比C37快25%呢

根據我最近兩次的運算結果
分別是C37和S38算的
8405秒:12575秒

s38大約只花原來66%的時間...
回复

使用道具 举报

发表于 2006-3-21 17:39:39 | 显示全部楼层
用了优化后,时间减少50%多.
1.gif
回复

使用道具 举报

 楼主| 发表于 2006-3-21 19:50:49 | 显示全部楼层
s38确实快,我在p4-2.8g上从13000s减少到11000s。
回复

使用道具 举报

发表于 2006-3-21 22:57:11 | 显示全部楼层
怪不得官方迟迟没有发布优化后的版本,原来是担心激增的上传/确认给磁盘带来的巨大压力…………汗
是要等磁盘控制器升级之后再说,很快的大家的“好日子”就要到头了
同志们、加紧时间向前冲吧!
回复

使用道具 举报

发表于 2006-3-21 23:46:59 | 显示全部楼层
引用 lightwing 在 2006-3-21 12:44 时的帖子:
S38比C37快25%呢


啥CPU呢?
回复

使用道具 举报

 楼主| 发表于 2006-3-22 10:04:03 | 显示全部楼层
呵呵,是啊,好日子不多了:)

We've now incorporated Akosf's improvements into our source code. But we haven't started distributing this faster application yet, for a simple reason. We are worried that our project server might break with the increased upload/validation disk load since the work will be getting done faster when we begin distributing new apps to all users. So we're upgrading the disk controllers and should be ready for this increased load soon.

by Bruce Allen

引用 lightwing 在 2006-3-21 10:57 PM 时的帖子:
怪不得官方迟迟没有发布优化后的版本,原来是担心激增的上传/确认给磁盘带来的巨大压力…………汗
是要等磁盘控制器升级之后再说,很快的大家的“好日子”就要到头了
同志们、加紧时间向前冲 ...
回复

使用道具 举报

发表于 2006-3-22 11:58:32 | 显示全部楼层
引用 sakeki 在 2006-3-21 23:46 时的帖子:


啥CPU呢?

多数是INTE的。
回复

使用道具 举报

发表于 2006-3-22 12:39:41 | 显示全部楼层
引用 sakeki 在 2006-3-21 23:46 时的帖子:


啥CPU呢?

A64的
目前算一个也就65m,比原来的seti还快,疯掉了
回复

使用道具 举报

 楼主| 发表于 2006-3-22 13:43:07 | 显示全部楼层
s39又出来了...下载见一楼。
回复

使用道具 举报

发表于 2006-3-22 14:03:30 | 显示全部楼层
匈牙利人的数学才能真不是盖的,利害!
回复

使用道具 举报

发表于 2006-3-22 17:02:40 | 显示全部楼层
S39果然快~

p4 3.0@3.3

S38 = ~2.5个小时完成一个wu
S39 = ~2个小时就完成一个wu

S38 -> S39 提升了 ~20%

[ Last edited by 蜻蜓 on 2006-4-13 at 18:54 ]
回复

使用道具 举报

发表于 2006-3-22 21:58:25 | 显示全部楼层
楼上用什么CPU和OS?
回复

使用道具 举报

发表于 2006-3-22 22:07:06 | 显示全部楼层
引用 DF3-CQB 在 2006-3-22 21:58 时的帖子:
楼上用什么CPU和OS?


汗。。。这个优化版本只有win的吧?


winxp sp2

p4 3.0 超 3.3
1gb 667mhz ddr2 ram

[ Last edited by 蜻蜓 on 2006-3-22 at 22:12 ]
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~
欢迎大家多多支持基金会~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-5-5 17:10

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表