找回密码
 新注册用户
搜索
查看: 25894|回复: 38

各分布项目推荐CPU

[复制链接]
发表于 2005-2-21 14:36:29 | 显示全部楼层 |阅读模式
1. seti@home 效率最高P-M(指令融合+QDR+大容量L2而A64却表现不佳)  产量最高P4 HT(QDR FSB+HT+双通道)
2. UD考虑到价格,速度,功耗综合因素 CIII最好 产量最高P4 HT(运行两个UD)
3. folding@home 因项目而异,没有指令优化的话 Athlon XP性价比最好,SSE优化还是Athlon XP(CIII也很不错,就是频率低一点),SSE2优化毫无疑问是P4 HT(使用倍速引擎加速SSE2+HT,A64和P-M虽然支持SSE2但速度就...)
4. D2OL 同UD
5. SoB P4 HT
6. RC5&OGR PowerPC G4(G5极速引擎的Altivec某几个指令延迟比G4高,X86忽略不计)

抛砖引玉,毕竟一个人能接触到的CPU相对少点。
目的是希望分布运算爱好者能够更好更高效的利用手里的运算资源。

这些只是我个人的观点,错误在所难免,欢迎指正!
回复

使用道具 举报

发表于 2005-2-21 17:24:28 | 显示全部楼层
Snake_SH  在 2005-2-21 14:36 发表:
1. seti@home 效率最高P-M(指令融合+QDR+大容量L2而A64却表现不佳)  产量最高P4 HT(QDR FSB+HT+双通道)

不错啊,好贴!
只是不太明白效率最高和产量最高指的是一样的吗?(就是说到底是P-M快,还是P4 HT快点呢?)
回复

使用道具 举报

发表于 2005-2-21 17:28:11 | 显示全部楼层
我只算过SETI@HOME和folding@home
感觉后者不怎么挑CPU,即便差点的C3一类的也可以算很快,当然和高档的CPU还是有明显差距的,只是不如SETI@HOME差的那么厉害!
回复

使用道具 举报

发表于 2005-2-21 17:32:10 | 显示全部楼层
如 distributed.net 所说,IA32 架构的 CPU 十分适合用作 RC5-72 的大量整数运算(IA32 架构包括 pentium/PII/PIII)。相反,大多数生物科学的项目则需要强劲的 FPU 作浮点运算,所以 d2ol、UD 等项目在 AMD CPU 上执行总会较 Intel CPU 吃香(PIII 的 FPU 比 P4 还要好)。
回复

使用道具 举报

 楼主| 发表于 2005-2-25 02:54:54 | 显示全部楼层
挡我者玩  在 2005-2-21 05:24 PM 发表:

[quote] Snake_SH  在 2005-2-21 14:36 发表:

1. seti@home 效率最高P-M(指令融合+QDR+大容量L2而A64却表现不佳)  产量最高P4 HT(QDR FSB+HT+双通道)


不错啊,好贴!
只是不太明白效率 ...


简单说就是P-M的完成时间比较好看,而相同时间里P4完成的数量比较好看。
回复

使用道具 举报

 楼主| 发表于 2005-2-25 03:09:10 | 显示全部楼层
写得简单了一点,写文章向来就不是我的强项

举个例子
有1台P4 3.6G和1台PowerPC G4 1G,算seti和RC5-72。
P4 seti:18wu/天
G4 seti:3.5wu/天
P4 RC5:40 blocks/天
G4 RC5:200 blocks/天
同样计算一整天P4算seti,G4算RC5比反过来算的总产量要大很多很多,有时候选择比努力更重要。
回复

使用道具 举报

发表于 2005-2-25 12:54:03 | 显示全部楼层
第6个
不要忘记G5的频率要比G4高很多
G5是1.8G起跳
而G4最高才1.25G吧(好像有1.4G的)
回复

使用道具 举报

发表于 2005-2-25 13:51:00 | 显示全部楼层
我反汇编过seti的客户端,发现里面运算部分只用到了FPU的指令

这是P4的架构图

可以看出它适合于做整数运算,因为它的整数单元多且分工明显,简单指令以2倍主频工作
执行SSE/SSE2也相对适合
能执行FPU的浮点单元有两个,但其中一个只能负责搬运数据而不能进行实际运算
相比之下p3也有两个浮点单元,但只有一个能执行FPU
k7有3个浮点单元,均能执行FPU,分别负责搬运数据、加法类、乘法类运算,具有一定的并行性

在CPU频率相同的情况下,FPU的效率k7>p3>p4,这主要是由于管线长度引起的
P-M的架构我没有看过,个人认为是从p3进化来的,管线短,执行效率高,应该对FPU进行了一些改进

至于p4的wu/d多于athlon我觉得主要有以下几个原因:
1、p4频率高,L2大,跟踪缓存大(提高跳转指令执行效率)
2、从seti的代码上看,跳转指令很多,与内存之间的存取操作也不少,看起来不是用ASM优化过,而是用高级语言编写。而大部分的高级语言编译器是以Intel CPU为模型的,更适合于Intel的指令周期(不同CPU执行同一条指令所用周期是不同的,这将影响编译器对指令的安排)
3、Intel是SETI的合作伙伴,而SETI经常被用来测试CPU,Intel可能对seti的编写有“指导”

关于seti对L2的依赖主要是由于其代码不够精简,所用代码和数据都较多,大的L2有利于减少内存存取时间

总的来说,seti的代码有很多可以改进的地方,至于为什么不改,只能问seti了。。。

均为个人观点,欢迎指教
回复

使用道具 举报

发表于 2005-2-25 18:12:25 | 显示全部楼层
楼上写的很好啊!!二级缓存对seti的影响大得很
回复

使用道具 举报

 楼主| 发表于 2005-2-26 00:30:08 | 显示全部楼层
G5 1.8约等于G4 1.3
回复

使用道具 举报

发表于 2005-2-27 19:02:02 | 显示全部楼层
不错不错,我现在算seti classic的两台机器分别是pm和p4ht:)
还有一台athlonxp1800+超频后跑boinc上的seti和einstein,seti估计和classic的差还多,不知道einstein@home哪种cpu比较好

Snake_SH  在 2005-2-21 02:36 PM 发表:

1. seti@home 效率最高P-M(指令融合+QDR+大容量L2而A64却表现不佳)  产量最高P4 HT(QDR FSB+HT+双通道)
2. UD考虑到价格,速度,功耗综合因素 CIII最好 产量最高P4 HT(运行两个UD)
3. folding@home 因项目 ...
回复

使用道具 举报

 楼主| 发表于 2005-2-28 13:35:21 | 显示全部楼层
没算过爱因斯坦,不过你用Athlon XP算是不会差到什么地方去的。
回复

使用道具 举报

发表于 2005-3-5 14:13:36 | 显示全部楼层
SETI我比较喜欢,感觉用PIII和P4算都挺合适,想出数用P4,想省电用PIII。
UD我算的最多,但是现在只用P4算。PIII实在是不出数。我有两台P42.2GHz的laptop和一台P42.4BGHz(oc2.7GHz)的台式机算UD。
folding@home之前也算过一段时间,因为服务器方面总是出问题导致我白算,现在停止了。CPU计算特性和UD比较接近。
回复

使用道具 举报

发表于 2005-3-5 17:27:13 | 显示全部楼层
相比之下。俺的机子太差拉,是要换台机子了。
回复

使用道具 举报

发表于 2005-3-5 18:48:42 | 显示全部楼层
今天在einstein@home的论坛上看了一些讨论,总的说来AMD的CPU运算效率都还是不错的。

ud以前算过不少时间,不过感觉它的积分算法不怎么样,同样是一个小时,记得那时候我用p4-2.8e算出来还没有c3-1g算出来的积分高。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-5-9 06:25

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表