各分布项目推荐CPU

Snake_SH · 发表于 2005-2-21 14:36:29

1. seti@home 效率最高P-M（指令融合+QDR+大容量L2而A64却表现不佳）产量最高P4 HT（QDR FSB+HT+双通道）
2. UD考虑到价格，速度，功耗综合因素 CIII最好产量最高P4 HT（运行两个UD）
3. folding@home 因项目而异，没有指令优化的话 Athlon XP性价比最好，SSE优化还是Athlon XP（CIII也很不错，就是频率低一点），SSE2优化毫无疑问是P4 HT（使用倍速引擎加速SSE2+HT，A64和P-M虽然支持SSE2但速度就...）
4. D2OL 同UD
5. SoB P4 HT
6. RC5&OGR PowerPC G4（G5极速引擎的Altivec某几个指令延迟比G4高，X86忽略不计）

抛砖引玉，毕竟一个人能接触到的CPU相对少点。
目的是希望分布运算爱好者能够更好更高效的利用手里的运算资源。

这些只是我个人的观点，错误在所难免，欢迎指正！

挡我者玩 · 发表于 2005-2-21 17:24:28

Snake_SH 在 2005-2-21 14:36 发表:
1. seti@home 效率最高P-M（指令融合+QDR+大容量L2而A64却表现不佳）产量最高P4 HT（QDR FSB+HT+双通道）

不错啊，好贴！
只是不太明白效率最高和产量最高指的是一样的吗？（就是说到底是P-M快，还是P4 HT快点呢？）

挡我者玩 · 发表于 2005-2-21 17:28:11

我只算过SETI@HOME和folding@home
感觉后者不怎么挑CPU，即便差点的C3一类的也可以算很快，当然和高档的CPU还是有明显差距的，只是不如SETI@HOME差的那么厉害！

碧城仙 · 发表于 2005-2-21 17:32:10

如 distributed.net 所说，IA32 架构的 CPU 十分适合用作 RC5-72 的大量整数运算(IA32 架构包括 pentium/PII/PIII)。相反，大多数生物科学的项目则需要强劲的 FPU 作浮点运算，所以 d2ol、UD 等项目在 AMD CPU 上执行总会较 Intel CPU 吃香(PIII 的 FPU 比 P4 还要好)。

Snake_SH · 发表于 2005-2-25 02:54:54

挡我者玩  在 2005-2-21 05:24 PM 发表:

[quote] Snake_SH  在 2005-2-21 14:36 发表:

1. seti@home 效率最高P-M（指令融合+QDR+大容量L2而A64却表现不佳）  产量最高P4 HT（QDR FSB+HT+双通道）

不错啊，好贴！
只是不太明白效率 ...

简单说就是P-M的完成时间比较好看，而相同时间里P4完成的数量比较好看。

Snake_SH · 发表于 2005-2-25 03:09:10

写得简单了一点，写文章向来就不是我的强项

举个例子
有1台P4 3.6G和1台PowerPC G4 1G，算seti和RC5-72。
P4 seti：18wu/天
G4 seti：3.5wu/天
P4 RC5：40 blocks/天
G4 RC5：200 blocks/天
同样计算一整天P4算seti，G4算RC5比反过来算的总产量要大很多很多，有时候选择比努力更重要。

Lightalt · 发表于 2005-2-25 12:54:03

第6个
不要忘记G5的频率要比G4高很多
G5是1.8G起跳
而G4最高才1.25G吧（好像有1.4G的）

JUST · 发表于 2005-2-25 13:51:00

我反汇编过seti的客户端，发现里面运算部分只用到了FPU的指令

这是P4的架构图

可以看出它适合于做整数运算，因为它的整数单元多且分工明显，简单指令以2倍主频工作
执行SSE/SSE2也相对适合
能执行FPU的浮点单元有两个，但其中一个只能负责搬运数据而不能进行实际运算
相比之下p3也有两个浮点单元，但只有一个能执行FPU
k7有3个浮点单元，均能执行FPU，分别负责搬运数据、加法类、乘法类运算，具有一定的并行性

在CPU频率相同的情况下，FPU的效率k7>p3>p4，这主要是由于管线长度引起的
P-M的架构我没有看过，个人认为是从p3进化来的，管线短，执行效率高，应该对FPU进行了一些改进

至于p4的wu/d多于athlon我觉得主要有以下几个原因：
1、p4频率高，L2大，跟踪缓存大（提高跳转指令执行效率）
2、从seti的代码上看，跳转指令很多，与内存之间的存取操作也不少，看起来不是用ASM优化过，而是用高级语言编写。而大部分的高级语言编译器是以Intel CPU为模型的，更适合于Intel的指令周期（不同CPU执行同一条指令所用周期是不同的，这将影响编译器对指令的安排）
3、Intel是SETI的合作伙伴，而SETI经常被用来测试CPU，Intel可能对seti的编写有“指导”

关于seti对L2的依赖主要是由于其代码不够精简，所用代码和数据都较多，大的L2有利于减少内存存取时间

总的来说，seti的代码有很多可以改进的地方，至于为什么不改，只能问seti了。。。

均为个人观点，欢迎指教

JockWen · 发表于 2005-2-25 18:12:25

楼上写的很好啊！！二级缓存对seti的影响大得很

Snake_SH · 发表于 2005-2-26 00:30:08

G5 1.8约等于G4 1.3

Youth · 发表于 2005-2-27 19:02:02

不错不错,我现在算seti classic的两台机器分别是pm和p4ht:)
还有一台athlonxp1800+超频后跑boinc上的seti和einstein,seti估计和classic的差还多,不知道einstein@home哪种cpu比较好

Snake_SH 在 2005-2-21 02:36 PM 发表:

1. seti@home 效率最高P-M（指令融合+QDR+大容量L2而A64却表现不佳）产量最高P4 HT（QDR FSB+HT+双通道）
2. UD考虑到价格，速度，功耗综合因素 CIII最好产量最高P4 HT（运行两个UD）
3. folding@home 因项目 ...

Snake_SH · 发表于 2005-2-28 13:35:21

没算过爱因斯坦，不过你用Athlon XP算是不会差到什么地方去的。

freestman · 发表于 2005-3-5 14:13:36

SETI我比较喜欢，感觉用PIII和P4算都挺合适，想出数用P4，想省电用PIII。
UD我算的最多，但是现在只用P4算。PIII实在是不出数。我有两台P42.2GHz的laptop和一台P42.4BGHz（oc2.7GHz）的台式机算UD。
folding@home之前也算过一段时间，因为服务器方面总是出问题导致我白算，现在停止了。CPU计算特性和UD比较接近。

China_AH_T-13 · 发表于 2005-3-5 17:27:13

相比之下。俺的机子太差拉，是要换台机子了。

Youth · 发表于 2005-3-5 18:48:42

今天在einstein@home的论坛上看了一些讨论，总的说来AMD的CPU运算效率都还是不错的。

ud以前算过不少时间，不过感觉它的积分算法不怎么样，同样是一个小时，记得那时候我用p4-2.8e算出来还没有c3-1g算出来的积分高。

		自动登录	找回密码
密码			新注册用户

各分布项目推荐CPU

浏览过的版块