找回密码
 新注册用户
搜索
查看: 9772|回复: 14

480真的阉割双精度了,还是A卡厚道

[复制链接]
发表于 2010-4-27 08:51:46 | 显示全部楼层 |阅读模式
老黄有点过分了,你要区分特斯拉和游戏卡,用ECC不就行了,打什么双精度的注意啊,想粗口

ce3yS2oFsmZLQ.png
回复

使用道具 举报

发表于 2010-4-27 08:52:39 | 显示全部楼层
AMD 多少啊
回复

使用道具 举报

发表于 2010-4-27 13:31:26 | 显示全部楼层
AMD 多少啊
woozhou 发表于 2010-4-27 08:52



   
回复

使用道具 举报

发表于 2010-4-27 14:10:12 | 显示全部楼层
强力围观标题党
回复

使用道具 举报

发表于 2010-4-27 14:30:25 | 显示全部楼层
本帖最后由 caozhonghua 于 2010-4-27 14:32 编辑

无语……为啥要加个A厚道呢?A的SP比N强?
回复

使用道具 举报

发表于 2010-4-27 14:48:25 | 显示全部楼层
"双精度"是啥???
回复

使用道具 举报

发表于 2010-4-27 15:53:22 | 显示全部楼层
没看懂,楼主的图表示啥意思。
回复

使用道具 举报

发表于 2010-4-27 16:46:28 | 显示全部楼层
市场定位策略的问题,和Geforce/Quadro如出一辙。
回复

使用道具 举报

发表于 2010-4-27 16:54:08 | 显示全部楼层
NV怕tesla賣不出~
回复

使用道具 举报

发表于 2010-4-27 17:49:26 | 显示全部楼层
问题是A卡的通用计算能力哪怕是5XXX还是很弱,比nv的阉割货还弱
回复

使用道具 举报

发表于 2010-4-27 18:04:38 | 显示全部楼层
回复 10# finf
何以见得 A比N的通用计算弱?
回复

使用道具 举报

发表于 2010-4-27 18:15:03 | 显示全部楼层
回复 11# zglloo


    A的设计和N卡本质性的不同,A卡没有本地缓存,所以稍微复杂点的应用,就像fah就慢,
但是简单的纯计算md5就比较快,BOINC平台上几个应用上A卡快也是这个原因。
不过简单的应用毕竟受到很多限制,不能称为通用
回复

使用道具 举报

发表于 2010-4-27 21:21:27 | 显示全部楼层
不可能没双精度的吧
回复

使用道具 举报

发表于 2010-4-27 21:39:48 | 显示全部楼层
单SP性能在频率低21.5%的情况下高1.6%,也不算过份差吧……当然这评测的可信度到底怎么样就不得而知了,有很多因素会影响评测结果。
回复

使用道具 举报

发表于 2010-5-1 23:49:31 | 显示全部楼层
本帖最后由 cicikml 于 2010-5-2 00:15 编辑

你截的图是我在ZOL4月中旬做的评测。

NV为了让Geforce和Tesla拉开差距,把GTX480的双精度阉割了很多,这样衰减也是1/8,和GT200一样了。毕竟很多领域买了Geforce玩通用计算,打击了NV的财务报表。

至于A和N在通用计算方面哪个更强,还是请参考国内首个GPU通用计算基准测试软件——GPC Benchmark。

这是首款国人开发的支持GPU的OpenCL通用计算测试程序OpenCL General Purpose Computing Benchmark (简称GPCBenchMarkOCL)

通用计算方面的结论是HD5870系列的运算能力和GTX260+差不多。

我个人认为AMD能把SIMD结构的流处理器用VLIW组织最后达到这种效率,已经非常值得鼓励。

你不能说SIMD弱,毕竟它在传统的图形渲染领域的效率或者说性能功耗比,明显高于MIMD结构。NV现在遇到了一些障碍,如果能突破则可以走的更远。

======================================================

我要做补充的是,NV和AMD都是商人都要生存,没什么厚道之分。
如果大家要因为NV区别对待Geforce和Tesla骂NV粗口就有失偏颇了。
因为AMD把HD5800以下显卡的双精度能力,彻底废除了。
也就是说像HD5770这样的显卡,虽然性价比超高,但是压根没有双精度运算能力。如果强制运行,只能用单精度来模拟双精度(把双精度转为单精度,然后再运算),效果惨不忍睹。
其次是纯吞吐值,因为AN两家架构不同,是不能比较的。

回到我们的FAH运算,使用了Gromacs引擎的FAH目前对于浮点精度,是这样解释的:

Double precision energy minimization is normally recommended before doing normal mode analysis. If doing an NVE simulation is important to you, then with otherwise suitable choices of .mdp parameters, double-precision integration might give better energy conservation. Otherwise, you'd probably be wasting processor time.
Double precision minimization is only something you care about before (say) a normal-mode analysis.
On single precision systems, the run would run at the same speed on 32 bits architecture and on 64 bits architectures.
On double precision systems, the same run will take twice the time on 32 bits than on 64bits (roughly).

In most cases,single precison is enough,except for NMA.
Using double precision version to run MD in gmx you will nearly lost 40% performance,and the .trr file will twice as large as single precision, MD needn't store data as accuracy as QC,  you can't get much benefit from double version.
You can compile both single and double precision version of gmx, use "--program-suffix=" or  "--program-prefix=" to distinguish team,they will add suffix or prefix to gmx executable file name.
e.g.     ./configure --program-suffix=_d  --enable-double
You will get mdrun_d,etc.

=====================================================
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~
欢迎大家多多支持基金会~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2025-5-15 09:33

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表