找回密码
 新注册用户
搜索
查看: 9206|回复: 18

[讨论] 官网加入了算力排名,不过。。。。

[复制链接]
发表于 2015-11-19 00:08:01 | 显示全部楼层 |阅读模式
https://einstein.phys.uwm.edu/gpu_list.php
有一些明显不靠谱的数据
QQ截图20151118235533.png
windows平台,780ti只能到980ti的60%?反正我CUDA55的程序,同样的gpu占用,1354的980ti只比1006的780ti高几个百分点;980跑不过970/770这就不用说了
A卡方面,由于驱动的问题,GCN1.1之后的GPU只能单线程运行,否则100%出错,这就导致290X这种大核心效率很低(1000的fury nano打平280X,功耗也不见得就低到哪去,AMD要完啊),linux也不例外,但是这统计里是怎么说的?
由于环境的复杂性,由程序给出的完成时间去推算GPU的算力是比较困难的,我就见过一个人,980ti在linux下比我windows强20%,这很不科学
还是那句话,看看就好啊
回复

使用道具 举报

发表于 2015-11-19 00:54:28 | 显示全部楼层
本帖最后由 horst1981 于 2015-11-19 00:57 编辑

麾下主帅GTX765M居然没有上榜
倒是次帅HD4600排行INTEL第一位
副将R7240貌似也没找到
几个有GPU任务的项目一起跑,HD4600长期被einsten占据,倒是GTX765M总是在跑其他项目。
回复

使用道具 举报

发表于 2015-11-19 16:30:20 | 显示全部楼层
AMD R9 380X正式发布,代号为“Tonga XT”核心和Fury是相同的架构设计,2048个流处理器(64个计算单元)、128个纹理单元、32个ROP单元、功耗下降、性能提高!
回复

使用道具 举报

 楼主| 发表于 2015-11-19 21:08:31 | 显示全部楼层
本帖最后由 vardrag 于 2015-11-19 22:12 编辑
TeamAMDFX 发表于 2015-11-19 16:30
AMD R9 380X正式发布,代号为“Tonga XT”核心和Fury是相同的架构设计,2048个流处理器(64个计算单元)、128 ...

并卵,GCN1.2意味着只能单线程,平均最高GPU占用不超过85%,而且以A的尿性,需要几年才能优化到不错的水平。现在最好的A卡还是那个正在清仓的280X,在性价比和计算密度方面达到一个比较完美的统一。这次光棍节XFX的280X各种优惠都算上才1200+,一张fruy nano可以买4张,算力却一样。手头1G的280X跑PMPS XT平均38-39分钟一个任务,1G的290X是43-44分钟,1G的fruy nano是39-40分钟(如果cpu超到4.X差不多是36分钟左右),GCN1.0/GCN1.1/GCN1.2;2048/2816/4096,这么多年A的进步在哪里?
本来还想弄张双芯的fury玩玩,现在看来也就是个7990的水平,解毒了






回复

使用道具 举报

 楼主| 发表于 2015-11-19 21:14:07 | 显示全部楼层
win10目前来看对超多GPU的支持很好,GPU的利用率有一点点提高,出错好像没遇到过。
回复

使用道具 举报

 楼主| 发表于 2015-11-19 21:15:01 | 显示全部楼层
准备试下linux,看看是不是像我提到的那么神
回复

使用道具 举报

 楼主| 发表于 2015-11-19 22:36:26 | 显示全部楼层
本帖最后由 vardrag 于 2015-11-19 22:44 编辑

AN对比,跟f@h大体上一样,只是没有那么大差距。290X如果4线程占满,比同频的780ti还强一点(290x占用可以达到100%,780ti我只见过96%),可惜只能跑单线程。与f@h不同,e@h对架构和频率非常不敏感。好像在cuda32时,1.2G的780ti只比1G的快一点点,而错误率就高多了。290X,1.1G和1G也是基本上没有区别。官网的论坛里有老外说超显存,我没试过,不过就hbm的成绩看似乎不靠谱。我这里770和970,780ti和980ti都是一个水准线上的东西,虽然新架构的频率会有1/5左右的提升。A首发便宜,规格高,但是需要等优化,而官方计算程序的优化似乎也总是先针对N。A的一个致命问题就是新架构的高端GPU多线程出错,导致主机排名靠前的基本上被N卡和280X/7970垄断,严重影响升级的兴趣,前160名只有两台fiji,有一个是我。N虽然贵,规格低,但是优化好,而且maxswell功耗低。低功耗在没有免费电和散热不给力的情况下优越性就凸显出来,而且N的低功耗不仅仅表现在GPU本身耗电低。N对CPU的依赖比A低得多,两张280X,8线程基本上可以用掉一块4.5G的i5-4690k;换成两张780ti,8线程就只有10%左右的同款CPU占用。e@h也是偏N的项目
回复

使用道具 举报

 楼主| 发表于 2015-11-19 22:39:01 | 显示全部楼层
农企要抛弃催化剂,但愿不是只换张皮,不过我估计新架构的多线程问题一时半会儿解决不了。
回复

使用道具 举报

发表于 2015-11-20 03:39:30 | 显示全部楼层
我正好是最低端的Tonga
回复

使用道具 举报

发表于 2015-11-20 04:42:50 | 显示全部楼层
本帖最后由 kylinblue 于 2015-11-19 15:45 编辑

                                   
回复

使用道具 举报

发表于 2015-11-20 10:24:01 来自手机 | 显示全部楼层
我因为加780ti的机子只配了450W电源  所以780ti只开了两个线程 占用低点也防止boom
回复

使用道具 举报

 楼主| 发表于 2015-11-20 11:26:01 | 显示全部楼层
gongyz 发表于 2015-11-20 10:24
我因为加780ti的机子只配了450W电源  所以780ti只开了两个线程 占用低点也防止boom ...

2个线程好像也有90%的占用。我980ti(我的780ti得接三根线才能亮)只接了2根6pin(工作站限流比较严格,AIDA64测算力会重启)95%占用可以长期跑,虽然maxswell功耗低但是频率高了很多(1/1.3),所以综合起来应该没有太大差距。
回复

使用道具 举报

发表于 2015-11-20 16:53:10 | 显示全部楼层
vardrag 发表于 2015-11-20 11:26
2个线程好像也有90%的占用。我980ti(我的780ti得接三根线才能亮)只接了2根6pin(工作站限流比较严格,A ...

我占用只有70% 啊。。
回复

使用道具 举报

 楼主| 发表于 2015-11-20 17:56:51 | 显示全部楼层
gongyz 发表于 2015-11-20 16:53
我占用只有70% 啊。。

单线程就75%以上了啊。你要么是CPU节能没关,要么是同时在跑CPU任务。我现在CPU完全给显卡用,不干其它事情。
回复

使用道具 举报

 楼主| 发表于 2015-11-20 18:58:09 | 显示全部楼层
小核心效率高,两张760输出与titanx基本持平,主机均分排名,我后面那个家伙的4路titanX跑不过我的4路760*2,他也是7*24。
越大的核心效率越低,fiji就是个典型,8成负载的输出跟流处理器只有一半的280X持平,满载也不过就高出后者25%,效率可见一斑。
280X的效率真是高,怪不得是挖矿神器。最近弄到几张r7-350,384个流处理器,GCN1.0,每个任务平均3.5小时,同频输出/流处理器跟280X基本一样
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-5-8 05:05

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表