找回密码
 新注册用户
搜索
查看: 21155|回复: 67

GPU和CPU运算能力比较

  [复制链接]
发表于 2012-9-1 15:49:13 | 显示全部楼层 |阅读模式
7788.JPG
通过比较,GTX670 GPU的计算能力是E3-1230V2 CPU的30倍以上,耗电量是CPU的2倍

看来GPU取代CPU的日子不远了,DDR5为啥还不用到主板上,6000MHz的频率使带宽得到了很大的保证
回复

使用道具 举报

发表于 2012-9-1 16:00:14 | 显示全部楼层

LZ你醒醒啊,LZ!
回复

使用道具 举报

 楼主| 发表于 2012-9-1 16:10:41 | 显示全部楼层
很多文章说CPU和GPU会能融合到一起,我认为这个不是最终解决办法

最早的计算机没有GPU,GPU是作为CPU的协处理器而产生的,原因就是芯片不能设计得太复杂,工艺满足不了。现在工艺能满足了,开始考虑合并了。过不了多久又会遇到新的瓶颈,然后还要分开,这就是所谓的分久必合,合久必分。
回复

使用道具 举报

发表于 2012-9-1 16:11:08 | 显示全部楼层
四老外1.jpg
回复

使用道具 举报

发表于 2012-9-1 16:12:50 | 显示全部楼层
做个比喻
GPU是一群脑残,CPU是一个大学生
1.糊信封
这个只有人数的区别,所以GPU胜
2.解方程
脑残们只能凑,所以CPU胜
CPU善于执行分支多的费脑子的
GPU善于狂算
回复

使用道具 举报

发表于 2012-9-1 16:23:15 | 显示全部楼层
不得不说,跑Benchmark跑歪了整个产业的世界观……
“一切以实物为准”
永远记得这句话,好不好用只有让算法实测来说话,“理论速度”只是一个无法兑现的参考值,就好像M记广告上的那些汉堡包一样,吃到嘴里的总是和那个东西有很大差距~
回复

使用道具 举报

发表于 2012-9-1 16:23:24 | 显示全部楼层
回复 5# woaiwinnie2


    尽管我知道这个道理,可我没法从两者区别入手详细地说出为什么GPU并行强,CPU单线强,所以,能不能解释一下?
记得当年nekoko说过在数据规模上GPU也占劣势,单显卡显存大小最大也就那样,而多路CPU平台的内存上百G也能轻松做到。
回复

使用道具 举报

 楼主| 发表于 2012-9-1 16:25:29 | 显示全部楼层
回复 5# woaiwinnie2


    例子举得很好,但是我有不同意见,我认为GPU和CPU的智商是一样的。因为从计算机原理角度看,只要能完成加法运算的芯片就可以完成现在计算机所做的一切,差别就是运算次数。

GPU能干的工作,CPU都能干;反过来也一样,关键看程序如何指挥它干。
回复

使用道具 举报

 楼主| 发表于 2012-9-1 16:33:09 | 显示全部楼层
看看这个多能干,不知道多少钱一块
6655.JPG
回复

使用道具 举报

发表于 2012-9-1 16:35:45 | 显示全部楼层
本帖最后由 nekoko 于 2012-9-1 16:38 编辑

回复 7# jpegreader


对于GPU和CPU的差别,老黄在GTC上有过这么解释,大意如下:
在同样的功耗下,CPU比GPU要慢很多,是因为CPU一半的功耗不是用于计算,而是用于“计划”这些计算的过程。
但是,对于一些简单的运算来说,事实上CPU做了很多的无用功。
GPU运算的基本思想,就是简化运算的“计划”过程,让简单的运算能够高度并行化地执行。
这并不是说CPU做的不好,对于复杂的需要做很多“计划”才能高效执行的运算来说,GPU的运算单元就变得“过剩”,所以效率并不一定会很理想,但是我们在尝试找到这样的平衡点
另一个运算单元“过剩”的例子,就是AMD的“推土机”,他们试图在一个核心上塞进更多的整数运算单元,但是仍保持原有的“计划”规则,核心的效率反而发生了下降。
因此,我们可以说,CPU和GPU各有所长,但是我们日常的计算中的“简单运算”占据了很高的比例,所以我们能够通过GPU来获得更好的性能与功耗比。
回复

使用道具 举报

发表于 2012-9-1 16:40:02 | 显示全部楼层
本帖最后由 woaiwinnie2 于 2012-9-1 16:41 编辑

回复 8# w2xcn

CPU善于处理分支很多的计算
GPU虽然完成分支很多的计算,但是复杂后线程仲裁机制不完善,所以速度会慢很多
回复

使用道具 举报

 楼主| 发表于 2012-9-1 16:56:30 | 显示全部楼层
http://item.taobao.com/item.htm? ... 88927_4k7_638402003

NVIDIA®(英伟达™)Tesla™ C2050/2070计算处理器以二十分之一的功耗和十分之一的成本即可实现超级计算能力,为台式机带来了小型集群般的性能。
回复

使用道具 举报

发表于 2012-9-1 18:23:17 | 显示全部楼层
现实世界有两类并行性:事务性并行与数据并行。

前者的的典型例子是订票系统,适合 CPU 处理;

后者的典型例子是矩阵运算,适合 GPU 处理。
回复

使用道具 举报

发表于 2012-9-1 18:25:32 | 显示全部楼层
我喜歡吃KFC ٩(◉ω◉*)۶
回复

使用道具 举报

发表于 2012-9-1 18:37:45 | 显示全部楼层
回复 10# nekoko

CPU 只有一个核,它只能在指令流中寻找指令级并行性,以提高执行效率。所以,CPU 有相当面积被占用去实现能够优化调度的“乱序执行”技术了。

参考:乱序执行,http://baike.baidu.com/view/272966.htm
                        http://zh.wikipedia.org/wiki/乱序执行

GPU 直接面对的就是数据并行性的问题,不需要再去找“指令并行”了。

最后,是“调度”不是“计划”,知道了不?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-4-26 13:05

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表