听说新的GPU3程序是基于OPEN CL的……

bugfix · 发表于 2009-11-11 11:00:30

法师快来搓点水...追楼上的好慢呀....

caozhonghua · 发表于 2009-11-11 11:12:45

围观……
N卡使用中……

jocover · 发表于 2009-11-11 13:54:34

CL_DEVICE_VENDOR: Advanced Micro Devices, Inc.
  CL_DEVICE_NAME: Cypress
  CL_DRIVER_VERSION: CAL 1.4.467
  CL_DEVICE_TYPE: CL_DEVICE_TYPE_GPU
  CL_DEVICE_MAX_COMPUTE_UNITS: 18
  CL_DEVICE_MAX_WORK_ITEM_DIMENSIONS: 3
  CL_DEVICE_MAX_WORK_ITEM_SIZES: 256 / 256 / 256
  CL_DEVICE_MAX_WORK_GROUP_SIZE: 256
  CL_DEVICE_MAX_CLOCK_FREQUENCY: 949 MHz
  CL_DEVICE_ADDRESS_BITS: 32
  CL_DEVICE_IMAGE_SUPPORT: 0
  CL_DEVICE_MAX_READ_IMAGE_ARGS: 0
  CL_DEVICE_MAX_WRITE_IMAGE_ARGS: 0
  CL_DEVICE_IMAGE_MAX_WIDTH: 2d width 0, 2d height 0, 3d width 0, 3d height 0, 3d depth 0
  CL_DEVICE_MAX_MEM_ALLOC_SIZE: 256 MByte
  CL_DEVICE_GLOBAL_MEM_SIZE: 256 MByte
  CL_DEVICE_ERROR_CORRECTION_SUPPORT: no
  CL_DEVICE_LOCAL_MEM_TYPE: local
  CL_DEVICE_LOCAL_MEM_SIZE: 16 KByte
  CL_DEVICE_MAX_CONSTANT_BUFFER_SIZE: 64 KByte
  CL_DEVICE_QUEUE_PROPERTIES: CL_QUEUE_PROFILING_ENABLE

比较好奇的是R870的local大小只有16KB,DX11不是要求32KB吗？

heavenedge · 发表于 2009-11-11 14:10:39

虽然仍然是16KB 但是对纹理数据的抓取速度提升到了1TB/s
L1与L2的通讯带宽提升到了435GB/s 比RV770的384GB/s 高很多

金鹏 · 发表于 2009-11-11 20:00:15

欢迎兄弟回家来看大家，并带来了重要参考

对FAHER来讲最重要的是参与和持久的热情

对七彩虹来讲不管是5870还是295那个卖得多都是七彩虹赚钱，兄弟你推广有力红包多多!

期待七彩虹能有针对咱们3213队员的团购大优惠购显卡活动

[ 本帖最后由金鹏于 2009-11-11 20:02 编辑 ]

cicikml · 发表于 2009-11-11 21:50:26

但是DX11的硬要求是32KB。5870是如何支持DX11的？

heavenedge · 发表于 2009-11-11 23:14:42

难不成是AMD给了MS好处让MS放他水??!!!

来不及思考 · 发表于 2009-11-12 13:50:30

WTF

本帖是我最近半年来第一次登陆equn

前面的帖子非本人所发，内容概不负责

金鹏 · 发表于 2009-11-12 14:15:20

原帖由 来不及思考 于 2009-11-12 13:50 发表
WTF

本帖是我最近半年来第一次登陆equn

前面的帖子非本人所发，内容概不负责

哈哈，难道是团队登录

zglloo · 发表于 2009-11-12 14:16:13

什么意思？难道你的账户被盗？
一个广东的ip
一个长沙的ip

[ 本帖最后由 zglloo 于 2009-11-12 14:17 编辑 ]

来不及思考 · 发表于 2009-11-12 14:50:21

啊？我没用这个ID发过帖子啊，顶楼和38楼是怎么回事？

金鹏 · 发表于 2009-11-12 14:52:25

原帖由 来不及思考 于 2009-11-12 14:50 发表
啊？我没用这个ID发过帖子啊，顶楼和38楼是怎么回事？

兄弟赶快更换登录密码吧

ddddeng · 发表于 2009-11-13 10:05:04

不能看着FAH性能就单纯地说A和N的架构性能差距怎么怎么样，实际上表现出来的性能确实是因算法和数据而异的
FAH对A卡计算的优化不好，这个世界人民都没有否定的说……
同样通用计算，ATI卡算FAH那么低分，但是算milkyway，Collatz Conjecture，效率就非常高，说明有时候理论性能不足以说明问题，有时确实跟编程有关
个人认为中国超算的闲置问题也只是这个问题的类似放大版本

盼望GPU3可以做得完善一点，好让我那块“没用”的4830早日回归

Schumacher · 发表于 2009-11-14 14:44:43

原帖由 heavenedge 于 2009-11-10 22:29 发表

同级别的A卡的浮点运算能力远远高于N卡这点相信谁都无法否认吧并且目前为止还没看到ECC对科算有什么帮助否则国家的天河一号就不会放心地使用4870X2了
还有就是 A卡的架构并非不利于科算只是对编程者的考验非常 ...

给milkyway@home,collataz conjecture写A卡优化的人应该是大牛。

alen · 发表于 2009-11-16 18:06:21

对最终用户有用的是PPD，GPU3程序出来后如果能提升运算效率或者PPD才是最重要的。

		自动登录	找回密码
密码			新注册用户

听说新的GPU3程序是基于OPEN CL的……

回复 #1 来不及思考的帖子

回复 #38 来不及思考的帖子

浏览过的版块

听说新的GPU3程序是基于OPEN CL的……

回复 #1 来不及思考 的帖子

回复 #38 来不及思考 的帖子

浏览过的版块

回复 #1 来不及思考的帖子

回复 #38 来不及思考的帖子