找回密码
 新注册用户
搜索
楼主: 来不及思考

听说新的GPU3程序是基于OPEN CL的……

[复制链接]
发表于 2009-11-11 11:00:30 | 显示全部楼层
法师快来搓点水...追楼上的好慢呀....
回复

使用道具 举报

发表于 2009-11-11 11:12:45 | 显示全部楼层
围观……
N卡使用中……
回复

使用道具 举报

发表于 2009-11-11 13:54:34 | 显示全部楼层
CL_DEVICE_VENDOR: Advanced Micro Devices, Inc.
  CL_DEVICE_NAME: Cypress
  CL_DRIVER_VERSION: CAL 1.4.467
  CL_DEVICE_TYPE: CL_DEVICE_TYPE_GPU
  CL_DEVICE_MAX_COMPUTE_UNITS: 18
  CL_DEVICE_MAX_WORK_ITEM_DIMENSIONS: 3
  CL_DEVICE_MAX_WORK_ITEM_SIZES: 256 / 256 / 256
  CL_DEVICE_MAX_WORK_GROUP_SIZE: 256
  CL_DEVICE_MAX_CLOCK_FREQUENCY: 949 MHz
  CL_DEVICE_ADDRESS_BITS: 32
  CL_DEVICE_IMAGE_SUPPORT: 0
  CL_DEVICE_MAX_READ_IMAGE_ARGS: 0
  CL_DEVICE_MAX_WRITE_IMAGE_ARGS: 0
  CL_DEVICE_IMAGE_MAX_WIDTH: 2d width 0, 2d height 0, 3d width 0, 3d height 0, 3d depth 0
  CL_DEVICE_MAX_MEM_ALLOC_SIZE: 256 MByte
  CL_DEVICE_GLOBAL_MEM_SIZE: 256 MByte
  CL_DEVICE_ERROR_CORRECTION_SUPPORT: no
  CL_DEVICE_LOCAL_MEM_TYPE: local
  CL_DEVICE_LOCAL_MEM_SIZE: 16 KByte
  CL_DEVICE_MAX_CONSTANT_BUFFER_SIZE: 64 KByte
  CL_DEVICE_QUEUE_PROPERTIES: CL_QUEUE_PROFILING_ENABLE

比较好奇的是R870的local大小只有16KB,DX11不是要求32KB吗?
回复

使用道具 举报

发表于 2009-11-11 14:10:39 | 显示全部楼层
虽然仍然是16KB 但是对纹理数据的抓取速度提升到了1TB/s
L1与L2的通讯带宽提升到了435GB/s 比RV770的384GB/s 高很多
回复

使用道具 举报

发表于 2009-11-11 20:00:15 | 显示全部楼层

回复 #1 来不及思考 的帖子

欢迎兄弟回家来看大家,并带来了重要参考

对FAHER来讲最重要的是参与和持久的热情

对七彩虹来讲不管是5870还是295那个卖得多都是七彩虹赚钱,兄弟你推广有力红包多多!

期待七彩虹能有针对咱们3213队员的团购大优 惠购显卡活动

[ 本帖最后由 金鹏 于 2009-11-11 20:02 编辑 ]
回复

使用道具 举报

发表于 2009-11-11 21:50:26 | 显示全部楼层
但是DX11的硬要求是32KB。5870是如何支持DX11的?
回复

使用道具 举报

发表于 2009-11-11 23:14:42 | 显示全部楼层
难不成是AMD给了MS好处 让MS放他水??!!!
回复

使用道具 举报

 楼主| 发表于 2009-11-12 13:50:30 | 显示全部楼层
WTF

本帖是我最近半年来第一次登陆equn

前面的帖子非本人所发,内容概不负责
回复

使用道具 举报

发表于 2009-11-12 14:15:20 | 显示全部楼层
原帖由 来不及思考 于 2009-11-12 13:50 发表
WTF

本帖是我最近半年来第一次登陆equn

前面的帖子非本人所发,内容概不负责


哈哈,难道是团队登录
回复

使用道具 举报

发表于 2009-11-12 14:16:13 | 显示全部楼层

回复 #38 来不及思考 的帖子

什么意思? 难道你的账户被盗?
一个广东的ip
一个长沙的ip

[ 本帖最后由 zglloo 于 2009-11-12 14:17 编辑 ]
回复

使用道具 举报

 楼主| 发表于 2009-11-12 14:50:21 | 显示全部楼层
啊?我没用这个ID发过帖子啊,顶楼和38楼是怎么回事?
回复

使用道具 举报

发表于 2009-11-12 14:52:25 | 显示全部楼层
原帖由 来不及思考 于 2009-11-12 14:50 发表
啊?我没用这个ID发过帖子啊,顶楼和38楼是怎么回事?



兄弟赶快更换登录密码吧
回复

使用道具 举报

发表于 2009-11-13 10:05:04 | 显示全部楼层
不能看着FAH性能就单纯地说A和N的架构性能差距怎么怎么样,实际上表现出来的性能确实是因算法和数据而异的
FAH对A卡计算的优化不好,这个世界人民都没有否定的说……
同样通用计算,ATI卡算FAH那么低分,但是算milkyway,Collatz Conjecture,效率就非常高,说明有时候理论性能不足以说明问题,有时确实跟编程有关
个人认为中国超算的闲置问题也只是这个问题的类似放大版本

盼望GPU3可以做得完善一点,好让我那块“没用”的4830早日回归
回复

使用道具 举报

发表于 2009-11-14 14:44:43 | 显示全部楼层
原帖由 heavenedge 于 2009-11-10 22:29 发表


同级别的A卡的浮点运算能力远远高于N卡 这点相信谁都无法否认吧 并且目前为止还没看到ECC对科算有什么帮助 否则国家的天河一号就不会放心地使用4870X2了
还有就是 A卡的架构并非不利于科算 只是对编程者的考验非常 ...



给milkyway@home,collataz conjecture写A卡优化的人应该是大牛。
回复

使用道具 举报

发表于 2009-11-16 18:06:21 | 显示全部楼层
对最终用户有用的是PPD,GPU3程序出来后如果能提升运算效率或者PPD才是最重要的。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2025-5-15 20:23

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表