找回密码
 新注册用户
搜索
查看: 4825|回复: 11

期待支持AVX的FAH核心,支持ATi 的GPU3核心

[复制链接]
发表于 2010-8-6 19:55:52 | 显示全部楼层 |阅读模式
本帖最后由 IntelProcessor 于 2010-8-6 20:06 编辑

与SSE指令集不同,AVX指令集可以直接作256bit向量寄存器,进行256bit位宽矢量处理,Intel这次加入AVX指令集的主要目的是增强处理器的计科学算能力,直接对抗日益猖獗的GPGPU,并暴露GPGPU先天的局限和不足。

 AVX 全称 Advanced Vector Extensions,高级失量扩展指令集

1、AVX 指令集的扩充和加强:

(1)将原来的 128 位 XMM 寄存器扩充为 256 位的 YMM 寄存器,从而支持 256 位的 vector 计算。
(2)改进和加强原有的在 3 个 operands 指令的编码和语法,使之更灵活。
(3)增加一个全新的 VEX prefix,实现对原有的 prefix (escape / SIMD prefix)集成,从而消除了 escape / SIMD prefix。
(4)FMA 功能支持 IEEE-754 2008。


2、 实现 4 个 operands   通过 VEX prefix 可实现 4 个 operands,表示为 dest、src1、src2 以及 src3
  dest、src1 以及 src2 可由 VEX.vvvv、ModRM.reg 以及 ModRM.r/m 来提供,src3 由 1 个字节的 immediate 来提供。

3、 实现不改变 desttination(目标)操作数
   即结果不改写 dest 操作数。


4、多功能的 VEX prefix  
(1)VEX 定义 128 和 256 版本
(2)VEX 集成 escape prefix(即 0F、0F38 以及 0F3A)
(3)VEX 集成 SIMD prefix(即 66、F3 以及 F2)
(4)VEX 集成 REX prefix

评分

参与人数 2基本分 +46 收起 理由
cicikml + 23 精品文章
金鹏 + 23 我很赞同

查看全部评分

回复

使用道具 举报

发表于 2010-8-6 20:16:48 | 显示全部楼层
看起来不错,希望编程难度不要太大了,ATI就是因为FAH编程人员搞不懂而不支持的。
回复

使用道具 举报

发表于 2010-8-6 21:41:29 | 显示全部楼层
FAH现在能支持到SSE4.2了没?
回复

使用道具 举报

发表于 2010-8-7 10:17:31 | 显示全部楼层
不明真相群众继续围观
回复

使用道具 举报

发表于 2010-8-7 10:32:49 | 显示全部楼层
回复 4# 金鹏


    呵呵,intel发布下一代融合CPU将加入这些功能。
回复

使用道具 举报

发表于 2010-8-7 11:17:07 | 显示全部楼层
回复 5# eqzero

技术粗大的很,BS    I家总是换接口逼着大家换平台
回复

使用道具 举报

发表于 2010-8-7 12:18:36 | 显示全部楼层
硬件核心就那么多,改用一两个指令集又能提升多少效能?
回复

使用道具 举报

发表于 2010-8-7 12:48:36 | 显示全部楼层
回复 7# christopher


提升还是很大的,AVX需要更大更高效的寄存器,一定程度上也增加了晶体管消耗。256bit位宽矢量处理意味着遇到32位浮点处理时一个周期能做8次。而Core微架构一个周期能做4次已经很了不起了。

评分

参与人数 1基本分 +18 收起 理由
金鹏 + 18 精品文章

查看全部评分

回复

使用道具 举报

发表于 2010-8-7 14:33:59 | 显示全部楼层
回复 8# cicikml


    常理来说,更大的寄存器就需要更多的预读取,这就涉及到了分支预测。为了提高分支预测准确率Inter和AMD每年都把大量的资金投入到这方面,可收效嘛,只是在缓慢提升而已。

预测失败的话重新装载数据,更大的寄存器就需要更多的时间。
对实际效果表示怀疑
回复

使用道具 举报

发表于 2010-8-12 14:25:24 | 显示全部楼层
看起来不错,希望编程难度不要太大了,ATI就是因为FAH编程人员搞不懂而不支持的。 ...
eqzero 发表于 2010-8-6 20:16



    其实可以Opencl的  那个代码和cuda的区别真的不大
回复

使用道具 举报

发表于 2010-8-12 14:27:58 | 显示全部楼层
回复 10# Klose_Rinz


    这个还是有差别的,比如php和c的语法一样.....
回复

使用道具 举报

发表于 2010-8-18 21:42:53 | 显示全部楼层
推土机好像也会有AVX吧-  -?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~
欢迎大家多多支持基金会~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2025-5-15 21:33

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表