Xeon Phi真身首曝 Intel戳穿百倍加速性能假象(转自驱动之家）

acp134 · 发表于 2012-11-14 17:39:06

经过长达八年各种相关研究，Intel终于正式推出了MIC众核架构的Xeon Phi协处理器，为高性能计算带来了一股新鲜势力。
Xeon Phi协处理器在很大程度上继承了流产的独立显卡项目Larrabee的遗志，外部造型看似显卡，其实是和Tesla类似的专用加速计算卡，其架构采用顺序、双发射x86，支持64位运算，每个核心支持最多四个线程，最多61个核心、244个线程，并且每个核心都搭配一个512-bit SIMD矢量引擎。
当然了，这里的“核心”跟Tesla里边的CUDA核心是没有直接可比性的，它们分别来自CPU、GPU的世界。

前后做了这么多纸面上的介绍，想不想看看Xeon Phi究竟是个什么样子呢？田纳西州大学的田纳西高级计算中心(TACC)正在他们的新超级计算机“Stampede”(惊跑)里安装Xeon Phi，也让我们得以一睹其真容：
不明说的话肯定会以为这是块标准的显卡吧？Tesla其实也是这个样子，标准的双插槽体积PCI-E x16扩展卡，而且是因为专用于计算的，都没有视频输出接口(AMD的还有)。
Xeon Phi也有主动散热、被动散热两种版本，这里用的是被动散热的，外壳下边是大量厚重的散热片和热管，尾部则能看到一个六针和一个八针辅助供电接口，最大供电能力300W。
只可惜人家不让拆，看不到里边的样子。

至于实际性能如何，很可能现在哪儿都不具备测试条件，毕竟这玩意儿因为架构的缘故要求操作系统、工具软件都得在一定程度上重新编写和优化，Intel也一再强调优化的重要性。
Intel也没有一味夸大加速计算的优势，而是首先澄清了一个误解。Intel拿出了一段Fortran代码，先运行未优化的单线程代码，然后优化并以Xeon Phi运行，性能差异达到了恐怖的300倍。
NVIDIA Tesla宣称的性能提升差不多就是这样对比而来的，让加速计算的结果和单线程结果对比，几十乃至几百倍的提升就轻松得来。
Intel则证明了其谬误：在双路Xeon E5上重新运行相同的代码，Xeon Phi只快了大约两倍而已。也就是说，如果代码本身就针对多核心处理器做过优化，加速计算的真实优势会小得多。
在另一个C++的例子中，109倍的提升被证明其实只有2-2.5倍。

随后，Intel展示了Xeon Phi协处理加速计算所带来的真正性能提升，通过Intel MKL理论测试得到的幅度为最多2.2-2.9倍，实际应用中则普遍只有最多1.7-2.53倍，只有金融服务方面取得了10倍左右的突飞猛进(布莱克斯克尔斯期权定价模型和蒙特卡罗算法)。

Intel还请来了软件和技术供应商Altair的一名代表，让他证明把代码移植到Xeon Phi平台上是多么的简单，并证明崩溃测试模拟之类的应用一般可以带来2.5倍左右的性能提升。

zensin123 · 发表于 2012-11-14 20:15:41

acp134 · 发表于 2012-11-14 20:33:02

回复 2# zensin123

大叔没有点感想么

gameboybf2142 · 发表于 2012-11-14 22:27:35

加速几百倍显然是不现实的，不过如果要运行的代码可以大量线程并行并且有大量浮点运算且没什么分支的话，GPU还是很有优势的

zensin123 · 发表于 2012-11-15 00:21:18

回复 3# acp134

我没那么老，别叫我大叔。[em02]

caosimin7532 · 发表于 2012-11-15 20:47:46

基本没看懂

zensin123 · 发表于 2012-11-15 21:58:14

回复 6# caosimin7532

那就慢慢看，别着急。

		自动登录	找回密码
密码			新注册用户