找回密码
 新注册用户
搜索
楼主: zglloo

用PS3做服务器!《战鹰》PS3服务器集群暴光

[复制链接]
 楼主| 发表于 2007-10-16 13:35:10 | 显示全部楼层

CELL性能

Alias是大名鼎鼎的电脑特效以及3DCG制作厂商,也是著名软件DCC的开发商。日前,Alias对使用CELL以及奔腾4处理器演示了最新的布料仿真算法,得出了惊人的结论——2.4GHz的CELL在这一算法中性能为3.6GHz奔腾4性能的5倍多。

  本次演示的目的只是展示下一代布料仿真的新算法。(当然同时也是炫耀一下cell的超强实力!)演示的内容包括各种不同的动力学环境下,布料在重力和碰撞下的真实物理反映,如绷紧、折叠等。整个演示在一台cell服务器下完成,包含一个或多个cell处理器,处理后的结果输送到一台POWER G5处理器的苹果客户端作显示用。
此项布料仿真算法完全是Alias自身研发的一种全新方案,可以提供稳定且高速的布料力学仿真,并非为cell特制,传统cpu同样可以运行。

  布料模拟演示得益于cell处理器拥有8个SPEs的而具备的并行计算能力,单个cell能够在同时间内运行8个模拟实例。
 因为,布料模拟数据量巨大,我们设法提高了对cell的向量支持能力,并且通过向量化负责演算网格数据结构的函数代码来获得性能得巨大提升。从目前的试验进度来看,一颗原型的2.4GHz Cell性能表现上大概五倍于3.4GHz奔4级别的处理器。
回复

使用道具 举报

发表于 2007-10-17 16:24:41 | 显示全部楼层

回复 #16 zglloo 的帖子

我想知道,AMD和intel是干什么吃的





-----------
一年多后的补充@2008-12-20
呵呵,看当时的言论,naive

[ 本帖最后由 Julian_Yuen 于 2008-12-20 04:41 编辑 ]
回复

使用道具 举报

 楼主| 发表于 2007-10-17 19:56:22 | 显示全部楼层

回复 #17 Julian_Yuen 的帖子

似乎这个处理器从制造  就成为了对多媒体 科学计算 处理大量3D渲染而制造吧    不然PS3咋能个那么 多的核 那么高的计算呢!   
      感觉现在从Folding@Home 统计来看 PS3的计算力实在是恐怖啊

OS Type Current TFLOPS* Active CPUs Total CPUs
Windows 170 178270 1820240
Mac OS X/PowerPC 7 9216 106714
Mac OS X/Intel 12 3740 25712
Linux 38 22626 249361
GPU 37 634 4399
PLAYSTATION®3 933 37618 284136
Total 1197 252104 2490562


我在想是不是 PS3用户大多 买了都有不断的计算中呢!   还是因为它不在BOINC中参加的人少!

[ 本帖最后由 zglloo 于 2007-10-17 20:03 编辑 ]
回复

使用道具 举报

发表于 2007-10-17 20:24:37 | 显示全部楼层
单核的 X1900/1950 比它还要厉害一倍有多。。
其实也没什么,处理器很单一,并且先进,所以体现出高性能
而pc下用户群体庞大,处理器参差不齐,用来做对比意义不大。。
回复

使用道具 举报

发表于 2007-10-17 22:18:39 | 显示全部楼层
原帖由 Julian_Yuen 于 2007-10-17 16:24 发表
我想知道,AMD和intel是干什么吃的

通用计算~~

并行计算~~


回复

使用道具 举报

发表于 2007-10-18 19:35:22 | 显示全部楼层

天体物理学家用PS3代替超级电脑

http://games.solidot.org/article.pl?sid=07/10/18/0745230&from=rss

索尼的PS3游戏主机被冠以昂贵及缺乏重镑游戏,因此销量不佳。但在另一领域它却可大有作为,那就是科学研究。现在8台PS3连接成的集群正忙于计算神秘的重力波,以及超大型黑洞周围会发生什么。Massachusetts大学的助教称PS3是一个开放性平台,可方便安装Liunx,它的性能执行科学计算任务有许多优势,比如Folding@home分布式计算。8台PS3仅花费了3200美元,同样的资金是不可能购买到性能强劲的计算机的。



引力波? Einstein@home 麽?
回复

使用道具 举报

发表于 2007-10-18 20:04:16 | 显示全部楼层
以后考虑买台PS3好了,啧啧!
回复

使用道具 举报

发表于 2007-10-18 22:45:47 | 显示全部楼层
不是谁家的游戏机都可以运行Windows哇!

回复

使用道具 举报

发表于 2007-10-18 23:05:11 | 显示全部楼层

回复 #21 BiscuiT 的帖子

http://news.mydrivers.com/1/93/93089.htm

继斯坦福大学利用PS3解算蛋白质之后,另一个科研领域也成了PS3一显身手的好地方。
马塞诸萨州立大学达特茅斯分校的天体物理学家GauravKhanna博士正利用八台PS3替代原先的超级计算机来解求目前仍存在于纸面上的重力波(gravitywaves),它被假定为某个超级黑洞吞噬星体时产生的副产品。Khanna博士将利用他新到手的强大计算能力来搜寻有关它存在的切实证据。
至于为何要用游戏机来代替超级计算机,Khanna博士解释说基本上可归纳为两点:第一,索尼将其设计为开放式平台,用户能运行Linux,系统不会横加干涉;第二,PS3比较便宜,再结合Linux的友好特性,使它成为效费比很高且易于部署的计算平台。
Khanna博士以前需向美国国家科学基金会(NSF)申请遍布全国的超级计算机节点以应付此项目那庞大的计算规模:“我一般要调用上百颗处理器,最多可至500颗,来做同一件事”,但每个节点要付费5000美元,而八台60G版PS3不过3200美元,但Khanna博士估计自己很难说服NSF为某个科研项目拨款买游戏机,尽管这笔花销简直不值得一提。
所以他向索尼表明自己的意图,而后者对这种出风头的事向来趋之若鹜,于是Khanna博士得到了免费的PS3。目前他的项目已在新平台上运行了一个多月,据他粗略统计,这八台PS3相当于200个超级计算机节点:
“基本上,它类似于代用品,我再也不必依赖超级计算机了,这是件大好事,尽管我没花钱,但同一笔钱可不一定能干这么多事。”
Khanna博士打算过两个月就发表他的研究成果,所以,PS3玩家如果在等待新作的日子里无事可做,至少有墨香扑鼻的科研论文可读了。
回复

使用道具 举报

发表于 2007-10-18 23:26:38 | 显示全部楼层
"这八台PS3相当于200个超级计算机节点" - 这里有没有水分?

回复 #24 Julian_Yuen 的帖子
RISC架构哦,就算装上linux你又如何日常使用呢?
就算能,未被D版侵染的区域,买软件的钱远够你发神经了。。
回复

使用道具 举报

发表于 2007-10-18 23:30:07 | 显示全部楼层
靠,我删掉了24楼,刚删掉.....

-------------------------------
cell强在浮点?

http://game.yesky.com/ps3/284/2688284.shtml

 PS3的CELL处理器性能究竟如何?近日,网上又爆出了它的相关测试数据。测试者用CELL和PowerPC G4 1.25G、奔腾4 2G、奔腾4 3.2G、奔腾3 866MHZ以及Athlon64 X2 4400+进行了对比。结果如下:Dhrystone v2.1
PS3 Cell 3.2GHz: 1879.630
PowerPC G4 1.25GHz: 2202.600
PentiumIII 866MHz: 1124.311
Pentium4 2.0AGHz: 1694.717
Pentium4 3.2GHz: 3258.068
Linpack 100x100 Benchmark In C/C++ (Rolled Double Precision)
PS3 Cell 3.2GHz: 315.71
PentiumIII 866MHz: 313.05
Pentium4 2.0AGHz: 683.91
Pentium4 3.2GHz: 770.66
Athlon64 X2 4400+ (2.2GHz): 781.58
Linpack 100x100 Benchmark In C/C++ (Rolled Single Precision)
PS3 Cell 3.2GHz: 312.64
PentiumIII 866MHz: 198.7
Pentium4 2.0AGHz: 82.57
Pentium4 3.2GHz: 276.14
Athlon64 X2 4400+ (2.2GHz): 538.05
  结果基本上大略是在预料之内,PS3 CELLPPE的整数和倍精度都不太好;单精度FP倒是有一定程度的实力,本来以为不是VMX-128应该会比较差的。不过,可以看得出来倍精度的部份应该和SPE一样有一定程度的弱化。所以如果不使用SPE的话,基本上倍精度对Cell仍然是极为吃重的工作;或许65nm版本的Cell会做些强化也说不定。
(65nm Cell可能要等到2007年第三季度)
  总的来说,PPE的整数实力大约只有PPC970 @1.8GHz的1/3左右。这其实会导因到一个很有趣的结果-回头看具有3个PPX的Xenos(XBOX360主处理器),实际上PPX也只不过是PPE + VMX128而已,这代表Xenos的整数实力也顶多是PPC970 @1.8GHz同等的水平。如果善用SMT的话,或许可以和缺乏OOOE扯平,不过也不是可以乐观地说整数多好的程度;而SPE也是可以执行整数的,虽然范畴有相当的限制。此外,Emotion Engine的R4300,当初跑Dhrystone2.1的成绩是450分,PPE大约是4x,所以考虑PPE在ISA上对EE的一些辅助设计,执行PS2 Emulator应该是没有什么问题。
  通过以上数据,我们可以分析得出:据传统的说法,即使是游戏,仍然有相当比例的整数运算;但是从PS2以来,console都相当重视flops(浮点运算)。这回的benchmark可以让我们看到,不仅是PS3、XBOX360的整数其实也是偏弱的。那么到底对执行游戏而言,整数和浮点运算资源,哪方面的比重比较大呢?
  如果有玩家想买台PS3来跑Linux,而没把活用SPE资源当成前提的话,不如买一台中低端个人电脑还比较经济实惠。
回复

使用道具 举报

发表于 2007-10-18 23:32:43 | 显示全部楼层

回复 #25 BiscuiT 的帖子

谁知道E文原文是什么?谁知道哪只猫翻译的文章?驱动之家跟小报差不多~

呃,只是想象买一台。想也有罪?
回复

使用道具 举报

发表于 2007-10-18 23:46:40 | 显示全部楼层

Cell处理器技术前瞻(一)

http://zih.it.com.cn/articles/78973.htm

(转自pcpro.com.cn)

     早在2001年,索尼就对外透露将与IBM合作,由IBM来设计PS3游戏主机的处理器,这枚处理器被命名为“Cell”,也就是中文“细胞”的意思。双方宣称,Cell的运算能力将达到史无前例的1TeraFLOPS(Floating Operations per Second),也就是每秒执行万亿次浮点运算,这样的性能绝对可达到超级计算机的标准。在当时,世界上最快的计算机是NEC的“地球模拟器”,它的运算能力为每秒36万亿浮点运算,换句话说,36部PS3游戏机的运算力总和就达到同样的水平。再者,Cell可支持一项特殊的分布式运算技术,多台PS3连接在一起可以分享运算力,由此获得更高的效能。在当时,这样的设计理念让人目瞪口呆,外界的第一反应就是,索尼不过是在吊玩家的胃口,而IBM则是在吹牛。

    在这之后,PS3和Cell很快被人淡忘,直到2004年,索尼与IBM再度公布了一些关于PS3和Cell的消息,据称Cell已经完成设计,处于样品测试阶段,工作频率达到2GHz,很好地实现了预期设计目标,但这仍只是一条纸面上的简单报告,双方都没有展出任何相关样品供参考。此时,外界的眼球早已被Intel、AMD之间激烈的竞争吸引,专属于游戏机的Cell处理器自然不可能获得业界的广泛注意。2005年2月,IBM在“国际固态电路会议(IEEE International Solid-State Circuits Conference,简称为ISSCC)”上发表了数篇关于Cell的技术论文,披露Cell处理器的详细规格参数并展出相关样品,IBM还宣布 Cell已进入到大规模量产阶段,将在未来几个月内提交给索尼。就这样,一款媲美超级计算机的革命性微处理器由此到来。在下面的文字中,我们将对Cell 处理器进行深入详尽的技术分析,倘若读者有耐心读完本文,也许会发现今天我们津津乐道的X86处理器在思想上落后了数个时代。

Cell的物理设计与逻辑架构

    在介绍Cell的逻辑架构之前,我们先来看看Cell的物理规格:Cell集成了2亿3400万个晶体管,它采用IBM的90纳米SOI、Low -K工艺制造,核心面积为221平方毫米,芯片规模与Intel即将发布的双核Pentium D相当,两者的制造成本处于同一条水平线上。在逻辑上,Cell处理器基于一个“Power处理单元(Power Processor Element,下面简称为PPE)”,它可以支持SMT虚拟多线程技术,同步执行两个不相干的线程。此外,Cell内部还拥有八个基于SIMD的协处理器(Synergistic Processor Element,以下简称SPE),简单点说,一枚Cell处理器内部整合了九颗独立的运算核心,可支持多达十条线程的同步运行。另外,Cell还整合了 XDR内存控制器,可配合25.6GBps带宽的内存系统,而它的前端总线也采用96位、6.4GHz频率的FlexIO并行总线(原名称为 “Redwood”,RAMBUS公司所开发),这也是有史以来速度最快的计算机总线。所有的这一切都让人觉得非常不可思议,如果我们将Cell同X86 处理器对比,便会发现二者在设计上没有半点相似,Cell不同寻常的另类设计也引起外界的普遍疑虑:它的工作频率能到什么水平?实际性能又比最新的X86 处理器快多少?Cell能够达到预期设计目标么?




图1 Cell处理器实物


    如果你心里也有类似疑问,我们的建议是将你之前所了解的X86处理器知识全部清空,然后重新来认识Cell。我们知道,目前X86处理器的最高纪录是3.8GHz,由Intel的Pentium 4 E所创下,本来Intel计划让它的频率突破4GHz,但受到高功耗和稳定性方面的困扰,不得不宣告失败,要更进一步提升频率也被业界认为难以实现。然而,Cell的工作频率轻易突破了4GHz,并将达到4.6GHz的新高,这显然超出X86业界所能理解的范围。更不合常理的是,X86处理器的高频率必须以牺牲指令效能为代价,高频未必就能带来高效能(Pentium 4系列的高频低能人所共知),而Cell的实际运算性能竟达256Gigaflops,也就是每秒可执行2560亿次浮点运算,IBM最初的设计是将四枚处理器整合一体,这样就可获得每秒万亿次浮点运算的超高性能。如果你对此没有感性的认识,我们不妨举些例子作为对比:Pentium 4 E 3.8GHz的SIMD效能为15Gigaflops,这也是X86处理器目前能达到的最高水平,但这个性能只有Cell的十七分之一,两者完全不具可比性,尽管它们的物理参数和制造成本处于同一水平线。IBM十分自豪地将Cell称为“单芯片超级计算机”,这也很好实现了预期设计目标。




图2 切割出Cell处理器的12英寸晶圆


    Cell所具有的高效能无疑得益于高度优化的Power架构。Power是IBM为超级计算机所创立的RISC指令系统,而RISC架构具有与生俱来的高效性,处理器结构精简,技术上明显优于X86。正因为这一点,几乎所有的超级计算机系统都隶属于RISC体系,而我们所津津乐道的X86,实际上仅仅局限在PC环境,只是因为PC与人们工作生活联系紧密,故广为人知(关于RISC与CISC的对比,本刊上期《未来处理器设计思想前瞻》的文章中有非常详尽的阐述,有兴趣的读者可自行参考,这里就不再赘述)。不过,RISC架构显然不是Cell拥有超高性能的唯一原因。如果我们将PowerPC 970处理器(苹果称之为“PowerPC G5”)与Cell对比,大家还是可以发现两者的性能差距极其悬殊:PowerPC 970的晶体管数为5800万个,4枚PowerPC 970的晶体管数总和与一枚Cell相当,但配备双PowerPC 970处理器的Xserve G5仅能提供9.0 Gigaflops的运算力,远无法与Cell相比,尽管它们在设计架构上同属于Power体系。实际上,Cell的高效能很大程度上来自于其新颖的设计思想:主处理器与协处理器各司其职,内核设计精简高效以实现高频运作,而运算单元则采用128位并行结构,大家可以从下面的分析中逐渐了解到这一点。




图3 高度适应性的Cell及所构成的Cell计算网络


    高度弹性的设计与分布式计算是Cell除高性能之外的两大亮点。IBM希望Cell可适用于从嵌入式设备到大型计算机等几乎所有计算设备中,所以将Cell设计为一个通用的处理器平台。根据不同的需求,Cell可以对处理内核的数量进行任意裁减,如针对嵌入式设备的产品只有单个核心,且工作在较低的频率上以实现较低的能耗;针对便携电脑和桌面PC的版本,可使用与PS3游戏机一样的标准Cell,或者对核心进行适当裁减;如果要用于工作站/服务器系统,IBM可以将两枚Cell处理器直接集成在一起以获得更高的效能;若要用于大型计算机,Cell则可配置成包含四枚独立处理器的“MCM模块”,此时它具有每秒万亿次浮点的运算能力,这也是IBM当初承诺的标准。而支持分布式计算技术更具革命意义,Cell拥有一条超高速度的FlexIO芯片连接总线,基于Cell的不同计算设备可以借此联成一体,实现运算力与内存资源的分享。网络上的设备越多,所拥有的运算力就越强大。此时,Cell处理器就好比是该计算网络上最基本的构成细胞,而这项机能将带来一场天翻地覆的计算革命。想想看,任何人都可以在家庭中轻而易举制造出属于自己的超级计算机,这无疑意味着计算力的真正解放。




图4 Cell处理器的整体架构示意


    支持多操作系统运作是当前X86处理器的热门技术,其实IBM在几年之前就将该技术应用于Power架构处理器中,Cell理所当然继承了这项特性。另外,Cell具备强大的自主纠错能力—IBM实验室的科学家们一直致力于研究真正可靠的计算,他们希望计算机能够具备故障自动恢复功能,实现真正的 “永不宕机”运作,而这项成果现在也被用于Cell身上。在运行过程中,Cell可自动检测所处理的数据是否遭到破坏,如果数据出错,Cell会借助某种机制将它自动恢复为正常的状态,从而避免产生错误的结果或令系统停机。在下面的文字中,我们将向大家详细分析Cell的设计细节以及应用模式,从中你可以对Cell有更深地了解。

[ 本帖最后由 Julian_Yuen 于 2007-10-18 23:48 编辑 ]
回复

使用道具 举报

发表于 2007-10-18 23:49:45 | 显示全部楼层

Cell处理器技术前瞻(二)

http://zih.it.com.cn/articles/78993.htm

           (转自pcpro.com.cn)

PPE处理核心与SPE协处理器

    前面我们介绍过,Cell处理器包括一个PPE处理单元、八个SPE协处理器、一个XDR内存控制器以及FlexIO接口,而Cell拥有高性能的关键便在于PPE与SPE的设计。

PPE/SPE:针对“简单任务”而设计

    PPE处理单元是Cell的控制与运算中枢,它应该是以IBM的Power 4处理器为基础进行设计的,可支持同步多线程技术。该处理单元内置了32KB一级缓存和512KB二级缓存,其规格与同出一脉的PowerPC 970处理器极其类似。而在Cell中,真正负责浮点运算的应该是八个SPE协处理器。图5所示是SPE的逻辑结构,SPE由4个负责浮点运算的处理单元、4个负责整数运算的处理单元、128bit×128结构的寄存器和256KB局部缓存构成,它实际上就是一个完整的运算核心。根据IBM所公布的资料,我们获悉SPE的流水线长度为18级,这一点与X86处理器也非常不同—流水线越长,处理器提升工作频率就越容易,反之就越困难。20级流水线的 Northwood Pentium 4止步于3.2GHz,31级流水线的Prescott核心也不过到达3.8GHz,而Cell以18级的短流水线却实现4GHz以上的高频运作。设计者对此作出详细的解释:X86处理器必须完成大而全的运算功能,运算逻辑往往被设计得非常复杂,这也导致其频率提升非常困难;而Cell在基础架构上执行简单化的计算思想,每一个复杂的任务都可以被分解为多个简单的基础任务,Cell中的SPE就专门针对这些基础任务所设计,这样,它就可以在保持高效的同时拥有简单得多的逻辑结构,既然逻辑构成简单,实现高频率运作就没有什么悬念。从这里也可看出,Cell与X86处理器最大的不同,还是在于它们对计算任务的不同理解。

    尽管总线及寄存器都是128位结构,但SPE内的浮点单元和整数单元其实都只有32位,只是IBM通过4路并行运算来获得128bit SIMD的效果,从外部看来,SPE便相当于一个可执行128bit指令的处理单元。SPE内的浮点单元和整数单元各自拥有三条128bit宽度的输入总线和一条128bit宽度的输出总线,二者以全双工模式运作,数据输入/输出操作可同步进行。大家应该也发现这是一套不对等的方案,输入总线的带宽三倍于输出总线,原因在于计算所需的数据总量总是比运算的输出结果要多得多,总线宽度不同在设计上其实非常科学。而借助这两条总线,SPE协处理器的整数/浮点运算单元再与一组包含128个、宽度为128bit的寄存器阵列联结在一起,该寄存器阵列又通过一对全双工运作的、128bit总线同本地缓存(Local Store)相连—每个SPE协处理器都拥有256KB本地缓存,8个SPE就一共拥有2MB缓存,再加上PPE处理单元的512KB二级缓存,Cell 处理器总共拥有超过2.5MB容量的缓存单元,对于一款拥有超级计算效能的处理器来说,如此低的指标同样令人感到诧异。




图5 SPE协处理器的逻辑架构示意


PPE/SPE单元的内部联结

    分析完PPE与SPE协处理器的内部设计,我们再来看看它们是以何种方式组成Cell的。参见前面的图4,我们可以看到Cell内部有一条 768bit位宽的“EIB单元互联总线环(Element Interconnect BUS Ring,EIB Ring)”,它实际上是一个强大的内部总线控制逻辑—Cell内所有的功能单元都通过EIB总线环连接在一起,包括PPE、八个SPE、XDR内存控制器以及外部总线接口,它们所采用的无一例外都是全双工的128bit连接总线。若Cell工作在4GHz频率上,Cell内部的各个功能单元便都拥有 4GHz×128bit/Hz×2(全双工)÷8Byte/bit=128GBps带宽,这样的数字显然是非常可观的。

性能推算与运行模式

    我们很容易能根据这些参数计算出Cell拥有的运算效能:每个SPE协处理器拥有4路并行的整数/浮点单元,一个时钟周期可执行两个运算周期(类似DDR效果、技术细节未明),每个运算周期又可执行4次32位浮点运算;每个Cell拥有8枚SPE协处理器,它的工作频率假设在4GHz,此时 Cell所具有的浮点效能就是2×4×8×4GHz=256Gigaflops,这应该很好理解。

    与常规的双核处理器不同的是,Cell内的九个核心具有相当强的独立性。其中,PPE处理单元的任务是运行操作系统,这个任务对于一个结构类似 PowerPC 970、频率高达4GHz且可支持双线程运作的处理核心来说简直不费吹灰之力。但除了操作系统外,PPE不管任何的事情,应用程序相关的线程运算完全由 SPE协处理器运行。如图6所示,我们可以看到多个应用程序的线程会被平均散布到各个SPE中,整套系统负载均衡、设计得非常科学。而这种纵向结构的多核心设计同X86业界鼓吹的双核处理器截然不同,不论是Pentium D、Yonha还是AMD的双核心Athlon 64,它们的每个处理内核地位对等、每个核心都可以独立完成全部运算,所体现的是一种大而全的计算思想。由于芯片设计越来越复杂,它的工作频率就不得不走了下坡路,Intel当年执著于高频制胜的策略,结果落后于对手,业界普遍认为追求高频率的做法没有前途。而Cell处理器开辟出前所未有的新思路:每个处理内核专注于自己的任务,彼此相互依赖、相互协作,针对任务的简单化也使得每个内核都可以被设计得精简高效,工作频率也轻易达到X86处理器无法企及的高度,最终实现了媲美超级计算机的惊人性能。而在相互协作的同时,Cell内的各个SPE协处理器又保持着高度独立性,除了完成本机的计算任务外,SPE 还可以接受来自Cell计算网络中其他设备的计算请求,并执行相关的计算任务,所得结果再通过网络传输给任务发起者。换句话说,SPE协处理器可以在基于 Cell的计算网络中作平台无关的无缝漫游,网络上的任务可以被均匀分散到所有的Cell处理器上,并以最佳方式在最短的时间内完成。




图6 Cell的运行模式,PPE与SPE各司其职、相互协作。


Cell的功耗分析

    在看完上述分析之后,你一定会以为Cell将是一个功耗大户,在看到详细资料之前,笔者也是抱这种态度。IBM所公布的资料再度让人大吃一惊,当工作频率为4GHz时,每个SPE协处理器的工作电压高于1.1V,但其功耗仅仅只有4瓦。若频率降到3GHz,工作电压只需要0.9V,此时其功耗只有 2瓦。如果将频率降低到2GHz,每个SPE的功耗仅有区区1瓦。那么,Cell内所有SPE协处理器的功耗总和最高也不过4瓦×8=32瓦。至于PPE 处理单元的核心部分,功耗水平也会控制在很低的水平,合乎逻辑的估计是Cell运算部分的功耗水平会在40瓦左右,即便加上缓存单元整体功耗也可控制在较好的水平上。回过头再来看看功耗将高达130瓦、性能不到Cell十分之一的Pentium D,大家会有什么感受?

    考虑到实际应用,Cell的低功耗并不令人吃惊。Cell本来就是为PS3游戏机所设计,而游戏机体积狭小,对芯片的功耗指标颇为敏感,指标过高将给散热带来难题且会产生较高的噪音,这是玩家们绝对无法承受的。在2006年,IBM将采用更先进的65纳米技术来制造Cell,届时它将具有更加出色的功耗水平,而低功耗也为Cell的广泛应用奠定了良好的基础,将它用于嵌入式设备、笔记本电脑、桌面PC还是工作站系统中都没有任何问题,IBM今后所需要关心的,应该是操作系统和应用软件方面的资源配合。
回复

使用道具 举报

发表于 2007-10-18 23:50:40 | 显示全部楼层

Cell处理器技术前瞻(三)

http://zih.it.com.cn/articles/78998.htm

           (转自pcpro.com.cn)   

XDR内存控制器与FlexIO前端总线

    整合XDR内存控制器以及采用FlexIO前端总线也是Cell的两大技术亮点。关于XDR内存,过去我们有过很多介绍:XDR是RAMBUS公司开发的新型DRAM内存,它仍然继承窄位宽、高频率的设计方针,并支持ODR八倍率传输技术,数据频率最高可达到6.4GHz。标准XDR模组的位宽为 16bit,单条6.4GHz的XDR模组便可拥有12.8GBps的高效能。再者,XDR可支持双通道、四通道和八通道设计,该系统的极限性能将可突破 100GBps,这远远高于DDR2、乃至未来DDR3体系。毫无疑问,XDR是IBM和索尼所能找到速度最快、且已进入实用化的内存技术。

    从图7中我们可以看到,每个Cell处理器整合两个XDR内存控制器,而每个控制器又都可以支持双通道,这样Cell就相当于整合了四通道结构的 XDR控制器。目前,XDR内存有2.4GHz、3.2GHz和4.0GHz三种频率规格,Cell将与3.2GHz的XDR模组搭配,该系统可望拥有 16bit×4通道×3.2GHz÷8Byte/bit=25.6GBps的内存带宽。但这并非全部,Cell的内存系统另一个异乎寻常的地方在于,它可以实现跨平台的内存管理。如果我们组建一个由多个Cell设备组成的计算网络,那么所有的Cell处理器都可以在管理自己的内存资源时,访问其他所有 Cell处理器拥有的内存资源,它们在逻辑层面上实际上就是一个有机整体。倘若IBM想将多枚Cell处理器整合为一枚单芯片,每个Cell的内存控制器便会自动联结为一体,无需任何修改即可直接生产,Cell的高弹性架构由此可见一斑。

    Cell拥有一条异常宽大的前端总线,IBM采用同样来自RAMBUS公司的FlexIO总线技术。FlexIO的原名为“Redwood”,它是一种非常独特的并行总线技术,工作频率高达6.4GHz,总线的位宽可根据需要任意配置,你完全不必担忧会存在诸如总线干扰、布线困难之类的难题(若有兴趣了解FlexIO如何解决并行总线干扰、布线困难的难题,可参见插文部分)。据悉,Cell的FlexIO前端总线采用6组8位全双工配置,其中提供给I/O芯片(相当于PC中的芯片组)的连接总线占据2组,上下行各12.8GBps;而提供给PS3的图形处理器或其他Cell处理器的接口则占据另外 4组,上下行各25.6GBps,这样Cell所具有的前端总线有效带宽实际上就相当于76.8GBps。即便身处一个规模庞大的计算网络,Cell所具有的总线带宽仍然可应付自如,确保各个计算核心都可以快速获得所需的运算数据。




图7 Cell的内存控制器与前端总线设计
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~
欢迎大家多多支持基金会~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2025-4-22 04:33

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表