虚拟化- LHC 物理志愿者计算的关键

来自中国分布式计算总站
跳转至: 导航搜索

虚拟化- LHC 物理志愿者计算的关键

概要: 本文简要介绍了LHC@home中使用的一种新的虚拟化技术。
虚拟化- LHC 物理志愿者计算的关键
Virtualization: Key for LHC physics volunteer computing
本文由外语文献翻译而来
若发现翻译问题,请至论坛讨论
原文 International Science Grid this Week
发布时间 2010年2月24日
原作者 Ben Segal, CERN, and Seth Bell, iSGTW
译者 zglloo
版权 中国分布式计算总站:版权信息


在2006年, LHC@home的艰巨任务由沃尔夫·冯·芮登来领队团队,他曾是CERN IT项目主要负责人: 计算志愿者项目BOINC用于模拟大型强子对撞机引起的兴趣而被关注。

对此他提出了苛刻的问题。

该软件在环境实验中使用时,例如ATLAS, ALICE, CMS 和LHCb的数据显得非常巨大。

此外,所有的LHC物理方面的软件都在Scientific Linux下完成开发,尽管绝大多数的PC用户运行在Windows下。移植大型或动态变化的的软件是不切实际的,因此我们寻求另一种解决方案是必要的。

解决方案?

我们正在开发用于志愿计算与CernVM虚拟影像相结合的管理系统。它会使成千上万的志愿者PC的运用于LHC网格实验仿真提升额外资源。

CERN于2004年LHC@home系统通过志愿计算开始辅助LHC项目,这使CERN加速器的工程师能够对于LHC进行十分细致的模拟,并以此检验LHC机器中双质子束循环的稳定性。

大约5万多市民自愿运用他们的PC来进行这些计算,他们所有的努力归功于开源平台BOINC系统.多数略有耳闻的人们都知晓SETI@home。

仅仅是BOINC通用计算远远不够,甚至手机也可能参与其中

进入cernVM

从那时起,几乎所有的CERN人员都在围绕BOINC的虚拟化而努力这其中还有暑期的实习生。正是这两位实习生调查虚拟化中的问题起到关键。

这可不是单纯发送可执行到志愿者的PC上,而是将所有的LHC Linux环境及准确版本都运行在物理代码发送至虚拟管理系统下执行(virtual hypervisor),希望结果行得通,自从虚拟化的涉及cpu只有一小部分开销。

然而,新的问题是由于虚拟镜像环境中包含LHC的实验包非常之巨大(约有8-10GB左右[gigabytes=GB])。更加复杂的是,其中有频繁改变的数据包,每一个变化都需要完整的镜像重新加载。

CernVM,由Predrag Buncic于2008年开发完成。它为物理计算提供了一个虚拟的镜像管理问题的整体解决方案。之前的做法是在所有运行中的虚拟机上都加载包含全部LHC实验用代码和库的镜像,现在CrenVM只加载一些基础的、大概只有100MB左右的“十分薄的程序”,而更进一步的镜像内容将会被按需加载。镜像内容的更新由CernVM系统自动进行,这保证了其管理的每个LHC实验对应的库中都存有最新版的镜像。结果反馈镜像一般来说都会小于1GB,并由虚拟机负责缓存,在出现变化前,其与CernVM的库间的通信会保持最小量。

从2008年开始,有研究者与志愿者开始提出一种CernVM与BOINC的联合系统的工作原型。进一步的工作由CernVM团队完成:他们成功地将CernVM连接到了LHC实验的工作产品系统上(ATLAS’s PanDA and ALICE’s AliEn)。这使ATLAS和ALICE实验得以在不改变其产品脚本的情况下同CernVM“云”通信。

运用这些“志愿云计算”工作都将使得BOINC电脑作为额外的计算资源来协助LHC的实验。它是在先进的计算与分析技术在物理学研究,在昨日位于印度斋浦尔(2月23日,2010年)。

——本•席格,CERN,和贝尔•塞斯,iSGTW,有关详细信息项,请到Indico