Windows HPC Server 2008 部署初体验
大家好,我是HPC中国研发团队的新程序经理(PM)实习生刘贤斐,听言"PM是连接用户和开发团队的重要角色",因此,在加入微软HPC组之后,尽快熟悉微软HPC的产品成为我的重要任务之一,在在得到了包括老板George,育彤兄的大力支持以及天驰兄的大力PUSH之后,我成功地把Microsoft Windows HPC Server 2008(Beta1) 部署到了一台具备一个头节点4个计算节点的集群(Cluster)上。原来用HPC PACK部署集群是如此方便快捷(不是广告,看后面就知道了),其兴奋不言而喻,在此和大家分享一下我的经历。
那么什么是集群(Cluster)呢?比较正式的解释是:集群(Cluster)是由两台或多台节点机(服务器)构成的一种松散耦合的计算节点集合,能够为用户提供各种服务。我们部署的集群外观是这样的:
HPC Server 2008的作用是在这上面部署操作系统以及集群管理工具等。先来说说HPC Server 2008的概念吧,它是由两个部分组成的:Windows Server 2008和Microsoft HPC Pack。
Windows Server 2008主要是提供64位的操作系统支持,Microsoft HPC Pack提供了集群管理,任务调度,MPI编程环境,SDK等一系列工具。了解了概念后,就动手部署了,首先要做的是插好电源并检查鼠标键盘以及网线有没有接对(不是废话,当时我就没注意分清CONSOLE的接口和头节点的接口,惭愧惭愧),之后就在头节点上装好Windows Server 2008和HPC Pack。接下来当我准备在四个节点上如法炮制时,立马被无情地鄙视了,因为这是最低效率的做法了,我们要做的事情只是把四个节点的电源接通,然后利用HPC Pack的 Node Template(节点模板)功能就可以很方便地在所有的节点上搞定这些事情。具体的过程如下:进入Configuration后,你可以看到如下的界面:
首先,就是配置网络(有5种网络拓扑结构,具体的奥妙大家可以自己研究一把),配置系统帐号,给节点批量命名,最有意思的是第4步了,创建新的节点模板,如图所示:
在向导中稍作配置,一路"Next",即大功告成。然后选择在哪些节点上部署这个模板。我们支持对三种节点的部署:裸机节点,以前把其配置导出成XML文件的节点,和已经安装好操作系统的节点;对我来说在空节点上安装当然是第一种情形了,点击"PROVISION", 部署就开始了。现在可以在"Node Management"(节点管理)导航栏里面看到这些节点在"Provisioning"(正在部署)的列表中,单击节点就可以看到它们部署的状态,在执行哪些命令。
部署完毕后,就可以使用这些节点了,包括让它们online或者offline,提交任务等。
HPC Server提供的一个很有意思的功能是查看节点的健康状态(如下图),我们可以选择添加一些标准(Metric),添加之后,这些标准会以一个柱状图的形式显示出来,颜色越深表示它的值越高。在我们的图中可以看出来,头结点(TYANHEAD)上的每秒系统调用数量(System Calls/ Second)和硬盘的吞吐量(Disk Throughput)都比其他节点高,所以它们对应的颜色也越深,而头结点可用的物理内存(Available Physical Memory)最少,所以相对于其他节点来说,它的颜色也教浅。这样可以让管理员直观的看到现在每个节点的状态。
怎么样,是不是很方便啊,没有繁琐的步骤,不用记大量的命令,一切都很一目了然就可以部署集群了。
以上是我的一些体验,欢迎大家指出不当之处,多多交流~, 同时也感谢全体HPC 中国研发团队对我撰写此文的帮助。
原文链接:http://windowshpc.net/Blogs/China/Lists/Posts/Post.aspx?ID=6