从多个独立的硬件和软件,包括 System x? 和 IBM TotalStorage? 系统,创建一个可运行的 Linux? 集群。这个系列包含多个部分,本文是其中的第 2 部分,阐述了如何配置集群中的管理服务器以及如何安装节点。
; A( G, T; {4 x9 x4 l! r3 M 简介; [# F7 T7 @3 z- @
本文是系列文章中的第 2 部分,该系列涵盖了安装和设置一个大型 Linux 计算机集群的全部内容。有关如何从多个独立的硬件和软件创建一个可运行的 Linux(R) 集群的资源很多,本系列力求把这些公共领域里的资源中的最新信息集中起来以供您参考。本系列文章无意为您提供有关如何设计一个新的大型 Linux 集群的基础知识;要获得一般性的架构方面的知识,请参考本文中提到的相关参考资料和 Redbooks?。
5 P# R' Y2 N/ h" n5 H 本系列是针对系统架构师和系统工程师使用 IBM eServer? Cluster 1350 框架配置板载磁盘,前提是服务器内至少有两个磁盘,并且需要为操作系统启用磁盘故障保护。1 {2 @4 e- E- s* p4 {, X3 C- u
将磁盘配置为单一镜像之后,用第一个 RHEL CD 引导服务器来安装 RHEL 操作系统。根据控制台的不同,您可能需要更改安装的外观。例如,对于一个低分辨率的控制台,您可能需要通过在引导提示符后键入 linux vga=normal 来引导 CD。当看到 Linux 安装 GUI 时,请按照以下指导正常进行安装:
4 _6 [7 z& d) N6 i% j9 h; K. L0 @8 ? 选择语言、键盘图、鼠标类型等。配置磁盘分区,如下所示: 128Mb /boot 主分区。 2 GB 交换分区。 将剩余空间分配给 LVM 分区且不进行格式化执行逻辑卷 (LVM) 设置,如下所示: 命名卷组系统。 添加逻辑卷,如 表 1 所示。设置网络接口,如下所示: 根据以上的示例主机文件,激活 boot 上具有固定 IP 地址 192.168.0.253/24 的 eth0 。 将主机名设置为 mgmt001.cluster.com.。 在此阶段,不需要设置网关/DNS ,如果有外部 IP 信息,可以在安装过程中再对其进行配置。 将防火墙设置为 no firewall 以允许所有连接。如果需要 IP 表,可以在后面对之进行配置。应用本地设置,选择合适的时区。设置 root 密码;本例中的密码是 cluster。定制安装包使之包括如下内容: X Window 系统 KDE(即,K 桌面环境) Graphical internet 服务器配置工具 FTP 服务器 网络服务器 遗留软件开发 管理工具 开始安装。
c0 S/ q$ _9 ~ 表 1. 逻辑卷布局逻辑卷挂载点大小Root/ 8192 MBVar/var 8192 MBUsr/usr 8192 MBOpt/opt 4096 MBTmp/tmp 2048 MBCsminstall/csminstall 10240 MB
$ C! m( X4 B8 V* e 安装完成后,需要逐一处理所有安装后的设置屏幕。针对您自己的环境对管理服务器进行安装后的定制。比如,您可能需要配置 X 服务器使之适合您自己的 KVM(键盘、视频和鼠标)设置。
8 K9 a- Z {9 K9 m5 }7 h& B 安装 CSM' K, Z4 s- [) V y0 p
在支持系统上安装 Cluster Systems Management (CSM) 软件总的来说多少比较简单。在 IBM Linux 集群文档库(参见 参考资料)可以找到 HTML 格式和 PDF 格式的相关文档。
1 V+ i! C$ I& O5 P, I) [ 第一步是将软件复制到管理服务器。因为必须要以 root 用户身份执行安装,所以可以将其存储到 root 根目录。表 2 给出了一种合适的目录结构。
7 P$ Q& d, [' C3 t Q 表 2. CSM 软件目录描述/root/manuals/csm/PDF 格式的 CSM 文档 /root/manuals/gpfs/PDF 格式的 GPFS 文档/root/manuals/rsct/PDF 格式的 RSCT 文档/root/csm/CSM 软件(CSM 压缩包的内容)/root/csm/downloads/开源 RPMS for CSM 下载(例如 autorpm)$ \% v5 k, `$ M
要安装 CSM,需安装 csm.core i386 RPM 包。该包也适用于 the x86_64 架构。安装完该包之后,就可以安装 CSM 管理服务器了。首先,将 /etc/profile.d/Csm.sh 引入到当前的 shell 来获得新的路径设置。然后,运行 installms 命令并将 CSM 许可证应用到系统。以下是需要输入的命令:8 N6 _5 j4 l' o9 j: N* m
rpm -ivh /root/csm/csm.core*.i386.rpm. /etc/profile.d/Csm.shinstallms -p /root/csm/downloads:/root/csmcsmconfig -L Your License File
* F; v" c y; R( G% Z' X 注意:如果没有 CSM 许可证文件,同样可以运行 csmconfig -L 命令接受 60 天的试用许可证。60 天的试用期过后,您必须要应用正式的 CSM 许可证以继续 CSM 功能。
" m3 R3 u6 P2 Z1 d) v( }! Q 针对大型集群进行优化, ]8 v$ H( g% a1 O$ Y6 d6 i
CSM 本身就具有可伸缩性。Red Hat Linux 在许多标准条件下也能很好地正常工作。但为了让大型的集群环境能顺利运行,还是需要对管理服务器进行一些优化。以下列举了优化方法的一些样例:6 X0 k% k0 P, w5 m8 [
侦听在特定接口上的 DHCP 请求。 编辑 /etc/sysconfig/dhcpd DHCPD 配置文件以使 DHCPDARGS 设置为合适的接口。变量 DHCPDARGS 存在于 Red Hat Linux 的 /etc/init.d/dhcpd DHCPD 启动脚本中,用来启动具有特定参数的 DHCP 守护程序。为了能够在 eth0 侦听,请确保多个参数均已包含在引号之内,如下所示:
) V, s, w' d: U4 |$ I4 @ DHCPDARGS="eth0"增加 ARP 表大小和超时设置。 如果一个很大的网络的同一个子网上具有很多或全部集群,ARP 表就可能会过载,就会让人觉得 CSM 和网络请求的响应速度太慢。为了避免上述现象,需要对运行中的系统做如下更改,并将这些更改添加到 /etc/sysctl.conf 文件,以使更改能够持久有效:
- n9 r9 ^0 @8 q/ `1 A net.ipv4.conf.all.arp_filter = 1net.ipv4.conf.all.rp_filter = 1net.ipv4.neigh.default.gc_thresh1 = 512net.ipv4.neigh.default.gc_thresh2 = 2048net.ipv4.neigh.default.gc_thresh3 = 4096net.ipv4.neigh.default.gc_stale_time = 240增加 NFS 守护程序的数量。 默认地,标准的 CSM 扇出值为 16。这意味着跨集群运行的命令会一次运行 16 个节点,节点安装也是如此。Red Hat Linux 的标准 NFS 设置是 8 个可同时运行的守护程序。您可以扩展 NFS,方法是增加 NFSD 线程数到 16 以匹配默认的 CSM 扇出值。如果增加扇出值,您可能也会想增加 NFS 的线程数。一般地,扇出值为 32、NFS 线程数为 32 对于保证速度和可靠性已经足够,而且还能允许同时安装具 32 节点的单个 rack。要实现这一目的,创建配置文件 /etc/sysconfig/nfs 并添加如下行:, I6 E R' D- r |
RPCNFSDCOUNT=16设置 NTP 服务器。 默认的 Red Hat Linux 配置应该也适用于 NTP 服务器。向 /etc/ntp.conf NTP 配置文件添加一个配置行以允许集群网络上的节点能够与管理服务器的时钟同步,如下所示:
1 q! Y7 O6 b; T* U+ e( C restrict 192.168.0.253 mask 255.255.255.0 notrust nomodify notrap如果管理服务器能够连到一个外部的时钟服务器,通过添加如下一行来将该管理服务器的时钟与这个外部时钟服务器同步:- E$ f( L- L. v+ S, z4 ?, E
server server.full.name通过如下指令确保 NTP 服务器在运行并会在引导时自动启动: X3 P) F% O9 x
chkconfig ntpd onservice ntpd start安装节点
$ |( A# u# T* {* V- w# b 完成所有的设置和配置步骤之后,CSM 管理服务器就安装完毕了。在安装节点之前,需要在 CSM 管理服务器上完成一些额外的配置来定义节点安装的方式。在 CSM 管理服务器上执行本节所示的安装步骤。 |