a我考网

 找回密码
 立即注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 129|回复: 1

[红旗认证] Linux集群的存储和共享文件系统的安装介绍

[复制链接]
发表于 2012-8-4 12:16:06 | 显示全部楼层 |阅读模式
      简介
8 k1 A9 t% T  n" T! t  {  本文是系列文章中的第 3 部分,该系列涵盖了安装和设置一个大型 Linux 计算机集群的全部内容。有关如何从多个独立的硬件和软件创建一个可运行的 Linux 集群的资源很多,本系列力求把这些公共领域里的资源中的最新集中起来以供您参考。本系列文章无意为您提供有关如何设计一个新的大型 Linux 集群的基础知识;要获得一般性的架构方面的知识,请参考本文中提到的相关参考资料和 Redbooks。: h6 M7 i% j: \4 X) [* N- P
  本系列是针对系统架构师和系统工程师使用 IBM eServer Cluster 1350 框架(关于该框架的更多,请参见 参考资料 )计划和实现 Linux 集群而设计的。其中的一部分内容可能会与集群治理员的日常集群操作有关。本文的每个章节都针对相同的示例安装。0 o0 c- h8 z& k# d+ ^
  本系列的 第 1 部分 具体阐述了设置集群硬件的操作指导。 第 2 部分 带您亲历了硬件配置的后续步骤:安装软件,这其中会用到 IBM systems 治理软件、Cluster Systems Management 和节点安装。# [" K# R/ G  z) i: V/ ]
  第 3 部分是两篇有关集群后端存储的文章中的上部,这两篇文章合在一起,全面介绍了存储的硬件配置以及 IBM 共享文件系统 GPFS 的安装和配置。本部分将侧重于讨论存储系统的架构、硬件预备以及存储区域网络(Storage Area Network,SAN)的设置。本系列的第 4 部分即最后一部分则提供了有关特定于此示例集群存储后端的 CSM 的具体,尤其是如何执行存储系统的节点安装以及 GPFS 的集群配置。( I& x9 O* J' `
  存储架构
3 a. |% U$ n5 a9 i  在继续之前,先阅读一下本系列 第 1 部分 中有关总体架构的章节将会很有益处。
5 G) X% x! r" K: R+ z1 L: e  图 1 给出了本系列中描述的示例集群的存储配置概览。此配置在本文中将进一步加以解释。该设置基于 GPFS 版本 2.3。包括一个大型的 GPFS 集群,该集群分成两个逻辑部分,共用一个大型文件系统。示例设计还提供了应付灾难的恢复能力,假如存储后端的一半丢失,另一半仍可继续操作。
! o' p1 M- N0 C0 S  图 1 显示了四个存储服务器,可治理由两个磁盘子系统提供的存储。在右上角,可以看到一个 tie-breaker 服务器。网络连接和光纤连接也显示出来以供参考。所有这些内容会在本文的后续章节具体加以介绍。集群的其他部分显示为云状,本文不会涉及。更多关于该集群其他部分的,请参看本系列的 第 1 部分 和 第 2 部分 。
+ x3 D, x/ x9 V# t) P" \5 c  节点2 @: }3 E4 h! u1 S' D5 B1 w
  GPFS 集群的大部分节点都运行 Red Hat Enterprise Linux 3。本例使用服务器/客户机架构,其中,少数几个服务器通过光纤通道拥有对存储的可见性。它们充当集群其他部分的网络共享磁盘 服务器。这意味着大多数 GPFS 集群的成员都将使用 NSD 服务器经由 IP 访问存储。NSD 节点(即存储节点)一共有四个:GPFS 集群的逻辑分区各两个。它们均按对分组,每一对治理其中的一个存储子系统。
+ f, T" t& _! s/ X9 M+ I  Tiebreaker- r! q3 V, G: `
  集群的每一半都包含完全相同数目的节点,若其中的一半丢失,就会带来仲裁问题。通过 GPFS,若要使文件系统保持可用,就需要有一个有效的节点仲裁。Quorum 由 Quorum = + 1 定义。4 i2 f) a+ f+ f7 F
  在本例所示的这种配置中,集群由完全相同的两个部分组成,若其中任何一个丢失,GPFS 文件系统都会不可用。为了避免这种情况,系统采用了一个 tie-breaker 节点。此节点的物理位置与主集群不在一起。这意味着若任何一部分不可用,另一部分都能继续访问 GPFS 文件系统。这是通过使用三个故障组得以实现的,我们将在 数据复制 一节具体对之进行介绍。这意味着数据的两个副本都可用:集群的每一半各一个。
" F8 c! g  l" q" Q  架构8 W* W0 P4 n$ W) ~
  如图 1 所示,每个节点均连接至两个网络。其中的第一个网络用于计算流量和总的集群通信。第二个网络则专门针对 GPFS,为那些不具有 Storage Area Network 存储系统直观视图的节点提供经由 IP 的存储访问。这个网络使用巨大帧来获得好的性能。有关存储网络的更具体的,请参阅本系列第 4 部分的 GPFS 网络调优一节。% ?6 B  ~3 v8 w1 B2 T5 P) j. w
  存储区域网络0 L+ ^# {8 L# y6 r
  本解决方案的存储后端包括两个磁盘子系统,均为 IBM TotalStorage DS4500(之前为 FAStT 900)磁盘系统,每一个都附带完全填充过的 EXP710 扩展磁盘柜。每个 DS4500 均被配置成 RAID 5 4+P 阵列外加热后备磁盘。8 G5 m. N' ?. c: k
  每个 DS4500 均由一对存储服务器所有。在这两个服务器间拆分 4+P 阵列,以便每个服务器都可充当阵列其中一半的主服务器、阵列另一半的备用服务器。这样一来,若任何一个服务器故障,另一个服务器都能立即作为主服务器从故障的服务器接管磁盘。
: b+ w! y  m% _1 o  数据复制) r; Q% e8 n" K  |0 m& ]
  本例中,GPFS 会复制 GPFS 文件系统中的数据或元数据。存储被拆分成三个故障组。每一个故障组都包括一组共享共同故障点的逻辑磁盘(从操作系统不难发现,这里,一个磁盘对应于一个 LUN,这个 LUN 是 DS4500 上的一个磁盘阵列)。此系统中的故障组由如下部分组成:
" U/ @3 T% L" {& h" P7 s# q8 x* S) m  故障组 1 中的一个 DS4500 系统
5 a4 x: ?, Z& z- M+ V" z7 C  故障组 2 中一个 DS4500 系统
& f1 v9 G( J+ G& ]  属于 tie-breaker 节点的本地磁盘
/ p: J1 D7 L! }/ J7 x  在创建 GPFS 文件系统时,应该先将数据和元数据的副本数量指定为 2。所以,对于如上定义的故障组,每半个部分都会包含文件系统的一个副本。第 3 个故障组是解决磁盘仲裁问题所必需的,以便假如存储的其中一半离线之后,磁盘仲裁能立即发挥作用且文件系统也能保持总可以被访问。
9 `3 y- h) h. F( a6 k% }3 ~  硬件预备5 p  G. C" p. e
  如所提到的,此集群包含两个 IBM TotalStorage DS4500 设备,二者组成了此解决方案的存储后端。有关此硬件的更多,可以在 参考资料 一节找到。2 p8 q# D4 P3 V- ^# Y6 v: M- B
  IBM 使用 IBM TotalStorage DS4000 EXP710 光纤通道(FC)存储扩展单元将两个 DS4500 系统连接起来。其中的每个单元都是一个 14-bay、2 GBps、可机架安装的 FC 封装。 有关此硬件的更多,可以在 参考资料 一节找到。
: r" Q1 F9 u! i; y, z* H$ C. Q  如下的章节涵盖了这个示例解决方案中用到的 DS4500 和 EXP710 单元的配置细节。
/ G! b) R+ I% n- ]1 E  开关的顺序' J6 o3 k% s" e) B
  注重,您需要以一种特定的顺序来开关 SAN 系统,以便所有存储都可被正确发现。请以如下顺序执行系统开启:" S# Z- i2 `6 Z- S. q
  1. SAN 交换机(答应其完全初始化)/ k4 o2 I$ V# U( p% j1 H; o3 n* ?
  2. EXP 710 柜1 \4 T% ^: a9 f0 v6 C% L7 s
  3. DS4500 (答应其完全初始化)8 Z5 W+ K3 j7 V4 M2 g5 g& U7 t
  4. 存储服务器$ d( O# I% {5 q
  关闭的顺序则与之相反,如下所示:$ y* J6 i7 T- W) ~, q3 y
  1. 存储服务器6 _; w8 I, l- H0 k6 ~: l, U9 A
  2. DS4500! }7 p- J$ C% L2 o( A
  3. EXP 710
4 \' W  z3 h7 G+ [  4. SAN 交换机7 y, w; A: R8 L! v% B# k
  连接
% @" D: K% L, u5 b1 h8 y$ S  图 2 显示了 DS4500 单元的背面。在左侧有四个 mini-hub 端口,可用来进行主机连接。在本文,将这四个端口由左向右依次表示为 slot 1 至 slot 4,如图 1 所示。Slot 1 和 3 对应于顶部控制器,即控制器 A。Slot 2 和 4 分别对应于底部的控制器,即控制器 B。在右侧,也有四个 mini-hub 端口,可用于进行扩展柜 的连接。
回复

使用道具 举报

 楼主| 发表于 2012-8-4 12:16:07 | 显示全部楼层

Linux集群的存储和共享文件系统的安装介绍

  创建磁盘阵列
0 Y: q' O, n# o- d  1. 右键单击一个要添加到阵列的尚未分配的磁盘,选择 Create Logical Drive。& h* Q: y; q; @* ?
  2. 在所出现的向导中单击 Next。- h! R0 ~7 W$ Z% X+ B  d4 a) S% o
  3. 选择 RAID level 5。原始驱动器已经被选中。
6 b" V9 Z' z; O7 d: i" v7 d. F. x  4. 向阵列再添加其他四个驱动器,使其总数为 5。
8 ^) j' U- w8 y  5. 在 Array Success 窗口,单击 OK,在此阵列上创建逻辑驱动器。
. r' ^6 R* x" o; J; ~  6. 选择默认选项,其中整个 LUN 都被用于此逻辑驱动器。而这个逻辑驱动器的命名约定是 ds4500 name_arraynumber。在 Advanced Parameters 之下,选择 Customize Settings。
2 I. F) a) G5 X  7. 在 I/O Characteristics 类型,选择默认,即 File System,并选择首选槽以便阵列可以在 A 和 B 间交替。在本例中,slot A 中有奇数个阵列,slot B 中有偶数个阵列。0 `" D' E; q- d2 ~; Z
  8. 选择 Map Later 以稍候再返回到映射。
& ~! y/ I( w1 E' \  在创建此阵列时,您会看到一个绿色的圆筒,旁边还有一个时钟。可以通过在这个逻辑磁盘名上右键单击并选择 Properties 来查看进展。% V- Y4 ?' }# Q5 U% ]7 O# P% J% P
  注重,此后的步骤需要您必须已经配置好 SAN 交换机并已安装和运行存储服务器,且主机总线适配器 也已配置,以便 HBA 的 WWPN 均可对 SAN 交换机可见,并进而对 DS4500 可见。有关这些步骤的具体,请参看第 4 部分的 SAN 架构 一节和 HBA 配置的相关章节。
, ~  c- I9 {$ F! x5 S2 k  存储分区和磁盘映射
- ]0 ]  v- h9 k  LUN 一旦创建,就必须被分配到主机。在本例中,使用存储分区。通过创建逻辑驱动器到 LUN 的映射可以定义存储分区。这就将对特定逻辑驱动器的访问权授予了主机或主机组。在定义存储分区时,请按顺序执行这些步骤。需要首先定义拓扑结构然后再定义存储分区:
& A' {" T/ N$ D& ]  1. 定义主机组。- c2 a+ c( N; J3 j: [
  2. 定义组内的主机。
# l6 j: |  h; i8 T( R; H  3. 定义主机端口。$ E5 o5 X# i/ s2 t$ `
  4. 定义存储分区。; W; O. F  h3 |' H2 |
  如前所述,在本例的设置中,每个 DS4500 只有一个组,包含两个存储节点,两节点间的所有在 DS4500 上的磁盘都将被 twin tailed。除了 Access LUN 之外,所有其他的 LUN 均被分配到这个组。Access LUN 用于 DS4500 的带内治理。然而,Linux 并不提供对它的支持,必须从所创建的所有节点组中删除。
1 v9 S& h6 w" P1 _9 U8 n  创建一个新的主机组,方法是右键单击 Default Group 段并选择 Define New Host Group。输入主机组的名称。之后,创建一个新的主机,方法是右键单击所选的主机组并选择 Define Host Port。在下拉菜单,选择对应于所添加 HBA 的 WWPN。注重,若要使 WWPN 出现在此菜单,您必须在此 SAN 中已经正确对该主机进行了配置和专区划分。随后,Storage Manager 将会在 Show All Host Port Information 下看到此主机。Linux Host Type 已被选中,随后,主机端口名称也会被输入到最后的那个框内。0 ?' b+ a& K, k
  重复此步骤,以便每个主机都会有两个已经定义好的端口,接下来,创建存储分区,方法右键单击新创建主机组并选择 Define Storage Partition,以打开存储分区向导。单击 Next 启动该向导。选择刚刚创建的主机组,单击 Next。选择之前定义的那些 LUN 以将其包括到这里。注重 Access LUN 也必须包括进来。单击 Finish 来完成此集合。
7 S& X# `  \! k' m; f$ G" E/ q  SAN 架构
, C6 K# X7 t# J  本节将介绍设置集群中的 SAN 架构所需的步骤。本例的配置中使用的 SAN 交换机是 IBM TotalStorage SAN Switch H16 交换机 。有关此硬件的更多,请参考 参考资料。& U; {3 _' M8 v2 H+ ~9 Y1 J! Z: m
  在本节中,具体介绍了配置 SAN 交换机的步骤,参考了 H16 交换机的某些命令和接口。
$ r5 z1 M( ]/ t2 \& r5 g- x  为 H16 SAN 交换机配置 IP 地址和主机名
! [% }* S1 c. `; x0 y3 d  要在 H16 SAN 交换机上进行 IP 地址的初始配置,可以将此交换机随带的串行电缆(黑头、非 null modem)连接至计算机后端的端口,并使用如下的连接设置:' H. V' U  r6 d0 v5 l
  9600 波特9 [8 \7 s( `8 W! O
  8 数据位
! H, d% o) R1 l' |+ ?  无奇偶校验- a1 w' }/ L8 ]+ x$ {. S
  1 终止位- f$ r* {% J. n# \% o, A
  无流量控制
' `8 k  x' u6 ^* @) e& I  使用默认的登录:用户名为 admin ,密码为 password。可使用命令 ipAddrSet 更改主机名和 IP 地址。也可使用命令 ipAddrShow 验证设置。
7 h4 K6 k. L% G/ O( n5 G9 ^# V0 F0 T. s  IP 地址一旦配置,就可以用 Web 界面来治理 SAN 交换机了。用 IP 地址连接至 SAN 交换机,浏览器必须带 Java 插件。要访问 Admin 界面,单击 Admin 按钮并输入用户名和密码。这里,您可以将交换机的新名字输入到相应的框中并应用这些更改。" m. d& U% C, G1 ^$ c9 K6 D4 }$ B
  网络中每个域的域 ID 必须惟一。本例中的所有交换机均包含在其自身的网络中,但考虑到未来合并的可能,可以改变它们的 ID。注重,在更改域 ID 之前,交换机需要被禁用。: O$ Q; s1 @1 ]2 v
  还有一点可供参考,网络一旦可以访问此交换机,您就可以使用 Admin 界面的 Network Config 选项卡更改此 SAN 交换机的 IP 地址。这种方法是串行连接的一种替代方法。
8 t8 C; o7 q5 u& V1 F) L' y  SAN 交换机分区(zoning)
, V/ n6 G/ d+ O2 t/ I( p9 X  示例集群使用如下的分区原则:
- q- y5 E7 N# _- k7 d% ~# y% _  所有主机上的 HBA0(PCI slot 3 中的 Qlogic 光卡)划分为一区,对此 DS4500 的控制器 A(slot 1 和 3)公开
: _8 e3 G( ]- b, r  所有主机上的 HBA1(PCI slot 4 中的 Qlogic 光卡) 划分为一区,对此 DS4500 的控制器 B(slot 2 和 4)公开' J) Z- }6 H" A8 t5 X0 T8 e6 r
  设置 SAN 交换机的分区可以通过前一节所介绍的交换机上的 Web 界面完成。使用窗口左下角最右侧的按钮可以访问到分区页面。欲简化分区的治理,可以为每个 WWPN 分配别名来识别附在此端口的设备。& Y" C1 R& n5 D/ X9 u
  以下介绍了如何创建别名并将其分配给主机。首先,通过单击 Create 并输入别名的名称来添加别名,然后,选择一个 WWPN 以将它分配给新建的别名。在每个端口都会有三个级别,即:5 F9 v, r& G- [8 o, t/ ]4 }  |4 i
  1. 主机 WWN
) [* N, h$ u( N$ z2 K8 q  2. WWPN: ~2 u$ {/ ~3 W, D+ F  p
  3. 注释3 U$ v) e4 S& l0 w0 @. c/ V: j2 }
  选择第二个级别以及 Add member,可以将第二个级别添加到别名。
( Y. o8 f9 o) _& u8 Q4 V  创建了别名之后,下一步是通过对别名进行分组来创建各个专区(zone)。在本例的配置中,曾用到过专区,在这些专区中,每个主机上的每个 HBA 只能看到相关 DS4500 上的一个控制器。如上一节所介绍的,在本例的设置中,每个 DS4500 只将它的磁盘展示给两个主机。每个主机使用不同的连接连至控制器以分散负荷及最大化吞吐量。这种分区称为单 HBA 分区。在 SAN 级,所有主机之间相互隔离。这种分区消除了主机间不必要的 PLOGI 动作,也消除了故障的 HBA 对其他 HBA 产生影响的风险。其结果是,由于对单个专区的修改并不会影响到其他主机,所以交换机的治理更加安全。当需要添加新的主机时,请尽量创建新的专区,而不是将该主机添加到现有的一个专区内。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Woexam.Com ( 湘ICP备18023104号 )

GMT+8, 2024-5-2 23:08 , Processed in 0.221670 second(s), 23 queries .

Powered by Discuz! X3.4 Licensed

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表