[Storage][Hardware] SAN冗長化

技術のお話し

しばらく使ってるMSAのコントローラを交換し、さらに高速に動作するコントローラへ切り替え。

キャッシュ容量は256MB→512MBに強化されました。

また、今回デュアルコントローラ仕様にし、背面のインタフェースも単なるI/OモジュールからMSA 2/8 SAN Switchに変更しました。

さらに、FirmwareをVersion7に変更してActive/Active構成に変更・・・・・・・・・と。これで可用性をさらに高める形としてみました。

トポロジーとしては、変更前と変更後とで以下のように変化しています。

変更前はこんな感じ。ファブリックは単一でシングルパス構成となっています。

変更後はこんな感じ。本当はデュアルファブリックにしたかったのだけど、ファブリック自体は単一、経路は冗長化させた構成としています。

デュアルファブリックに出来ない理由として、ストレージ管理サーバであるKASHIにデュアルポートHBAである、QLA2342が取り付けられなかったこと。何が原因か不明ですが、紐付くドライブに対する整合性が担保できないようで、なぜかSANBOOTできんかったのです。なのでしぶしぶシングルパス構成のKASHIから両方のコントローラが参照できるように、FCスイッチは単一ファブリック構成とすることにしました。。

全体の流れとしては以下のような感じっす。

  • デュアル構成のMSAが入荷(佐○急便、ありがとうー♪)
  • コントローラ及び背面モジュールを取り外し
  • ストレージを停止するため、SAN接続の全機器を停止
  • MSA1000停止
  • コントローラ及び背面モジュール全交換
  • MSA1000起動
  • ファームウェアのVersionが4.32であることを確認。RAIDアレイを認識せず( ̄◇ ̄;
  • ストレージ管理サーバKASHIのローカルディスクを接続し、ローカルディスクブート
  • Array Configuration Utilityを起動、すべてのディスクが未構成状態であることを確認(T◇T;
  • 一か八かでFirmwareのバージョンを7.20にアップ。MSA Firmware Utilityで無事にアップデート。単一指定で双方のコントローラに交互にファームウェアをアップデートするようになっているみたい。
  • MSA1000の電源を停止して再投入
  • Firmware 7.20で起動したことを確認。双方のコントローラがActive になったことを確認。
  • この時点ですべてのArrayが認識されたことを確認。どうやら古いFirmwareになるとArrayが認識できなくなるらしい・・・・
  • 背面のSan Switchのゾーニング設定を確認。All Allow設定になっていることを確認
  • San Switchを一旦disable状態にした後にconfigureコマンドを実行、ドメインIDを変更(デフォルトでは、1と2が設定)
  • ipaddrsetコマンドを使用してIPアドレスの設定変更を実施
  • 既存SANスイッチから接続をして各スイッチにゾーニング情報をコピー
  • alias及びZONEを作成、追加。現行cfgに作成したZONEを追加。
  • KASHIサーバから正常に接続ができることを確認
  • LUマスキング(Selective Storage Presentation)作業を実施。正常にアレイが参照できることを確認
  • すべての機器を一旦起動
  • Xen Serverは正常に起動を確認。VMwareに関してはSANBOOTしていたサーバが起動不能に陥る(UUIDがかわってしまったのかなぁ・・・・・・・・・?)
  • SANBOOTしていたVMwareサーバにOS再インストール
  • データストアの正常認識を確認
  • VMを起動。正常起動を確認

こうして、正常にMSAが動き出したわけですが・・・・翌々日の朝方に大惨事が・・。

なんと、本体筐体側のSCSIバスが片方飛んだらしく。筐体右側7本のディスクがすべて障害ステータスになっとったとです。(号泣)なんてこった(号泣)ここ、VMareのデータストアがもろに入っているんですが・・・・・Orz

その後、どうやら1本のディスク障害が起因して大惨事に発展したことが判明しており、復旧作業に勤しんだのですが・・・・・・・アレイを最有効化したところで確認できたのは、ほぼすべてのVMのディスクファイル(VMDKファイル)破損ということで、全面的に仮想化基盤が吹っ飛んでいた現状・・・・・・と。

幸い、AVVIの評価用に使っていたBackup Execが評価期間中だったこともあり、これを使用してリストアを行ないました。エラーは出力されたものの、何とか復旧。

こうしてBLOGを公開することも出来ました・・・が、いくつかのデータがロストしてしまい、それはそれでどうか・・と言う状態ではあるんですが^^;

また、今回のSCSIバス障害に伴い、アレイの組み換えも以下のとおり実施しました。これでそろそろ安定稼働は見込めるだろうか・・・・うーん。

Tags:

No responses yet

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください

PAGE TOP