MSCS(マイクロソフト・クラスタ・サービス)環境でNIC(ネットワーク・インターフェース・カード)のハードウエア障害が発生しました。その際,クラスタ・グループが障害ノードよりスタンバイ・ノードへフェイル・オーバーすると期待していたのですが,実際にはクラスタ・グループ全体が障害によりオフラインになってしまいました。 管理ツールであるクラスタ・アドミニストレータによりこのときの状態を確認すると,両ノードのNICのアイコンに「×」マークが表示されていました。通信障害が発生したことは示していましたが,どちらが障害ノードなのかは判明しない表示でした。NICのハードウエア障害が発生した際には,当該ノードだけが障害とならず,クラスタ・グループ全体が障害となってしまうのでしょうか?
クラスタを構成するネットワークでICMP(インターネット・コントロール・メッセージ・プロトコル)が利用できないとこの現象が発生します。企業によってはネットワーク管理上のポリシーにより,ICMPをルーターなどで禁止していることがあります。具体的には,MCSCを構成するコンピュータからその外のホストに対してping(ICMP Echo Request)を打っても,正しく応答(ICMP Echo Reply)が返ってこない場合が当てはまります。 MSCSはWindows Serverの上位版が標準で備えるフェイル・オーバー・クラスタ機能です。複数のマシンをセットにしてクラスタ・グループを構成し,ハードウエアやOS,ソフトウエアのいずれかに障害が生じた場合,障害が生じたマシンの処理を別のマシンに移してサービスを継続させます。これがフェイル・オーバーと呼ばれる処理です。クラスタ・グループを構成する個々のコンピュータをノードと呼びます。 本来は,NICの障害が発生した際にも正しく障害が認識され,フェイル・オーバーします。しかしながら,ICMPを利用できなくしたネットワーク環境では,ご質問のように当該ノードだけが障害とならず,クラスタ・グループ全体が障害となります。これは,どの部分でネットワーク障害が発生したのか,クラスタ・メンバーだけでは判断できないためです。
pingを通さないとき発生
MSCSクラスタ・メンバーは約1.2秒ごとに,互いに3343/udpのユニキャストを送信しています(Windows Server 2003の場合,条件によりマルチキャストを使用します。詳しくはマイクロソフトのサポート技術情報の307962を参照してください)。 相手ノードからの3343/udpパケットが3回(two heartbeat periods)失敗すると,ネットワーク障害が発生したと判断します。 図1でノード1がノード2からの3343/udpパケットの未到達を検出した場合は以下のいずれかの個所に障害が発生したと考えられます。
(1)自ノードのNIC ただし,これらのどこかに問題があることまでは分かりますが,それ以上のことは分かりません。 障害個所をより正確に特定するにはどうしたらよいでしょうか? これには,MSCS以外のホスト,例えばMSCSを構成するコンピュータが所属するサブネットのデフォルト・ゲートウエイ(ルーター)と通信可能かどうかを調べる方法があります。
障害個所の特定にICMPを利用 その一方,図1で両ノードがともにルーターと通信不能であれば,ノードやそこに接続したケーブルの障害というよりは,ネットワーク全体に問題がある可能性が高いことを示唆しています。例えばイーサネット・スイッチの障害などがあり得るでしょう。 実はMSCSは,このような診断を障害時に行っています。具体的にはクラスタ・メンバー以外のホストとして,
・各ノードの経路表上で障害ネットワークに存在するdestination host(通常はそのサブネットのゲートウエイ) をリストアップし,ICMP Echo Request に対してReplyを返してくるかどうかにより,障害が生じた場所を判断しようとします。 そのため,該当するホスト(多くの場合ルーターを含みます)がICMP Echo Replyを返さない場合,ネットワーク全体の障害と判断してしまい,障害ノードの判定に失敗することになります。 このような場合には,MSCSのログであるcluster.logというファイルに図2のような記録が残ります。この中の[NM]はNode Managerからのログであることを示しています。
このログを見ると,pingを送出したNICと,応答すべきホストのIPアドレスが分かります。可能でしたらルーターなどの設定を見直してそのホストに対してpingが通るようにすると今回のような原因でフェイル・オーバーに失敗する問題は解決します。 サポート技術情報242600「2ノードのサーバークラスタにおけるネットワーク障害の検出と回復」も参考にしてください。 小森 博司
日本ヒューレット・パッカード テクノロジーサービス統括本部
サポートデリバリー本部 エンタープライズソリューション本部 ソフトウェアミドルリモートサポート部 シニアエンジニア |
MSCSでネットワーク障害時に期待通りフェイル・オーバーしない
あなたにお薦め
今日のピックアップ
-
「生成AI vs 生成AI」の幕開け、有識者に聞いたサイバー防衛の肝
-
組織で肩身が狭いと悩む50代、退職をどう迎えるかに意識を変える
-
NISTのセキュリティーフレームワークが大幅改訂、「統治」の重要性を強調
-
ITベンダー志望者ほど高いコンサルとの併願率、IT大手の採用活動にも影響必至
-
国営公園の施設予約サイトで個人情報流出か、改修中のテスト環境に不正アクセス
-
使うともう戻れない10Gbps高速通信、費用以上の価値と不要になるもの
-
企業向けIT大手20社の売上高ランキング、2023年の1位はマイクロソフト
-
「ラズパイ5」では電源に注意、純正以外の電源アダプターでは制限あり
-
日本IBMも地銀勘定系の基盤を共通化へ、複数のシステム共同化陣営を横断
-
目指すは革新的医薬品の提供、中外製薬奥田社長が語るDXの手応え
-
ドライバーの待ち時間を減らす日清食品、物流2024年問題で求められる荷主の役割
-
「成長機会」を与える人事戦略、早期選抜とポストオフ運用が基本
注目記事
おすすめのセミナー
-
業務改革プロジェクトリーダー養成講座【第15期】
3日間の集中講義とワークショップで、事務改善と業務改革に必要な知識と手法が実践で即使えるノウハウ...
-
「仮説立案」実践講座
例えば「必要な人材育成ができていない」といった課題に、あなたならどう取り組みますか? このセミナ...
-
CIO養成講座 【第35期】
業種を問わず活用できる内容、また、幅広い年代・様々なキャリアを持つ男女ビジネスパーソンが参加し、...
-
改革リーダーのコミュニケーション術
プロジェクトを成功に導くために改革リーダーが持つべき3つのコミュニケーションスキル—「伝える」「...
-
パワポ資料が見違える「ビジネス図解」4つのセオリー
インフォグラフィックスとは、形のない情報やデータなど伝えたいことを分かりやすい形で表現する技法で...
-
オンライン版「なぜなぜ分析」演習付きセミナー実践編
このセミナーでは「抜け・漏れ」と「論理的飛躍」の無い再発防止策を推進できる現場に必須の人材を育成...
-
問題解決のためのデータ分析活用入門
例えば「必要な人材育成ができていない」といった課題に、あなたならどう取り組みますか? このセミナ...
-
業務改革プロジェクトリーダー養成講座【第16期】
3日間の集中講義とワークショップで、事務改善と業務改革に必要な知識と手法が実践で即使えるノウハウ...
注目のイベント
-
金融デジタル戦略会議
2024年3月22日(金)10:20~15:55(予定)
-
働き方改革・HR/人事DX FORUM 2024
2024年3月25日(月)13:00-17:30(予定)
-
RE:Work Lab「ハタラク」を変えよう
2024年3月25日 15:55~16:55
-
AIトレンドフォーラム2024 ~ 生成AIの台頭、進化するAIとビジネスの未来
2024年3月26日(火)13:00~17:25
-
ITイノベーターズ会議
2024年 3月 27日 (水)13:00~17:30
-
もっと話そう、わたしたちのカラダのこと、生き方のこと
-
データサイエンティスト・ジャパン 2024
2024年3月29日(金) 予定
-
若手の離職防止につながる、マネジメント・チームづくりのポイント
2024 年 4 月 10 日(水) 10:00~12:30
-
ITモダナイゼーションSummit2024
2024年4月10日(水)、11日(木)
-
【4月11日】最新HCIの特徴やメリットを学ぶ、参加者にはもれなくプレゼント進呈
2024年4月11日(木)
おすすめの書籍
-
対立・抵抗を解消し合意に導く 改革リーダーのコミュニケーション術
本書は、改革リーダーに必須のコミュニケーション術を3つのスキルの観点からまとめ上げたものです。今...
-
もっと絞れる AWSコスト超削減術
本書ではコスト課題を解決するため、AWSコストを最適化し、テクニックによって削減する具体策を紹介...
-
優秀な人材が求める3つのこと 退職を前提とした組織運営と人材マネジメント
「学生に人気のコンサルであっても、大手企業であっても、せっかく獲得した人材が数年で辞めてしまう...
-
Web3の未解決問題
ブロックチェーン技術を主軸とするWeb3の技術について、現在の社会制度との摩擦と、その先にある新...
-
ロボット未来予測2033
ロボットの用途・市場はどう拡大していくのか。AI実装でロボットはどこまで進化するのか。技術の進展...
-
DX Ready基幹システム刷新術
国内大手メーカーの基幹系ITエンジニアが見いだした、DXReady化への新手法を解説します。
日経BOOKプラスの新着記事
-
はじめに:『ATTENTION SPAN(アテンション・スパン) デジタル時代の「集中力」の科学』
-
はじめに:『不動産バブル 静かな崩壊』
-
不安解消&準備着々 新社会人が入社前に読んでおきたいflier厳選5冊
-
隈研吾 学生時代に天敵だった先生が、僕を育ててくれた
-
そもそも「分業」とは? 垂直分業・水平分業など種類別特徴
-
「ゆとり教育」の評価は? データで分かった本当の影響
-
組織の中間形態──一部事業部制、事業本部制、カンパニー制
-
大学進学は得なのか? データをもとに経済学で分析した結果
-
はじめに:『もっと絞れる AWSコスト超削減術』
-
はじめに:『優秀な人材が求める3つのこと 退職を前提とした組織運営と人材マネジメント』
日経クロステック Special
What's New
経営
- ERPプロジェクト≫IT人財の必須条件は
- 先進都市対談>生成AIは行政DXの切札?
- 多様化する地域の課題解決に向けて議論
- 地域×テクノロジーでミライを共創する
- 脱レガシー案件≫SIerに必要な人財像は
- 役所文化の変革!奈良市のデジタル市役所
- 3段階で考える、DXで企業力を高める方法
- イノベーションの起爆剤
- 石戸氏に聞く。生成AIを教育で使うには
- 東芝が描くDXの道筋とその先の未来とは
- 次世代技術をもっとリアルに体感したいなら
- 大規模プロジェクトでPMが注意すべき点は
- ファンケルの躍進を支えたMAの徹底活用術
- 有識者に聞く>AIでの日本の勝ち筋とは
- 経営戦略と連動したシステムのあるべき姿
- 大阪・名古屋エリアのDXが注目される理由
- 力点は「未来予測」へ:データ利活用の勘所
- 生成AI活用でSAP BTPの価値が進化
- ServiceNowでDXを加速≫方法は
- SAPプロジェクトの全体像をいかに描くか
- 経営戦略のためのDXとモダナイゼーション