最近のLinuxカーネルは安定しておりシステム停止なんてことはめったにありませんが,もし,システム運用中にいきなり停止したなら,かなりあせるものです。とりあえず,再起動し,問題なく稼働していたとしても,その原因をつきとめないと不安で夜も眠れません。

 今回は,カーネル・パニック時のダンプ解析をして,その原因を調べてみましょう。

それでは前回に引き続き,若手エンジニアのタカハシくんと,先輩のスズキさんにご登場いただきます。

タ: う~ん,nfsの設定は難しい。再起動させて,あれ?もう一度,えい。あっ!
ス: どうかしたの?
タ: キーボードからの入力を受け付けてもらえなくなりました。
ス: ネットワークは正常だよね。
タ: はい。確認しました。
ス: あと,サーバーのコンソールを見てみた?
タ: 確認してみます。

(サーバールームへ急ぐ高橋君)

タ: 鈴木さん,サーバーは再起動していました。ログを確認したところ,私の操作の直後に落ちたようです。
ス: なぜ,サーバーが落ちたかは分かった?
タ: 落ちるときにカーネルが何かメッセージを残しているようですが,私にはどうも理解できません。
ス: 確かに,そのメッセージは,カーネル開発者向けのダイイングメッセージのようなものだからね。
ス: そのサーバーは,ダンプを採取する設定にしてあるので,ダンプから解析できるかもしれないな。
タ: すみません,ダンプって何ですか?