長い間システム管理をやっていると勘みたいなものがついてきます。例えばHDDの書き込み音パターンからメモリスワップ発生を検知しレスポンス低下を予知する、サーバに触って感じた温度でCPUが高温になっていることを検知し何らかのプロセスが暴走していることを発見する、スイッチ(スイッチングHUB)のLEDの光り方からネットワーク帯域使用率が異常に高いことを検知しワームやウィルスに感染しているサーバがあることを発見する、などといった感じです。そこで今回はそんな勘の中でも個人的によい思い出がほとんどないメール系サービスのことを書いてみたいと思います。
メール系サービスのトラブルと言えば
安定稼動していたメール系サービスで異常が起きた場合、経験上DNSまわりのトラブルであることが非常に多かったです。無論これは環境によってそうでない場合ももちろんあるでしょうが、私の知り合いに聞いても共感してくださる方が非常に多かったので、どこも似た状況なのかもしれません。
DNSまわりのトラブルにもいろいろあります。例えば以下のような感じです。
- DNSサーバが全て落ちていた。
- 管理下のDNSサーバは生きていたが、上位DNSが落ちていた。
- ファイアウォールルールの変更でDNSへのアクセスができなくなった。
- MXレコード書き間違い。
- プライマリDNSサーバが落ちていた。ただしセカンダリDNSは生きていた。
メール系サービスでのDNS以外のトラブル原因
ついでに安定稼動していたメール系サービスのトラブルで、DNS以外の原因でよくあるものを書いてみます。
- HDD容量が満杯
- ファイアウォール設定変更ミス
- スパム大量受信によるレスポンス低下
今後のご参考になれば幸いです。