(Mark Joseph Edwards)

 私は以前にブラックリスト・サービスを使ったスパム・フィルタに関する記事 「スパムを減らすブラックリスト・サービス(前編中編後編)」を書いて議論してきたことがある。その後,私はスパム・フィルタの仕組みをテストしてみて,いくつかの知見を得たのでそれを紹介しよう。

 ブラックリスト・サービスは,ユーザーが受信トレイに受け取るはずの電子メールの中から"招かれざる(スパム)メール"を減らすのに役立つ,ということになっている。しかし,そのサービスを利用することで,逆にメールの処理性能にオーバーヘッドを招いてしまうのだ。ブラックリスト・フィルタは,DNSサーバーへの参照をしている。DNSの参照ごとにネットワーク上の遅延時間を伴うため,メッセージ1つ当たりに存在するDNSの参照数に応じて,処理時間は増大する。ブラックリスト・サービスを使い過ぎると,しばしばクエリーへの応答が1秒,あるいはそれ以上かかってしまうこともある。

 従って,あなたが使うメール・フィルタの作り方いかんで,メールの処理性能は変わってくる。単純なフィルタを使った後ならば,ブラックリストへのクエリーの実行にかかる無駄な時間を減らせるかもしれない。例えば,ホワイトリストを使ったり,検索条件もいろいろ併用したりするとよい。例えば,外国語,送信元の国,いろいろな文字の組み合わせ,禁止された言葉のリスト,標準的でない形式のメッセージ,悪質なHTML,悪質なスクリプト,ファイルへのアクセスなどである。

 これらの単純なタイプのフィルタは,ブラックリスト提供会社のようなアウトソース・サービスとの通信に依存したフィルタよりも,処理速度が高い。しかも,典型的なBayesianフィルタリング・システムよりも処理性能が高い。スパム対象のデータベースを蓄積していくタイプのもので,そのデータベースも時間とともにどんどん増えていく。ブラックリスト・サービスの利用の有無にかかわらず,あなたがBayesianフィルタリング・システムを使うかどうかは,あなたのサーバーが処理するメールがどの程度多いか,どんな種類の処理性能が得意かなどに依存している。それは,あなたのネットワークとブラックリスト・サービス提供会社の間にあるネットワーク遅延時間の総計を比較して決めることだ。

 他にもブラックリスト・サービスは,昼間よりも夜の方が,DNSクエリーの反応が速いことが分かった(これは合衆国の場合だ)。夜にメールを受け取る人よりも,昼間にメールを受け取る人の方が多いという疑いのない現象を示している。サーバー・ベースのフィルタ・ソリューションは,恐らくサーバーとの接続性のよさが命である。しかし,個々のコンピュータ上でデスクトップ・ベースのメール・フィルタリング・ソリューションを稼働させているユーザーが何百万もある中で,昼間にブラックリスト・サービスをどっぷり使うことに固執する理由はあるだろうか。

 もし,あなたのメール・フィルタリング・ソリューションにおいて,様々なフィルタリングの方式を試してみて,優先度や実行順位を最適化させたならば,スパムを外で食い止められて,きっと状況は改善するだろう。