●米国で社会問題化しているスパム・メール(迷惑メール)。この急増するスパムを自動的に排除する取り組みに,米Microsoftが本腰を入れ始めた。
●11月のCOMDEX 2003でBill Gates会長が「SmartScreenテクノロジ」を披露。既にOutlook 2003に実装したほか,2004年春にはExchange Server 2003向けプラグインを提供する。
●Microsoft以外の各社も新しい機械学習技術を使ったスパム対策製品を出している。これまでより高い精度でスパム判定が可能になっている。

図1●マイクロソフトが開発した「SmartScreenテクノロジ」の概要
マイクロソフトのスパム・メール防止技術「SmartScreenテクノロジ」は,全世界に累計3億人いるという無料電子メール・サービスHotmailで収集されたスパム・メールをマイクロソフトが分析することで開発されている。
表1●サーバーでスパム対策に使えるソフト
図2●主なスパム対策ソフトの種類(イメージ)
スパム対策ソフトには,主に3つの種類の製品がある。基本的なものは,大勢のユーザーによってスパム送信者のブラックリストを作成して,そのリストをもとにスパムを防ぐ「ブラックリスト方式」と,ユーザーが判断したスパム・メールと非スパム・メールのデータをもとに,スパムの傾向を学習して防ぐ「機械学習方式」である。マイクロソフトの「SmartScreen方式」も機械学習方式といえるが,マイクロソフトから「スパム定義ファイル」が供給される点が他と異なっている。
表2●クライアントでスパム対策に使えるソフト

 受信者の同意なしに無理矢理送られてくる商業用電子メール,いわゆるスパム・メールが米国で社会問題化している。スパム・メールが増えすぎて,ユーザーの日常業務に支障をきたすまでになってきた。連邦議会が2003年12月に迷惑メール対策(CAN-SPAM)法を可決するなど,国を挙げてスパム対策に取り組み始めている。日本では,米国ほどの深刻さはないものの,スパム・メールに苦しむユーザーは確実に増えている。

Hotmailで収集したスパム情報を配布

 これに対し,米Microsoftは11月に開催されたCOMDEX 2003で,Bill Gates会長が同社のスパム対策技術「SmartScreenテクノロジ」(図1[拡大表示])を披露,スパム対策に本腰を入れていることをアピールした。SmartScreenテクノロジとは,スパム・メールと正常なメールを自動的に判別するフィルタ技術の総称である。

 Microsoftの提供する無料メール・サービスHotmailには,ユーザーがスパム・メールを受け取るとサーバーに通知する機能がある。この機能で集めた500万通以上のスパム・メールの情報を「サポート・ベクター・マシン方式」という言語分析手法で分析し,そのパターンをルールとして配布するというものである。

 このルールを利用できる環境として,現時点ではMSN 8やHotmailのほかOutlook 2003がある。また2004年春に,ソフトウエア・アシュアランス契約を結んでいるExchange Server 2003ユーザーも,「Exchange Intelligent Message Filter」という追加ソフトで利用可能になる。

 これらのソフトを使っているユーザーがメールを受信すると,メールのヘッダーや本文に含まれる単語や単語同士の係り受けを,配布されたルールで分析して,スパムの要素がどのくらい含まれているかを判定する。あらかじめ設定したスパムのレベルに達していると,自動的に「迷惑メール」フォルダに振り分けたり削除したりする。

 設定できるレベルはソフトにより異なる。例えばOutlook 2003では,明らかな迷惑メールのみ除外対象とする[低],場合によっては通常メールも対象となる可能性のある[高],事前に指定した送付先やあて先以外のメールは除外する[[セーフリスト]のみ]の3段階が設定できる。

新手の対策技術を使った製品が増加

 スパム急増の流れを受けて,既にセキュリティ・ソフト・ベンダーなどからもスパム対策ソフトが続々と登場している(表1[拡大表示],表2[拡大表示])。特徴は「ブラックリスト」と呼ぶ方式に加え,「機械学習」という精度の高い方式を採用するものが増えてきたことである(図2[拡大表示])。

 従来の製品に多かったブラックリスト方式は,インターネット上に存在する「スパム送信者が使用するメール・サーバーのIPアドレス・リスト(ブラックリスト)」を利用して,スパムを排除する。メール・サーバーのIPアドレスでブロックするため,「送信者や送信IPアドレスのなりすまし」に強い。

 その半面,一般ユーザーも利用するメール・サーバーがブラックリストに登録されると,分別精度が下がるという欠点がある。今回編集部がブラックリスト方式を試しているときにも,「@nifty」などのメール・サーバーが登録され,多くの正常なメールが「スパム」と判定されることがあった。

 そこで最近注目されているのが機械学習方式である。これは,過去に受け取ったスパム・メールのヘッダーや本文の内容を分析して,スパム・メールの傾向をつかむ手法である。ユーザーが受信メールに関して,スパム・メールか否かの判定を何度かしてやると,プログラムが次第に正確な判定基準を作成・洗練していく。

 分析手法としてはPaul Graham氏がインターネット上で公開した「ベイジアン・フィルタ方式」を採用するソフトが多い。ベイジアン・フィルタ方式では,過去のメールから「スパム・メールに含まれる単語」と「正常なメールに含まれる単語」を統計的に分析し,各単語について「スパム度」と「非スパム度」を示す点数を付ける。そして,新しく届いたメールについて,どちらの点数が高くなるかで,スパムかどうかを判別する。

 ベイジアン・フィルタは,過去に分析したメール数が多いほど,新しいメールの判別精度が高くなる。例えば,「Mozilla 1.5」を使って1週間で531通のメール(うち159通がスパム)を学習させてみたところ,その後に受信した194通のメール(うちスパムが108通)に対してスパム・メールの90.7%を正しく認識した。逆に,正常なメールをスパムと誤判別した例は無かった。

メール・ソフトと分離して使う形態も 

 スパム対策ソフトは,標準やプラグインとしてエンドユーザーのメール・ソフトに組み込まれるものばかりではない。例えば,クライアント向けのものでも,メール・ソフトと分離してプロキシ・サーバーとして稼働するタイプもある。

 これは,クライアントPCに常駐して,メール・ソフトが受信する前に割り込んで,メールをあらかじめチェックするものだ。スパム・メールを受信すると,メールのヘッダーや件名に,スパムであることを示す情報を付加する。スパムを自動的に分類するには,メール・ソフト側でヘッダーや件名情報をもとにメールをフォルダに分類するルールを作成する必要がある。サーバー用のスパム対策ソフトでは,この形がむしろ標準である。

 プロキシ・サーバー型の利点は,一体型と異なり,ユーザーが使用するメール・クライアントを選ばないという点である。ただし,一体型であれば,ユーザーが受信メールについてスパムか否かプログラムに学習させる作業を,メール・ソフト上で実行できる。それに対してプロキシ・サーバー型ではコンソール画面を呼び出す必要があるので使い勝手の面ではやや劣る。

(中田 敦=anakada@nikkeibp.co.jp)