[画像のクリックで拡大表示]

 「発足に賛成される方は拍手をお願いします」。発起人であるサードウェアの久保元治社長(写真)がこう呼びかけると会場から拍手が起こった。オープンソースのスパム・フィルタ「SpamAssassin」のユーザー会である「日本SpamAssassinユーザ会」は2006年3月18日,東京で開催された「オープンソースカンファレンス2006 Tokyo/Spring」で発足ミーティングを開催し,正式に発足した(参考記事)。

 ミーティングではまず,久保氏がサードウェアで行ったSpamAssassinの日本語化の試みについて説明した(参考記事)。SpamAssassinは日本語のメールが考慮されておらず,そのまま日本で使おうとすると様々な問題がある。まず,日本語のスパム・メールの検出能力が低い。特に「スパムでないメールをスパムと判定してしまう」というフォールス・ネガティブが多いため,大切なメールがスパムと判別されてしまう危険性がある。また,スパム検出ルールに使うキーワードを日本語そのままでは登録できず,ルールのメンテナンスが大変という問題もある。

 日本語化ではまず,メールの文章を単語ごとに区切る「分かち書き」の処理を追加した。日本語は英語とは異なり,単語と単語の間がスペースで区切られていない。このため,そのままでは単語の区切りがわからず,日本語としての処理ができないからである。分かち書きの処理にはオープンソース・ソフトである「kakasi」あるいは「MeCab」を利用する。ほかには,ベイズ・フィルタの処理を日本語に合わせて一部変更したり,ルールをUTF-8で直接記述できるようにした。こうした改良により,日本語スパムの判別力が劇的に向上し,ルールのメンテナンスも楽になった。

 ただ,日本語パッチの重要性は海外の開発者にはなかなか理解してもらえないという。「なぜ分かち書きが必要なのかわからないと言われる」(久保氏)。そこで,ユーザー会としては,本家の開発チームに日本語パッチを採用してもらうことが当初の大きな課題になる。久保社長によると,本家の開発チームは,各国語のスパム検出ルールを整備したいという悩みは常を抱えているという。ただ,本家だけでできることには限界がある。そこでユーザー会との連携が重要になってくるわけである。「日本語のことははっきり言って日本人にしかわからない」(同氏)。ただし,この課題はあくまで過渡的なもの。長期的には,SpamAssassinを日本語で安心して使えるような環境を整えていきたいという。

 ユーザー会の活動は大きく四つ。まず「SpamAssassinの情報の収集/公開」。このためにWebサイトを早速用意した。久保氏がミーティングでWebマスターを募ったところ,早速立候補があった。二つ目は「日本語対応のための共同開発」。久保氏は「私はオブジェクト指向的なPerlが書けないので,これ以上はつらい。Perlが得意な人にぜひ手伝ってもらいたい」と語る。三つ目は「ユーザー会オリジナルの日本語スパム対応ルール・セットの提供」。参加者が自分が使っているルールを持ち寄り,品評会のようなことを行いたいという。最後が「コミュニケーションやイベントの企画」である。将来の夢としては「ユーザー会監修のハンドブックを出版したい」(同氏)という。

 ミーティングの最後では,約20人の参加者がそれぞれ自己紹介を行った。実際にメール・サーバーの管理をしていてスパム・メールに苦しめられているという話が多く,スパム・メール問題の深刻さが改めてうかがえた。