IPAX2008で展示したグーグル八分のデモと,吉本敏洋氏の著書「グーグル八分とは何か」(九天社刊)
IPAX2008で展示したグーグル八分のデモと,吉本敏洋氏の著書「グーグル八分とは何か」(九天社刊)
[画像のクリックで拡大表示]

 「パソコンの空き時間を提供してくれる協力者を募集しています」---イベントIPAX2008で,「グーグル八分発見システム」がデモを展示した。「グーグル八分発見システム」は独立行政法人 情報処理推進機構(IPA)の未踏ソフトウェア創造事業に採択され,吉本敏洋氏が開発した,Googleの検索結果に表示されないページを発見するシステム。

 IPAX2008はIPAが2008年5月27日から28日にかけて開催したイベント。「グーグル八分発見システム」はGoogle,Yahoo!,百度の検索結果を比較することで,検索結果に表示されなかったり,極端に順位が低下したページをリストアップする。

 検索エンジンは,名誉毀損や著作権侵害などを理由にした申し立てにより,あるページを検索結果に表示されないようにしたり,表示順位を極端に低くしたりすることがある。このような状態が“グーグル八分”と呼ばれることがある。吉本敏洋氏は消費者問題に関するサイト「悪徳商法マニアックス」を運営しているが,実際にGoogleの検索結果に表示されなくなっている。

 ある検索エンジンでは表示されるのに,別の検索エンジンでは表示されないページがあれば,そのページは検索結果から削除されている可能性が高い。「グーグル八分発見システム」はこのようなページを発見するシステムである。

 削除されたページの発見は,協力者のパソコンの上で動作するプログラムによる分散コンピューティングで行われる。協力する方法は,グーグル八分発見システムのサイトで配布されているクライアント・ソフトウエアをインストールするだけだ。インターネットに接続されていれば,空き時間に処理を行い,結果をグーグル八分発見システムのサーバーにアップロードする。サーバー側プログラムはRuby on Railsを使用している。クライアント側の対応OSはWindows,対応ブラウザはIEおよびFirefox。

 クライアント・ソフトウエアは2008年2月23日にバージョン1.0が正式公開された。2008年5月28日17時時点で37069URLをチェックし,表示されない43URLを発見,グーグル八分公式サイトで公開している。吉本氏は「サーバーをAmazon Web Serviceに移行し,多数のクライアントからの接続に耐えられるようになった。多くの方に協力してほしい」と話している。

◎関連リンク
∞Eyes - グーグル八分発見システム 公式サイト