• BPnet
  • ビジネス
  • IT
  • テクノロジー
  • 医療
  • 建設・不動産
  • TRENDY
  • WOMAN
  • ショッピング
  • 転職
  • ナショジオ
  • 日経電子版
  • PR

  • PR

  • PR

  • PR

  • PR

ニュース

未踏ソフトで開発したグーグル八分発見システム,「パソコンの空き時間を提供してくれる協力者募集」

高橋 信頼=ITpro 2008/05/28 ITpro
IPAX2008で展示したグーグル八分のデモと,吉本敏洋氏の著書「グーグル八分とは何か」(九天社刊)
IPAX2008で展示したグーグル八分のデモと,吉本敏洋氏の著書「グーグル八分とは何か」(九天社刊)
[画像のクリックで拡大表示]

 「パソコンの空き時間を提供してくれる協力者を募集しています」---イベントIPAX2008で,「グーグル八分発見システム」がデモを展示した。「グーグル八分発見システム」は独立行政法人 情報処理推進機構(IPA)の未踏ソフトウェア創造事業に採択され,吉本敏洋氏が開発した,Googleの検索結果に表示されないページを発見するシステム。

 IPAX2008はIPAが2008年5月27日から28日にかけて開催したイベント。「グーグル八分発見システム」はGoogle,Yahoo!,百度の検索結果を比較することで,検索結果に表示されなかったり,極端に順位が低下したページをリストアップする。

 検索エンジンは,名誉毀損や著作権侵害などを理由にした申し立てにより,あるページを検索結果に表示されないようにしたり,表示順位を極端に低くしたりすることがある。このような状態が“グーグル八分”と呼ばれることがある。吉本敏洋氏は消費者問題に関するサイト「悪徳商法マニアックス」を運営しているが,実際にGoogleの検索結果に表示されなくなっている。

 ある検索エンジンでは表示されるのに,別の検索エンジンでは表示されないページがあれば,そのページは検索結果から削除されている可能性が高い。「グーグル八分発見システム」はこのようなページを発見するシステムである。

 削除されたページの発見は,協力者のパソコンの上で動作するプログラムによる分散コンピューティングで行われる。協力する方法は,グーグル八分発見システムのサイトで配布されているクライアント・ソフトウエアをインストールするだけだ。インターネットに接続されていれば,空き時間に処理を行い,結果をグーグル八分発見システムのサーバーにアップロードする。サーバー側プログラムはRuby on Railsを使用している。クライアント側の対応OSはWindows,対応ブラウザはIEおよびFirefox。

 クライアント・ソフトウエアは2008年2月23日にバージョン1.0が正式公開された。2008年5月28日17時時点で37069URLをチェックし,表示されない43URLを発見,グーグル八分公式サイトで公開している。吉本氏は「サーバーをAmazon Web Serviceに移行し,多数のクライアントからの接続に耐えられるようになった。多くの方に協力してほしい」と話している。

◎関連リンク
∞Eyes - グーグル八分発見システム 公式サイト

あなたにお薦め

連載新着

連載目次を見る

今のおすすめ記事

  • 【東京五輪のワクワクIT】

    テストは20万時間、東京五輪ITシステムの舞台裏

     あと3年に迫った2020年の東京オリンピック・パラリンピック。「絶対に遅れることはできないし、稼働後の不具合も許されない」という五輪向けのシステムをどう構築しているのか。欧州Atosで東京五輪向けシステム構築プロジェクトを率いるセイレッシュ・チョーハン氏にプロジェクトマネジメントのポイントを聞いた…

ITpro SPECIALPR

What’s New!

経営

アプリケーション/DB/ミドルウエア

クラウド

運用管理

設計/開発

サーバー/ストレージ

クライアント/OA機器

ネットワーク/通信サービス

セキュリティ

もっと見る