IT業界で常に話題の中心となっている企業の一つが米グーグルである。クラウド・コンピューティングや携帯電話プラットフォーム「Android」といったIT分野での活動のほか,「Googleブック図書館プロジェクト」や「Googleストリートビュー」といった取り組みで社会全体への影響力も増している。ただ,その力の源泉は,同社の原点であるWeb検索エンジンであることに今も変わりはない。

 では一体グーグルの検索エンジンの何がすごいのか。その疑問に対し,これまでになく明確に答えてくれるのがこの本である。

 Webページの検索技術は,リンク構造に固有な情報を活用して検索結果の品質を高める「リンク解析」が1988年に登場してから,大きく発展し始めたという。その10年後の1998年,スタンフォード大学の博士課程にいたセルゲイ・ブリン氏とラリー・ページ氏は,独自のリンク解析アルゴリズムを実装した検索エンジン・サービス「Google」を立ち上げた。

 このリンク解析アルゴリズムは「PageRank」として知られ,その原理は「Webページは,他の重要なページからリンクされていれば重要だ」というものだ。これはPageRankの考え方を表す説明として,様々な本などでよく使われている。本書は,この説明にとどまらず,数学の力をもってPageRankの本質を明らかにする。

 各Webページがどの程度重要かというPageRankは次の式を使って求められるという:
   πT=πTG

 πTがPageRankの値(PageRankベクトル),Gは「Google行列」というWebサーファーの振る舞いを示す行列で,ブリン氏とページ氏が発明したものだ。この方程式を解けば,Webページの重要度,すなわち検索結果の順位が決まる。

 このGoogle行列は,様々な要素を含んでいる。まず,PageRankの基本原理である他のページへのリンクを示す要素。PDFや画像のページといった他へのリンクがない「ぶら下がりノード」や,サーファーがリンクをたどるのに飽きてブラウザのURL欄で行き先を指定したり,戻りボタンを使ったりした場合のモデル化といった要素なども含まれている。本書では,こうしたWebサーファーの振る舞いをうまく取り入れたPageRankの考え方を丁寧に説明していく。

 この本の内容を完全に理解するには,大学の理工系の1~2年で学ぶ線形代数の知識が必要だが,一般の読者にも読み進められるように,いろいろ工夫されている。その一つに,ふんだんに盛り込まれた欄外コラムがある。検索エンジン最適化(SEO),「Google爆弾」,ブログを検索対象にすべきかどうか,といった興味深いテーマが約90も取り上げられている。

Google PageRankの数理

Google PageRankの数理
エイミー・N・ラングヴィル/カール・D・マイヤー著
共立出版発行
4725円(税込)