米Googleの検索品質技術担当副社長,Udi Manber氏は同社の公式ブログへの投稿で米国時間2008年5月20日,同社がWeb検索サービスで採用している順位決定アルゴリズムの概要などを紹介した。これまでWeb検索サービス関連技術はほとんど公表していなかったが,今後少しずつ情報を開示していくという。

 同社の検索技術については,Webページ重要度の基準にする「PageRank」が比較的よく知られている。PageRankを決めるアルゴリズムは,創業者のLarry Page氏とSergey Brin氏が開発した。同アルゴリズムは現在も使われているが,検索システムの構成要素に過ぎないという。

 そのほかには,(1)構文解析や同義語,誤記などを処理する言語モデル,(2)問い合わせ処理を担当するクエリー・モデル,(3)適切な作成日時のWebページを選び出す時間モデル,(4)ユーザーに合わせて検索動作を調整するパーソナライズド・モデルといったモジュールが存在する。

 同社には検索結果品質の評価チームもあり,自動的/定期的な検索結果の検証と,新アルゴリズムの試験を担当している。同社は常にアルゴリズムに改良を施しており,2007年は450件以上の改良を実施したという。また世界各地の言語への対応や,検索エンジン・スパム対策の検討などにも取り組んでいる。

[Manber氏の投稿記事]