米Twitterは、同社が運営するミニブログサービス「Twitter」の検索アーキテクチャを変更していたことを米国時間2010年10月6日に明かした。数週間前より新たなアーキテクチャに移行しており、1秒当たりのツイート(コメント)処理性能が約50倍に向上したという。

 Twitterが最近まで利用していたリアルタイム検索エンジンは、同社が2008年に買収した米Summizeの独自技術をベースにしていたが、その古いMySQLベースのシステムは拡張が困難になっていた。そこで同社は約半年前に、リレーショナルデータベースではなく転置インデックスを用いた新たな検索アーキテクチャを開発することにした。Javaで記述された検索エンジン「Lucene」に一部手を加えて採用した。

 新たな検索アーキテクチャは、毎秒1000件以上のコメントを処理する。1秒当たりのクエリー処理件数は1万2000件以上で、1日当たりの処理能力は10億クエリーを超える。また、コメントが投稿されてから検索可能になるまでに要する時間(インデックス化レイテンシー)は10秒に満たない。Twitterでは今後数年間、このシステムを使用する予定。

 同社のMichael Busch氏は、「(アーキテクチャ刷新の)最も重要な目的であり、最も難しい課題は、円滑にアーキテクチャを移行することだった。作業が成功したとすれば、ユーザーのほとんどは変化に気付いていないだろう」と述べている。

[発表資料へ]