米クラウデラは現地時間2013年6月4日、「Hadoop」に蓄積するデータへの対話型検索ができるソフトウエア「Cloudera Search」を発表した。オープンソースソフトウエア(OSS)の検索エンジン「Solr」をベースに機能を強化した。同日からベータ版を公開している。

 Hadoopではデータは「HDFS(Hadoop Distributed File System)」に保存する。HDFSのデータに対するバッチ処理を実行するのが「MapReduce」であり、HDFSのデータに対する低遅延ランダムアクセスを行うためのソフトとして「HBase」がある。クラウデラは、MapReduceやHBase以外の処理手段を増やしており、HDFSのデータへの対話型SQLクエリー処理を行うためのソフトとして2012年秋に「Cloudera Impala」のベータ版を公開している。

 今回発表したCloudera Searchによって、バッチ処理や低遅延ランダムアクセス、対話型SQLクエリー処理に加えて、対話型検索ができるようになった。Cloudera SearchのベースとなっているSolrは、OSSの全文検索エンジンライブラリ「Lucene」に機能を追加したもの。LuceneとHadoopはいずれも、現在はクラウデラに所属するダグ・カッティング氏がオリジナルの開発者である。