シンプルな情報管理に行き着いた

 以上さまざまな検索技術を紹介してきたが,技術的に高度なものが常に便利だとは限らない。むしろ筆者が主に使っているのは,技術的にシンプルなものである。筆者の場合,時間の経過とともに,利用する検索技術はハイテクからローテクへと後退している。

 筆者は今から6年前の1997年,インデックスを利用するNamazuを開発した。シーケンシャルな検索手法と比べれば,技術的には高度,つまりハイテクである。しかし今では,ほとんどNamazuを使っていない。もっとローテクな手法の方が役に立っている。これはNamazuが無用ということを意味するのではない。筆者の個人的な用途にはインデックスは不要だった,ということにすぎない。

 そもそもNamazuは,筆者の手元に集めた情報を効果的に検索するために開発した。筆者は当時,インターネットに熱中してロック音楽関連の情報をあさっており,集めた情報もかなりの量になっていた。

 Namazuを公開すると,興味を持ってくれる人が予想以上に集まった。徐々に中小規模のサイトの検索システムとして使われるようになり始めた。その一方で,たまったメールの検索のような個人用途の検索システムとして使いたいという人も現われるようになった。当時,多くの技術系のメーリング・リストに参加して情報収集と情報交換をしていた筆者は,メーリング・リストのアーカイブを快適に検索できたら便利だと思い,さっそく導入して手元で使い始めた。

 しかし時間が経つにつれて,メーリング・リストの情報源としての価値が急激に低下し始めた。Webを検索すれば多くの情報が得られるようになったため,わざわざメーリング・リストのアーカイブを検索することは稀になった。検索が稀であれば,1回の検索に数十秒かかってもそうは気にならない。こうして結局,手元のメールの検索にNamazuを使うのはやめてしまった。

 一方,数年前までは,個人的なメモをトピックごとのファイルに分けて,検索にNamazuを利用するという方法で情報を管理していた。しかしそのうち,トピックの分類に頭を悩ませるようになった。結局あまりいい方法ではないと気づき,これもやめてしまった。

検索技術は適材適所が肝心

リスト●Emacsでの検索結果の表示
「Ruby:」というキーワードで検索した結果の一部である。

 現在では,ChangeLogと呼ばれる形式で一つのテキスト・ファイルにメモを取る「ChangeLogメモ」を実施している。エディタのショートカット・キー一つで手軽にメモを取れるため,4年間順調に続いている。

 このメモは4年間で5万行,1.7Mバイト程度の大きさになった。このくらいであれば,エディタの検索機能でも十分な速度で検索できる。Emacsなら「M-x occur」という機能を使って,検索結果を一覧表示して目的の位置へ容易に移動できる(リスト[拡大表示])。またChangeLogメモは単なるテキスト・ファイルなので,エディタですばやくメモを取れるというメリットがある。ファイル形式の互換性を心配する必要もない。

 筆者の場合,シンプルな情報管理の方法へ移行したことによって実質的な利便性は高まっている。シンプルな手法で済むところに大掛かりな手法を持ち込む必要はない,というのが教訓である。検索技術は適材適所が肝要なのだ。

 ただ,現状に不満がないわけではない。ChangeLogメモは単なるテキストファイルであるため,図や写真を貼り付けられないという大きな欠点がある。さらに単に時系列にメモが並んでいるだけであり,情報を組織化するという点ではまったく物足りない。GoogleがWebの検索にもたらしたのと同様に個人の情報管理を革新できないか,今後も検索システムの開発に取り組みながら考えていきたい。本記事を読んで検索技術に興味を持ち,もっと便利なシステムを作ろうと思って頂ければ嬉しい。

高林 哲 Satoru Takabayashi

産業技術総合研究所研究員
1997年に全文検索システム「Namazu」を開発。以来,多数のフリー・ソフトウェアを開発している。研究員という肩書きの割には,「論文の数 << 雑誌記事の数 ≒ フリー・ソフトウェアの数」という状況が続いている。http://namazu.org/~satoru/