携帯電話のカメラで店舗などを撮影すると関連情報がライブビュー映像に映し出される──。

 このような拡張現実(AR)アプリケーションのアイデアは多いが,GPSと電子コンパスだけを使う方法では,誤差が問題になる。ある程度遠方にある空間が対象であれば多少の誤差は気にならないが,目の前にある店舗や商店街となると,わずかな誤差も目立ってくる。表示される情報が誤差のために隣の店舗のものだったりすると,サービスとして成り立たない。

 そこで,ライブビュー映像の中のより正確な位置に情報を表示する別の技術が必要だ。QRコードやマーカー(任意の画像)を画像認識する方法などが提案されている。

 こうした中で,街並みなどの“シーン”を認識してシーンにあった情報を表示するARアプリケーションが登場した。神戸市在住の金村星日氏が独力で開発した「Fallen」だ。無償配布されており,誰でも利用できる。ノート・パソコンに取り付けたWebカメラで商店街の路地を映すと,店の名前などが映し出される(写真1)。

写真1●「Fallen」のデモ画面<br>映像から特徴点を抽出し,この特徴点を使ってシーンを識別できるようにする。写真内の赤い点が特徴点である。
写真1●「Fallen」のデモ画面
映像から特徴点を抽出し,この特徴点を使ってシーンを識別できるようにする。写真内の赤い点が特徴点である。
[画像のクリックで拡大表示]

シーン識別で街並みを認識

 Fallenでは「シーン識別」と呼ぶ独自技術と,あるシーン(風景)の映像に対するタグ付け技術を使って,任意の場所への正確な情報表示を実現した。

 シーン識別はシーン内の特徴的な点や直線,角(コーナー)などを約20の画像処理アルゴリズムによって抽出し,その特徴点や直線などを基にしてシーンを認識する技術。識別させたいシーンは,事前にWebカメラで撮影し,Fallenのシーン学習機能で“学習”させておく。

 シーン学習機能では,学習した画像に関連情報のテキストを張り付けられる。学習したシーンとタグ付けされた情報は,ローカル・ディスクの「シーンDB(データベース)」に格納される。さらに,リクルートのクーポン情報サービス「ホットペッパー」とのマッシュアップ機能を備えている。

 シーンDBの作成はやや手間はかかるが,将来的にはシーンDBをユーザー同士で交換できるようにすることで,識別できるシーンがどんどん増えていくことが考えられる。GPSやPlaceEngineなどから大雑把な現在位置を取得した上でシーン識別すれば,識別率を上げられるだろう。

 Fallenは,「2008年の春ころにARという言葉を知って開発を始めた」(金村氏)ものなので,まだ発展中の段階だ。例えばある場所をシーンDBに登録していたとしても,それは特定の方向から見たシーンだけ。異なる方向からそのシーンを見ると識別できなくなる。

 この問題は「『エピポーラ幾何学』を使って解決できないかと考えている」(同)という。エピポーラ幾何学は2次元の画像から3次元のシーンを復元するアルゴリズムで,ARでよく使われるものである。