写真1●画像認識型ARエンジン「SREngine」を開発した金村星日氏。今回は個人として参加(写真:後藤究)
写真1●画像認識型ARエンジン「SREngine」を開発した金村星日氏。今回は個人として参加(写真:後藤究)
[画像のクリックで拡大表示]
写真2●iPhoneによるクライアント/サーバー型SREngineのデモ
写真2●iPhoneによるクライアント/サーバー型SREngineのデモ
[画像のクリックで拡大表示]
写真3●画像認識をクライアント(iPhone),照合処理をサーバーで実施
写真3●画像認識をクライアント(iPhone),照合処理をサーバーで実施
[画像のクリックで拡大表示]

 GPSの電波は入らず,加速度/地磁気センサーもない。使える入力デバイスはカメラのみ。そんな端末であっても使えるAR(拡張現実)技術の開発を独力で進めているプログラマがいる。

 2009年2月26日開催のITproビジネス・カンファレンス「AR(拡張現実)ビジネスの最前線」の講演に登壇した金村星日氏(写真1)は「個人の思いつきから始まった」ユニークなAR技術を,iPhone版のデモを交えつつ紹介した(写真2)。

 一般的なAR技術は,実空間に情報を重ね合わせるために,GPSによる位置情報や加速度/地磁気センサーで検出したARデバイスの姿勢情報を必要とする。街路などにカメラを向けたときに「どこの」「何を」写しているのか分からなければ,画面の適切な位置にオブジェクトを配置できないからだ。

 しかも各種センサーを配したARデバイスでさえ,それらセンサーから精度の高い情報が得られない環境ではオブジェクトの位置合わせが難しい。

 金村氏が画像認識AR応用に着目して開発した「SREngine(Scene Recognition Engine)」は,街中や店舗,パンフレットなどの映像と各種タグ情報などをひもづけてデータベースに格納。そのデータベースを基にカメラに写る“シーン”の実映像にタグなどを重ね合わせることで,センサー不要のARを実現している。

iPhoneでリアルタイムにカメラ映像を認識・照合

 金村氏は講演で,iPhoneに移植したSREngineのデモを披露した。ほぼリアルタイムに街中の店舗名やその紹介文などをオーバーレイするものだ。

 iPhone版のSREngineは,画像認識をクライアント,データベース照合をサーバーで実施する構成(写真3)。「iPhoneは俗に『CPUが貧弱』と言われているが,実装の工夫で何とか解決できた」(金村氏)。iPhoneのカメラ映像の認識結果をサーバーに送るだけなので,「特別なハードやソフトは不要。携帯電話の3G回線でも十分使える」(同氏)。

 主な課題は,クライアント側はカメラの画角など仕様のばらつき,サーバー側はスケーラビリティだという。同じ場所や視点のクライアントで撮影した映像であっても「画角や露出などの違いでシーン認識がうまく動作しないことがある」(金村氏)。サーバー側は,データベースが充実するとともに検索対象のレコードが増えるのがネックとなる。「無線LANやGPSなどで位置情報を取得できる場合は検索範囲を絞り込むような実装を検討している」(同氏)という。

 これらの課題に取り組みつつ,SREngineを公開することでユーザーを呼び込むというのが金村氏が描く基本的なロードマップ。既にスタンドアロン版を公開しており,原型となったソフトウエア「FaLLen」の「ARモード」として誰でも試せる状態だ。今後は「(データベースの充実には)ボトムアップのアプローチが有効」というスタンスの下,ソーシャル・サービス化に必要な機能の実装やマッシュアップを進める考えだ。

[金村星日氏のブログ]