図●「ショッピングサーチ」の画面例
図●「ショッピングサーチ」の画面例
[画像のクリックで拡大表示]

 「価格.com」を運営するカカクコムは7月23日,商品を探しやすくする機能を追加した。「楽天市場」や「Yahoo!ショッピング」といった主要インターネット・ショッピング・サイトの商品を横断的に検索できる「ショッピングサーチ」に機能を付加した。独自の自然言語処理技術を使って,店舗が掲載している商品の説明文を解析。その結果を基に,寸法や色,素材など,商品の属性情報に応じた絞り込み検索ができるようにした(図)。ニーズが高いインテリア分野から始め,8月中にもサプリメント分野に拡張する計画だ。インテリアの商品数は7月時点で約70万件である(インテリアの検索ページ)。

 ショッピングサーチのトップページでインテリアを指定した場合,ページの上部に配置されているボタンやメニューで,椅子や机といった大分類とともに,高さ・横幅・奥行きといった寸法,色,使用している素材などが指定できるようになっている。検索ボタンを押すと,楽天市場やYahoo!などに出店しているインテリア・ショップの商品で,条件に合致した商品が一覧表示される。従来の同社のショッピングサーチや各種ショッピング・サイトが提供する機能は,キーワード検索のほか,ベッドやデスク,ライトといった大分類や価格帯などによる絞り込み検索にとどまっていた。

 「今回の検索機能で,ショッピングサーチのユーザービリティを大きく向上できる」とカカクコムの安田幹広取締役CTO(最高技術責任者)は語る。「『買い物をする前に,まずは価格.comにアクセスする』というユーザーの評価を確固たるものにしたい」(安田CTO)という。

筑波大学発の技術ベンチャーと共同開発

 絞り込み検索機能を実現するために導入したのが,自然言語処理技術を応用した「属性抽出エンジン」だ。筑波大学発の技術ベンチャー企業であるGSSM筑波が開発した独自技術をベースに,両社で共同開発した。各ショップがサイトに公開している商品の説明文から,その商品を特徴付けている属性情報を自動的に抽出し,検索対象となるデータベースに整理し格納する。

 サイトで公開している商品の説明文は,必ずしも一定のフォーマットに沿っているわけではない。属性情報の書き方もまちまちだ。例えばサイズの表記は「幅,高さ,奥行き」と書かれている場合もあれば,「H,W,D」と書かれているケースもある。サイズを示す数字の単位や,その単位を表記している位置も違う。

 ショッピング・モールやショップで違うし,場合によっては同じショップが出品している商品でも,商品が違えば説明文の書き方が異なっていることもある。ある程度検索エンジンでふるいにかけて人手でチェックすることも考えられるが,800万件という量では現実的ではない。属性抽出エンジンがこの壁を乗り越えるのを助けた。

 GSSM筑波が持つ自然言語処理技術はいくつかの特徴を持つ。代表的なものの1つが,動詞と助詞の関係から,名詞がどんな分野のものかを推測する技術。例えば「のぞみで行く」という文章は,「行く」という動詞に「で」という助詞が前についているため,「のぞみ」は交通手段であると推測する。「東京に行く」という文章は,「行く」という動詞に「に」という助詞が使われているため,「東京」は行き先,つまり場所を表す名詞であると推測する,といった具合である。

 このような自然言語処理技術を使うことで,表記は異なるが意味は同じと見られる言葉を抽出し整理する。カカクコムのノウハウを組み合わせることで,「ユーザーが指定したスペックで,商品を的確に絞り込めるよう整理することに成功した」(筑波大学大学院ビジネス科学研究科の津田和彦教授)。商品を新たに追加したり,説明文を変更したりした場合にも,属性情報を示す新しい言葉を特定できるという。

 ショッピングサーチ向けの属性抽出エンジンの開発を始めたのは今年1月。プロトタイプを作りながら互いにやり取りし,6月には本サービスに使える形にまで精度を高められた。「およそ3~4人月程度の工数。津田教授らの協力もあり,完成度の高いものが手早くできた」(カカクコムの福田紀彦 検索サービス部長)。開発費は未公開だが,カカクコム側の内部費用を除くと本誌推定で1000万円前後である。

新検索エンジンで処理性能を向上

 ショッピングサーチは9月にはベータ版から本格サービスへと移行させる計画だ。そのときには,検索対象としている商品点数は現在の約800万点から約 1000万点に増える見込みである。

 拡大する商品点数,属性情報による絞り込み検索といった新しい機能の実装をするために,カカクコムは5月にショッピングサーチの検索エンジンをリニューアルし,「FAST ESP」を実装した。FASTはノルウェーのソフト会社ファスト サーチ&トランスファが開発した検索エンジンで,国内では楽天やリクルート,ヨドバシカメラなどがWebサイトに採用している。

 FASTを採用した理由は,処理性能と開発のしやすさにある。カカクコムの福田部長は「検証のために使ってみたところ,ハードの拡張に応じて処理性能が順調に伸びていくことや,Webサイト向けのソフト部品や機能が充実しており,かゆいところに手が届く仕様になっていることが分かった。今後商品点数が増加し,継続的に機能追加を計画しているショッピングサーチには適している」と説明する。

 情報提供サイトで処理性能は「ユーザーの評価に直結する重要な要素」(安田CTO)である。以前カカクコムの検索機能については「処理速度が遅い」というユーザーからの評価が多く,喫緊の課題として挙がっていた。従来の検索エンジンはハードを拡張しても処理性能が思うように伸びず,調整に手間がかかったという。

 開発は ファスト技術陣の協力を得ながら進めた。カカクコム側の工数は,第一フェーズのインデックス・ファイル(検索対象となるファイル)の作成が10人日程度,第二フェーズのショッピングサーチのサイト開発が15人日程度。「FASTの生産性の高さを実感した」と福田部長は評する。今後,「価格.com」全体の検索エンジンとしてFASTの適用範囲を広げていく計画だ。

新たな価値で「Googleの脅威」に対抗

 カカクコムがサイトの機能強化を急ぐ理由は,「まずは検索」という最近のインターネット・ユーザーの行動様式に対応すること。だが,それだけではない。「Googleがますます手広くカバー領域を広げてきている。そんな中,情報提供サイトとして,カカクコムならでは,つまりカカクコムにアクセスしないと得られない付加価値を提供できなければ生き残れない」(安田CTO)という危機感がある。

 付加価値のキーワードとして安田CTO が挙げるのが「セマンティック(文脈)」である。インターネット分野ではしばしば「セマンティックWeb」と言われる。データにそれの「意味」を解釈するためのデータも持たせて,サービスの機能や質を高めることなどをこう呼んでいる。

 カカクコムのショッピングサーチにおける属性検索機能は,商品情報に属性というセマンティック情報を付加することで可能にしたものと言えるだろう。その裏には,今回開発した属性抽出エンジンの存在がある。安田CTO は「サイトの付加価値や品質向上のために,今後も新技術を積極的に取り入れていく」と意気込む。