「ディープラーニング」とは、ニューラルネットワークを何層も重ねた機械学習の手法の一つである。近年、画像認識や音声認識のような人工知能の分野で、他の手法に比べ圧倒的な性能が出ることで注目を浴びている。それ以外にも、創薬、医療画像診断、対話システム、自動運転など応用範囲がますます増えている。

 このディープラーニングを容易に試行できるのが、米エヌビディアが提供する「NVIDIA DIGITS」である。本稿は、ディープラーニングとは何かを説明した上で、DIGITSの特徴やインストール方法を解説する。

ニューラルネットワークとは

 機械学習には、ナイーブベイズ法、最近傍探索法など様々な手法がある。それらの手法が統計的なアプローチでデータを分類するのに対し、ニューラルネットワークは人間の脳神経回路をまねたモデルを用いて分類するという、少し性質の異なるアプローチをとる(図1)。

図1●データ群を分類する二つのアプローチ
図1●データ群を分類する二つのアプローチ
[画像のクリックで拡大表示]

 ニューラルネットワーク自体は古くからある技術で、1980年代にも活発に研究が行われていた。だが、ニューラルネットワークの性能を引き出すには大量の計算パラメータを最適化する必要があり、他の手法に比べ性能も出すのが難しく、長く「冬の時代」が存在した。

 ディープラーニングが注目を浴びるきっかけになったのが、世界的な画像認識のコンテスト「ILSVRC(ImageNet Large Scale Visual Recognition Challenge)2012」での成果である。

 ILSVRCは、ある画像に写っているのが何であるかをコンピュータプログラムで判断し、その正解率を競うコンテストである(図2)。1000万枚の学習用画像データと15万枚のテスト用画像データを用いて正解率を算出する。世界中の人工知能の研究機関が、正解率をコンマ数パーセント向上させるために毎年しのぎを削っている。

図2●ILSVRCの画像データから複数の物体を識別する事例
図2●ILSVRCの画像データから複数の物体を識別する事例
[画像のクリックで拡大表示]