2016年3月設立のスタートアップ企業であるディープインサイトは、IoT(インターネット・オブ・シングズ)端末など組み込み用途に特化したディープラーニング(深層学習:多層のニューラルネットによる機械学習)のフレームワーク「KAIBER(カイバー)」を開発した。同社によれば、組み込み用途に特化したフレームワークは国内初で、2016年内に提供を始める。IoT機器を使った画像認識などの機能を、容易に開発できるようになる。

 IoTネットワークの末端でデータを分散処理する「エッジコンピューティング」の要となる技術として、IoT端末、ネットワーク機器、医療機器などの開発部門に売り込む。同年12月を目標に提携企業への提供を始め、2017年春までに有償の商用ライセンスの提供を始めたい考えだ。1年で100社への提供を目指す。

 学習済みモデルによる推論を実行するソフトの容量を数Kバイト~数十バイトほどに抑えることで、スマートフォンやエッジサーバーのほか、家電やセンサー機器、ネットワーク機器など中位・下位マイコンにも組み込めるようにした。学習済みモデルのデータ容量は用途により異なるが、例えば数字を認識するニューラルネットはテキスト形式で1.8Mバイト、メモリー展開時で360Kバイトほどになる。

ルネサス エレクトロニクス製の100MHz動作マイコン「RX63N」で、数字の認識を行うデモ。カメラ(右)の前に「6」の数字を置くと、マイコン基板(左)と接続した表示板の6番目に「99(%)」、それ以外は「0(%)」と表示される。ニューラルネットによる推論処理にかかる時間は50ms。マイコンのメモリーに展開されたKAIBER推論実行ソフトの領域は5Kバイト、学習済みモデルの領域は360Kバイトと小さい。マイコン基板はデータテクノロジー製ESPT-RX。
ルネサス エレクトロニクス製の100MHz動作マイコン「RX63N」で、数字の認識を行うデモ。カメラ(右)の前に「6」の数字を置くと、マイコン基板(左)と接続した表示板の6番目に「99(%)」、それ以外は「0(%)」と表示される。ニューラルネットによる推論処理にかかる時間は50ms。マイコンのメモリーに展開されたKAIBER推論実行ソフトの領域は5Kバイト、学習済みモデルの領域は360Kバイトと小さい。マイコン基板はデータテクノロジー製ESPT-RX。
[画像のクリックで拡大表示]
Raspberry Pi Model B(1.2GHz動作の米ブロードコム製ARMプロセッサ搭載)を搭載したモデルカーを使った、ジェスチャーによる運転制御のデモ。搭載カメラに向けて指を1本立てると左、2本で右、手を広げるとまっすぐに進む。JPEG画像の展開に100ms、3種類の学習済みモデルによる推論に60ms×3、の計300msほどかかる。
Raspberry Pi Model B(1.2GHz動作の米ブロードコム製ARMプロセッサ搭載)を搭載したモデルカーを使った、ジェスチャーによる運転制御のデモ。搭載カメラに向けて指を1本立てると左、2本で右、手を広げるとまっすぐに進む。JPEG画像の展開に100ms、3種類の学習済みモデルによる推論に60ms×3、の計300msほどかかる。
[画像のクリックで拡大表示]

 KAIBERは、多層ニューラルネットの学習を担う学習サーバーソフトと、学習済みモデルを使ってデータを処理する推論実行ソフトからなる。「従来の一般的なフレームワークは学習機能と推論機能が一体になっているほか、Pythonなどのライブラリなども導入する必要があり、中位・下位マイコンへの組み込みには適さなかった」(ディープインサイト 代表取締役社長の久保田良則氏)。KAIBERはフレームワーク全体はJavaで構成しつつ、推論実行ソフトはC言語版も用意し、マイコンに組み込みやすくする。

 原則として学習サーバーソフトを有償で提供し、推論実行ソフトについても、iOS/Android版は無償で配布できるようにする。ニューラルネットワークの構成としてはCNN(畳み込みニューラルネット)やRNN(再帰ニューラルネット)に対応するが、当面は「画像認識に強いCNNに力を入れる」(久保田氏)という。

 組み込み用途を想定したディープラーニング基盤としては、国内ではPreferred Networksがエッジコンピューティングを想定した「Deep Intelligence in-Motion」を開発しているほか、海外ではインドのアンカニービジョン(Uncanny Vision)がARM Cortex-Aコアに最適化したライブラリを提供している。ディープインサイトは、より非力なマイコンでも動く小規模の推論ソフトを開発することで、ディープラーニングの用途をさらに拡大させる考えだ。