富士通研究所は2016年10月20日、人やモノのつながりを表現する「グラフ構造」のデータを高精度に解析できる機械学習技術「Deep Tensor」を開発したと発表した。ディープラーニング(深層学習:多層のニューラルネットによる機械学習)を適用するのに最適なデータ表現を、人手を介さず機械学習で獲得させる。

 この技術は、IoT機器では通信ログ解析、FinTechでは金融取引の解析、創薬では化学組成と活性の解析などに適用できるという。2017年度前半の実用化を目指す。

 複数の要素の関係性を示すグラフ構造データは、一般にテンソル(多次元の配列)の形で表現できる。このデータをそのままニューラルネットワークに入力する場合、学習に大量のデータが必要になり、精度を高めにくい問題があった。このため従来は、特徴的なグラフ構造を人間の手で設定し、元のテンソル表現を別の表現に組み替えることで精度を高めていた。

 富士通研は、ニューラルネットワークの学習過程で用いる誤差逆伝搬法を、入力するグラフ構造データのテンソル表現にまで拡張。ニューラルネットによる分類の精度を最大化するよう、テンソルの表現形式を自動的に調整できる技術を開発した。

ニューラルネットに学習を施す手法「誤差逆伝搬法」を、グラフ構造データのテンソル表現に拡張する
ニューラルネットに学習を施す手法「誤差逆伝搬法」を、グラフ構造データのテンソル表現に拡張する
(出所:富士通研究所)
[画像のクリックで拡大表示]

 同研究所は、化合物のオープンデータ「PubChem BioAssay」に基づく化合物の構造と活性の関係を示すグラフ構造データを、この技術を使ってニューラルネットに学習させたところ、これまでの技術と比べて約10%高い約80%の活性予測精度を実現した。

 このほかサイバー攻撃検知では、ホスト間の通信関係を占めすグラフ構造データを学習させたところ、従来の学習モデルであるサポートベクターマシン(SVM)を使った場合と比べ、誤検知率を2割削減できたという。