かつてはデータを機械に学習する前に、人間がデータを様々な形で分類したり加工したりしていた。近年台頭する「ディープラーニング」を初めとする機械学習技術では、機械が人間に頼らずにデータを分籍する。驚くべき機械学習の最新事例を示そう。

人間の試行錯誤を排除
-未来予測-

 未来予測に関しては、NECの「異種混合学習」を紹介しよう。これは収集したデータの中に複数の規則性が存在する場合に、それぞれのパターンごとに適したモデルを生成する手法だ。

 例えばNECは、ビルの電力消費に関する時系列のデータを収集して、電力消費を予測するモデルを作った。ビルの電力消費は、当然ながら曜日や時間帯ごとにパターンが変化する。従来は、どのようなタイミングでパターンが切り替わるか、人間が専門知識を動員して場合分けを行い、それぞれの場合に適したモデルを作っていた。。

 NECの異種混合学習では、パターンの切り替わり自体を機械学習によって見つけ出し、パターンごとにモデルを生成できる。新たにデータが発生した際には、生成したモデルとの適合を確認し、うまくモデルが適合しなかった場合はパターンの切り替わりの判定からやり直す。つまり「パターンの場合分け」と「モデルの作成」を機械が繰り返すことで、パターンごとの最適モデルを作っている。

 NECの検証によれば、異種混合学習をビルの電力需要予測に適用することで、専門家による方法に比べて予測精度が2.1ポイント改善し、98.3%の精度で需要を予測できるようになったという。

不審な行動を把握
-異常検知-

 社員同士による電子メールの送受信パターンの変化から、社内の不正を検出する――。東京大学工学部の山西健司教授は、人間同士がつながるパターンから組織内の変化を把握する、「潜在的ダイナミクス検知」という新しい異常検知手法を開発している。

 人間同士のつながりは、いわゆる「グラフ構造」としてモデル化できる。「潜在的ダイナミクス検知」は、このグラフ構造の変化から、その組織内で起きている変化、例えば複数の社員による不審な行動などを検知しようというものだ。グラフ構造を持つ組織であれば、会社組織以外にも適用できる。例えば病院の患者間のグラフ構造の変化から伝染病の流行を検出することなどが可能という。