「企業内でディープラーニング(深層学習)を手掛けようにも、現状は手足を縛られているような状態だ。企業が問題なく使える『政府お墨付きのデータ』を整備してもらえないか――」。

 2017年5月24日、愛知県で開催された人工知能学会全国大会の公開セッションで、質問に立った企業の技術者が切実な声を挙げた。

 深層学習を始めとする人工知能(AI)技術の研究開発には、AIに学習を施すための学習用データの整備が不可欠だ。

 だがAIが学習するデータの多くは、行動履歴、チャット、ブログ、つぶやきなど「ユーザーが生成に関わったデータ」である。

 こうしたデータを扱うには、著作権などの知的財産権、通信の秘密、プライバシーといった法律的、倫理的な問題への配慮が求められる。データ生成元への配慮を欠けば、思わぬ“炎上”につながりかねない。

 同全国大会の研究発表で、まさにこの懸念が現実になった。立命館大学の研究チームが学会のWebサイトに公開した論文が、学習用データの元となった小説の著者などから批判を受け、発表翌日の25日に非公開化へと追い込まれた。

 AIの技術開発に不可欠な学習用データの扱いを巡る、技術者の試行錯誤を追う。

「学習工場」へ投資せよ

 冒頭の発言があったのは、5月24日午後に開催された「深層学習の爆発的普及のために」と題する公開特別セッションだった。

 同セッションで最初に登壇した東京大学 特任准教授の松尾豊氏は、日本で深層学習を推進させるため、企業は「学習工場」に投資すべきと訴えた。

 松尾氏は「深層学習の大きな成果は、機械やロボットに『眼』を持たせたこと」と説明する。カメラ画像を通じてが物体を正確に認識できるようになった結果、農業なら「トマトを収穫するロボット」、外食産業なら「食洗機にお皿を入れるロボット」の実現が見えてきた。

 松尾氏は、日本企業が「眼」を備えた機械やロボットを一刻も早く市場に投入するため、大量の学習用データを使ってロボットの眼を鍛える「学習工場」に投資すべき、と訴えた。

 学習工場は、機械やロボットの機種ごとに必要な眼、つまりニューラルネットワークの学習済みモデルを生産する拠点だ。必要なのは、優れたAI人材、高性能コンピュータ、そして大量のデータを準備できる環境である。

「学習工場」の概要
「学習工場」の概要
[画像のクリックで拡大表示]

 松尾氏は「AI技術における競争力はデータに宿る」と主張する。AIのアルゴリズムは論文やオープンソースの形で公開されるため競争軸にはなりにくい一方、企業が独自に集めたデータと同じものを他社が手にするのは難しい。