2014年に入って筆者は、「データサイエンティストは人工知能に駆逐されてしまう」と読み取れるような記事を何回も書いている。最近でも「日経コンピュータ」2014年10月2日号で「ビッグデータは人工知能に任せた!」という特集記事を書いた。「任せる先はデータサイエンティストじゃなかったのか?」と思われる方も多いだろうから、少し説明しようと思う。

 まずは筆者が日経コンピュータやITproで、「機械学習」や「ディープラーニング」に代表される最近の人工知能技術とデータサイエンティストとの関係についてどう書いてきたか振り返ってみる。例えば、2014年1月9日号の特集「『機械学習』革命」(ITproで全文が読める)では、以下のように書いた。

 米グーグルや米アップル、米フェイスブックといった先進IT企業は今、コンピュータがデータの中から知識やルールを自動的に獲得する「機械学習」の技術を駆使し、様々なイノベーションを生み出し始めている。

 これらは来たる機械学習革命の、ほんの序章に過ぎない。機械学習の本質は、知性を実現する「アルゴリズム」を人間の行動パターンから自動生成することにある。この事実が持つ意味は、果てしなく大きい。今後、実社会における様々な領域で「人間の頭脳を持つプログラム」が登場する一方、データの中から知識やルールを見つけ出したり、プログラムを開発したりするデータサイエンティストやプログラマーの仕事が、機械に置き換えられてしまうからだ。

 はっきりと、「データサイエンティストやプログラマーの仕事が、機械に置き換えられてしまう」と書いた。筆者が1月9日号の「機械学習革命」や、10月2日号の「ビッグデータは人工知能に任せた!」で展開した主張は、おおむね次のような内容である。

「ルール」や「モデル」はコンピュータが作る

 かつて、物事の「意味」や「価値」を判断する「アルゴリズム」(正しく言うと「ルール」や「モデル」)は、人間が自らの知識や経験に基づいて手作りしていた。典型例が、コンピュータ将棋において各局面の有利さや不利さを判断する「評価関数」だ。ところが最新のコンピュータ将棋の評価関数は、人間ではなくコンピュータが、プロ棋士の多量の「棋譜」データに基づいて作成している()。

図●コンピュータ将棋の変遷
図●コンピュータ将棋の変遷
[画像のクリックで拡大表示]

 同じことが、将棋以外の世界でも起きている。画像の中から「猫」や「犬」の画像を見つけ出すモデル、音声の中から「単語」や話者の感情を聞き分けるモデル、テキストデータの中からその内容や重要度を見つけ出すモデル、化合物の中から医薬品やリチウムイオン電池材料の候補を見つけ出すモデル――。

 こういった様々なモデルを今は、コンピュータがデータを基に作り出している。しかもそれらのモデルの精度は、人間が作り出したモデルの精度よりも高い。特に最近は、脳の仕組みを模した「ディープ・ニューラル・ネットワーク」を使う機械学習手法であるディープラーニングの台頭によって、その傾向がますます加速している。よってデータの中から「意味」や「価値」を見いだす仕事はコンピュータ、つまりは人工知能に置き換えられてしまう、という理屈である。