米Googleは現地時間2012年6月26日、同社研究チームの機械学習技術に関する研究成果を紹介した。脳をシミュレーションする大規模ネットワークを用いた新たな手法により、コンピュータが猫を認識する能力を自ら身につけることに成功したという。

 現在、機械学習技術を新用途に適用させるにはたいへんな作業を必要とし、例えば車とバイクの写真を区別できるシステムを構築しようとする場合、標準的な手法ではまず「車」あるいは「バイク」のラベルを付けた多数の写真を集めなければならない。そしてこれらラベル付けしたデータを使ってシステムをトレーニングする。

 しかしGoogleは、Web上や「YouTube」ビデオから無作為に画像を収集し、人間の脳などの神経回路網の学習プロセスをシミュレーションする人工ニューラルネットワークを構築してトレーニングした。

 Googleによれば、機械学習に使われているほとんどの人工ニューラルネットワークは、接続ポイントが100万~1000万ほどだ。Googleの人工ニューラルネットワークは、演算能力を1万6000個のCPUコアに拡大し、10億以上の接続ポイントを設けた。

 1週間にわたりYouTubeビデオを同ネットワークに見せたところ、ネットワークは猫の写真を識別することを学習した。事前に猫をネットワークに教えたわけでも、「猫」のラベル付けをした画像を与えたわけでもなかった。つまり、ネットワーク自身が、YouTubeの画像から猫がどういうものかを知ったことになる。これは機械学習における「self-taught learning(自己教示学習)」と呼ばれるものだという。

 またGoogleは、同社の大規模ニューラルネットワークでは基本的な画像分類テストの精度が70%向上したとしている。その際、ラベル付けしたデータではなく、Web上から集めた大量のラベル付けしていないデータを使用した。

 同社研究チームは、さらに大規模なネットワークの学習システム構築に取り組んでいる。成人男性の脳の神経経路は約100兆個の接続があるとされており、「まだ拡大の余地は大きい」とGoogleは述べている。

[発表資料へ]