画像の中の被写体を識別する「画像認識技術」の性能は、「ディープラーニング」によって近年急速に向上している。そのディープラーニングを癌(がん)など悪性腫瘍の検出に適用しているのが、米サンフランシスコに拠点を置くスタートアップの米Enliticだ。同社のシステムのがん検出率は、人間の放射線医師を上回るという。

 ディープラーニングは、脳の仕組みを模した「ディープ・ニューラル・ネットワーク」を使用する機械学習の手法だ。ディープラーニングは音声認識や自然言語処理などにも使われているが、最もめざましい成果を挙げているのは、やはり画像認識の分野だろう。

 画像認識技術の性能を測るコンテストとしては、「ImageNet」という画像データベースを使った「ILSVRC(ImageNet Large Scale Visual Recognition Challenge)」が著名だ。米Googleや米Intel、米Qualcomm、中国Tencentといった名だたるIT企業が参加した2015年のコンテストでは、米Microsoftの研究機関であるMicrosoft Researchが優勝。同コンテストでは1000カテゴリの被写体を正しく分類できるかを競うが、Microsoftの分類のエラー率は3.6%に過ぎなかった。

 過去のコンテストにおける分類エラー率の最小値は、2014年が7.4%、2013年が11.1%、2012年が15.3%だった。同コンテストでディープラーニングを使ったチームが優勝したのは2012年のこと。15.3%という分類エラー率は当時としては「驚愕」の低さだった。それからわずか3年。優勝したMicrosoft Researchは、ディープラーニングを使った画像認識技術の認識精度が、人間を上回るようになったと主張する(該当ブログ)。

 ただしEnliticのデータサイエンティストであるRewon Child氏(写真1)は、「ImageNetのコンテストは、縦224ドット×横224ドットの画像に写る被写体を、猫だ、犬だと分類するだけのもので、タスクとしては決して難しくない」と主張する。その上でChild氏は、「我々はもっと難しい画像認識に挑戦している」と語る。

写真1●米Enliticのデータサイエンティスト、Rewon Child氏
写真1●米Enliticのデータサイエンティスト、Rewon Child氏
[画像のクリックで拡大表示]

わずか「3ドット×3ドット」の悪性腫瘍を見つけ出す

 Enliticが挑戦するより難しい画像認識。それがレントゲン写真やCTスキャン、超音波検査、MRIなどの画像からがんなどの悪性腫瘍を探し出すというものだ。Child氏は「レントゲン写真の解像度は縦3000ドット×横2000ドット。しかもそこの映り込む悪性腫瘍のサイズは、縦3ドット×横3ドット程度。非常に巨大な画像に写り込んだ小さな陰のような物体が悪性腫瘍かどうか判断するのは、非常に難しいタスクだ」と説明する。

 レントゲン写真やCTスキャンから悪性腫瘍を見つけ出す画像認識ソフトは、ディープラーニングの手法の一つである「Convolutional Neural Network(ConvNet、たたみ込みニューラルネットワーク)」を採用して開発した。人間の放射線医師が悪性腫瘍の有無や場所などをチェックした大量の医療画像データをConvNetが機械学習し、悪性腫瘍の形状などを表す「特徴」や、どの特徴を重視すれば悪性腫瘍の有無が判断できるかといった「パターン」を自動的に見つけ出す。ConvNetが見つけ出したパターンを新しい医療画像に適用すると、その画像に悪性腫瘍が存在するかどうかが分かるという仕組みだ。

 Enliticによれば同社が開発した悪性腫瘍の検出システムは、放射線医師を上回る精度だという。Enliticが肺がんに関する画像データベース「LIDC(Lung Image Database Consortium)」や「NLST(National Lung Screening Trial)」を用いて検証したところ、同社のシステムの肺がん検出の精度は、放射線医師が1人だけで肺がんを検出する精度を5割以上も上回ったとする。