個人情報保護に詳しい鈴木正朝・新潟大学教授は、JR東日本が交通系ICカード「Suica」の乗降履歴データを日立製作所に販売した件は、個人的には現行法でもクロと言わざるを得ないと指摘。その上で「ビッグデータ」ビジネスの中核は、国際競争力を発揮できる「医療イノベーション」にあると主張する。日本の産業力強化のためには、個人データの保護レベルを国際水準に引き上げて、ゲノム情報を世界から持ち込んでも安心されるハブ機能を持つ必要があると訴える。

(聞き手は、大豆生田 崇志=日経情報ストラテジー


JR東日本が乗降履歴データを日立製作所に販売していた件には、さまざまな論点が指摘されています。

新潟大学教授の鈴木 正朝氏
新潟大学教授の鈴木 正朝氏
[画像のクリックで拡大表示]

 私は現行法でクロと言うべきだと思います。JR東日本を叩くつもりはありませんが、あえてクロだと指摘することで、個人的にこの事例から浮かび上がる現行法の問題点を明らかにしたいのです。

 そもそも今回の話はビッグデータというオブラートに包まれていますが、乗降履歴は伝統的なデータベースによるただの受託データです。例えて言えば、何百社もの給与計算のデータを持つ受託企業が委託先からの了解を得て、預かった生データを統計データにして売るという話です。

 本人の同意なくデータを動かせるとしたら、現行法では委託しかない。委託は預けることですから必ず戻ってくる。情報の価値に一切関係なく、全てを“お客様情報”として、自分で活用せずお客様のためだけにデータを処理するのが、受託側の情報サービス産業のモラルだったはずです。

 それが個人識別性のない不可逆なデータだからといって、お客様情報を勝手にプロセッシングしていいのでしょうか。委託先の法人から許可を取れば、預かったデータに何をしてもいいのかと問いたい。それを「ビッグデータ」ビジネスと呼ぶのですかと。

法的にグレーという指摘も多いようです。

 状況証拠からは、違法ではないかと推定を働かせるべきです。グレーというのは思考停止で、問題を留保して結論付けずにウヤムヤにしようと思われても仕方ありません。それに、グレーと言われた事業者は結局、クロと言われたのと同じように立ちすくむことになる。誰もハッピーではないでしょう。

 シロかクロかはっきりさせて、事業者に変えるべきは変えろと言わないとダメだというのが私の考えです。規制する側は「申し訳ないけども現行法では我慢してくれ」と言うなら言って、その代わり「立法的にこうするつもりだから、しばらく待ってくれ」と言うのも筋です。

 Suicaの件が、なぜクロかに話を戻します。匿名化といっても、識別子だけ見れば仮名化に近い。そして、仮名化的措置の一部を日立に委ねていることが、浅川直輝記者によるITproの記事で分かってしまった。

 ということは、JR東日本が日立製作所に提供する生のデータセットからは、本人を再識別化できる可能性があったはずです。識別子の問題に注目させているけども、生データがいわば長いIDに相当する部分となっていて、照合容易性は残っていたと評価できる状況があるからです。

 生データですから、何月何日の何時何分何秒に何駅で入札や出札した時系列的流れのデータが2年半にわたって蓄積されている。すると、JR東日本側の識別子がなくても、乗車時間帯や乗車区間などのユニークなデータから特定の個人を識別できる可能性がある。要するに、JR東日本はSuicaデータを、特定の個人を識別できる可能性のある状態のまま日立へ提供していたことになります。

 実際、米国ではオンライン映画配信・DVDレンタル会社であるNetflixが2006年、顧客の嗜好に合った映画をお勧めするアルゴリズムのコンテストを開催した際に、顧客の視聴履歴の生データを匿名化して公開した(関連記事)。このとき、テキサス大学の研究グループが公開された視聴履歴データを分析して、一部の個人を特定したことがあります。