日立製作所は2016年3月9日、個人データを暗号化した状態で安全に匿名化する技術を開発したと発表した()。暗号化を解除することなくデータの中身を検索できる独自の暗号技術を開発し、これと匿名化を組み合わせた。2018年度中に、今回開発した技術の実用化を目指す。

図●個人データを暗号化した状態で安全に匿名化する技術の概要
図●個人データを暗号化した状態で安全に匿名化する技術の概要
(出所:日立製作所)
[画像のクリックで拡大表示]

 匿名化とは、個人を特定できないようにデータを加工することを指す。「k-匿名化」と呼ぶ、同じ属性を持つレコードがk件以上存在するようにデータを変換することで個人が特定される確率をk分の1以下に低減する、という手法がよく使われるという。

 k-匿名化の多くは、値が異なるデータを同じデータに集約してツリー構造にする。例えば、関東地方(10件)や東北地方(20件)といったデータを東日本(30件)といった上の階層のデータに集約する。これにより、個人が特定されにくくなる。

 従来は、データを暗号化したままま内容を比較することができなかったので、匿名化のためには一度暗号化を解除しなければならなかった。このことがセキュリティ上の課題となっていたという。

 日立製作所は今回、暗号化状態を維持したままデータの比較ができる独自の暗号技術を開発した。暗号化データ同士を比較し、同じ値だと判定された暗号化データの数を集計し、この集計結果を用いてツリー構造を生成する。