NECは2013年11月12日、パーソナルデータ(個人に関する情報)の匿名化処理を、従来の40倍高速に実行できるk-匿名化アルゴリズムを開発したと発表した。データの精度を保ちながら、データから個人を特定されるリスクを軽減できる。2014年度中の実用化を目指す。

 k-匿名化とは、共通の属性を持つ個人が「k」人個以上になるよう、データをあいまいに加工する技術のこと。kの数が大きいほど、データから個人を特定されるリスクが低くなる。

 NECが開発したのは、性別や生年月日といった個人に固有の属性(単一値属性)と、病名や投薬名などの履歴データ(集合値属性)をまとめてk-匿名化するアルゴリズムである。従来は、単一値属性と集合値属性を分けて個別に匿名化していたため、精度や安全性に課題があったという。

 NECによると、一般的なPCサーバーを使って50万人規模の医療情報にk-匿名化を施したところ、単一値属性と集合値属性を分けていた従来のアルゴリズムと比べて40分の1となる約5分で、同等の処理を完了できたとする。データ処理に特化したDWHサーバー「InfoFrame DWH Appliance」であれば、1億人規模のデータを約10時間でk-匿名化できるという。