経済産業省は2013年6月13日、政府や地方自治体が行政データを一般に公開する「オープンデータ」政策を推進するため、データ交換に用いる用語辞書の第1版を公開した。

 意味は同じか近いにもかかわらず行政機関ごとに異なっている、もしくは同じ言葉なのに意味が異なっている用語の関係を表したもので、「共通語彙基盤(IMI)」と呼ぶ。行政機関が持つ様々なデータの項目名、つまり行政用語の関係を整理することで、行政データを組み合わせてより有益なデータを得る、いわゆるマッシュアップが容易になる。

 経産省は2012年に用語辞書の整備事業に着手。今回はあらゆる行政分野に通じるコアの語彙として53のデータ型と202単語を定義した。例えば住所については「構造化住所型」というデータ型を定義して、「国」「都道府県」「市町村」「町名」「街区符号(1番など)」「住居番号(1号など)」「方書(ビル名など)」などの単語、つまりデータ項目名を定義した。これにより住所データを整理し、建物の検索や分類が容易になる。

 加えて、コアから派生する語彙として、防災分野で物資にかかわる12のデータ型、298単語も定義した。例えば水に関しては用途や保存形態などで「飲料水」「保存飲料水」「水ペットボトル」の3種類を定義した。各自治体には、ストックしてある非常用の飲料水がどれに当たるのかを判断し、自治体独自の単語との対応付けをしてもらう。こうすることで、各自治体が持つ物資のデータ集を集めれば、飲料水や非常食のストックがどれだけあるかが、直ちに集計できるようになる。

 同様の取り組みは米国が先行しており、「NIEM(National Information Exchange Model)」と呼ぶ情報交換モデルを第3版まで改訂、広範な行政分野をカバーしている。今回整備したIMIの成果物や調査研究などは、経産省のオープンデータサイト「Open DATA METI」内で公開した(リンク)。