東京都内の各地域で発生した「犯罪発生情報」や「防犯情報」などをメールで毎日知らせる警視庁のメーリングリスト「メールけいしちょう」。その情報を基に、世界最高精度という犯罪予測アルゴリズムが開発された(図1)。

図1●東京の予測犯罪発生密度と実際に起きた犯罪
図1●東京の予測犯罪発生密度と実際に起きた犯罪
(出所:梶田真実氏)
[画像のクリックで拡大表示]

 開発したのは、理論物理学者で現在は主婦という梶田真実氏だ。犯罪予測アルゴリズムの研究をしている。

 住居侵入や窃盗などの犯罪は、犯罪場所への侵入経路や防犯カメラなどの設備、見つかりにくい時間帯などを事前に調べてから行なわれることが多い。犯罪学では、ある場所で犯罪が一度発生すると近隣で連続して発生する現象が知られているという。梶田氏は2014年以降の「メールけいしちょう」などのデータを収集して、近隣で反復して起きる犯罪を予測する独自のアルゴリズムを開発した。

 海外では既にオープンデータを使った犯罪予測の様々な手法が考案されている。梶田氏は新たなアルゴリズムによって、海外の既存の手法よりも高い精度を得た。効率的な防犯パトロールの巡回経路の考案や、予測に基づいた能動的な防犯活動ができるという。

 もともと梶田氏はオープンデータを活用する目的で研究していたわけではなかった。同じ研究者である夫の海外赴任に伴って研究活動を中断して新たな環境に移ったのを機に、それまでの研究成果を生かそうと、公開されていたデータを基にアルゴリズムの開発を始めたという。梶田氏は「オープンデータであれば、別の研究者が同じデータセットで同じ結果を再現して研究の発展につなげられる」と話す。

 梶田氏によると、現在のところアルゴリズムの精度を高めるためには、米ニューヨークやシカゴのオープンデータを使うことが多いという。「メールけいしちょう」は犯罪が起きた日時や犯罪の種別、どの地域の何丁目で起きたかという情報までしか公開されていないためだ。米国と日本では、250平方メートルと1キロ平方メートルほどの空間分解能の差があるという。大東京防犯ネットワークによるオープンデータである「町丁字別犯罪情報」は月別のデータしかない。

 ただ、日本の犯罪者の法則性は、日本のデータを基準にしないと出せない。プライバシーを保護する仕組みとともに、より細かな情報がオープンデータになれば、確度を高められるという。