あらゆるものがデジタル化されてきた今、ITを介したトランザクションのすべてが“ログ”として残るようになっています。とにかく溜まっていくログですが、視点さえ明確にもって解析すれば、自ずと色々と“語り出す”のです。本連載では、ログの本質をつかむと同時に、ログ活用の最新動向を解説します。第1回は、そもそも「ログって何」というところから始めましょう。

京大・入試事件を早期解決させた「ログ」

 2011年2月末に京都大学などで起こった携帯電話を使ったカンニング事件は記憶に新しいところです。同事件において犯人を特定するうえで大きなカギとなったのがIPアドレスでした。デジタルネットワークの機器を利用するということが、どのようなことであり、その裏にどのような情報、すなわち「ログ」が蓄積されていくのかということが、一般の人々にも良く理解できる事例の一つになりました。

 「ログ」を辞書で引くと、「航海日誌、コンピューターの操作記録、通信の記録」などと記載されています。ですが、より広いとらえ方をすれば、歴史的著名人の身振りや抑揚のある声を撮影した映像音声も、それを記録した日時、中東の民主化運動の様子を録画した映像、騒動を加熱させていったFacebook利用者の記録など、それらいずれもがログなのです。

 では現在、世界にはどの程度のログがあり、それを取得するためのデバイスが存在しているのでしょうか。米IBMの報告によれば、次のような数字が挙がっています。

【ログの想定量】
・情報の総量:1800百京バイト(百京=1018 )
・情報の日発生量:15千兆バイト(千兆=1015 )
・情報の年増加率:+60%
【誰が、いつ、どこで、何をしたかを特定できるデバイスと想定量】
・ネット接続デバイス:1兆個
・RFID(ICタグ):300億個
・携帯電話:40億台
・カメラ:10億台

 近い将来、IPアドレスがIPv4の43億通りからIPv6の340×10の36乗通りに移り変わると、ユニークであると特定できる対象数が飛躍的に増加します。ゆくゆくは、物や人である「有体」のみならず、物の変化や人の振る舞いなど、「無体」と言われるものまでがログとして取得できるようになるでしょう。

ログの見え方は一通りではない

 ログの性質を、より理解してもらうために、中東を揺るがせている民主化運動を取り上げてみます。

 TV報道を見ていると、民衆が米国国旗を焼くような、かつては良く眼にした光景が一切ありません。代わりに、路上集会のシーン、工場を閉鎖するシーン、騒乱現場の略奪後のシーンなどが多数登場し、貧富の差が大きくなって失業者があふれていることが大きな背景として表現されています。賃金格差が騒動の大きな要因とする解説もありました。

 一方、エジプトの経済データをみると、失業率は2000年以来8~11%で大きく変化がなく、「高い失業率に不満が爆発した」という解説とは隔たりがあります。むしろ経済成長率は2000年以来3~7%、平均5%と順調です。エジプトの実質経済成長率は、日本の同平均1%より高いレベルを維持しています(図1)。

図1●エジプトと日本の経済成長率の比較
図1●エジプトと日本の経済成長率の比較
[画像のクリックで拡大表示]

 米タイム誌は「経済成長こそが今回のデモの引き金だ」と解説しています。賃金格差に対する不満というよりも、経済成長によって豊かになったことで市民の期待値が高まり、その期待に独裁政権が答えられなかった状況が騒乱の元凶だという見方です。

 中東の事例で強調したいのは、どのような事象も、どのログをどのように見るかによって色々な説が導き出せるということです。ログは単なる「記録」にすぎません。しかし、扱い方、読み取り方によって、大きく分析の結果が変わってっきます。そんな性質を持っているものが「ログ」なのです。