>>前回

 ビッグデータに関する連載の2回目である。今回はデータ収集を取り上げる。

 従来の情報システムで取り扱わなかったデータを対象とする場合、その収集方法がまず問題となる。ビッグデータにおいてそうしたデータの代表は、(1)車両や家電機器などに組み込まれるセンサーからの情報と、(2)TwitterやFacebookなどのソーシャルネットワーク(SNS)への書き込み情報である。

 POSデータやECサイトのログのように、情報ソースがすでに情報システムの対象となっている場合は、データ収集方法は既存方式の延長線上で考えられる。ビッグデータとして議論しなければならないのは、データの粒度や取得タイミングの細分化であろう。

 今回はセンサーデータとSNSのデータに絞って、それらのデータを収集する際の課題とシステムの構成例を紹介する。

センサーデータの収集

 センサーからのデータは、人を介さずに連続的にデータが生成されるという点で、ビッグデータの本流ともいえる情報ソースである。センサーデータの収集に関わる技術要素の関係を示した(図1)。

図1●センサーデータ収集に関わる技術要素
図1●センサーデータ収集に関わる技術要素
[画像のクリックで拡大表示]