ユーザー企業が、データを活用する目的が変わってきた。多くの企業が、「データをビジネスに生かしたい」と考え始め、特に分析結果を将来の予測に使おうとしている。
従来のデータ分析は、過去に起こったことを正しく把握するためのものであり、そこから洞察を導き出してビジネスに適用するのは人間の役割だった。それが今、将来の予測を含めた洞察を導き出すだけでなく、人間が介在することなしに結果を適用しようとするところまで進歩しつつある。
将来の予測にデータを活用するために、取り組むべきことや知るべきことは数多くある。特にデータ活用のための技術には、登場したばかりで、今まさにハイプサイクルの坂道を上がっている先進的な技術が多数存在する。これらの中から、データの蓄積や処理、活用のそれぞれのフェーズで役に立つ、いくつかの技術を説明する。
クラウドストレージにCSVを置くだけでSQLで問い合わせ
データを蓄積するフェーズで特に注目すべきトレンドの一つが、『クラウド型のオブジェクトストレージへのSQLアクセス』である。
例えば、Amazon S3(パブリッククラウド型で利用できるオブジェクトストレージ)にCSV(カンマ区切り形式)ファイルを置くだけで、データベースサーバーにデータをロードしなくてもSQLで問い合わせができる。Amazon S3上に置いたデータは、外部のデータベース(Amazon RedShiftなど)からデータソースとしてアクセスすることも可能だ。
従来は、基幹システムが出力したCSVファイルやWebサイトのログファイルなどを、ETL(抽出/加工/登録)ソフトでデータベースにロードして、データの格納先としてデータベースサーバーを立ち上げておく必要があった。これに対して現在は、まずはデータをストレージに置いておき、後からデータベース検索が必要になった時にデータベースの処理リソースを追加するといった運用が可能になる。
情報システムのインフラを、インターネット上のサービスとして提供する「IaaS(Infrastructure as a Service)ばかり使っていては、これらクラウドサービスならではのメリットを享受できない。クラウドサービス事業者が、どのようなサービスを提供しているか、それによって何ができるのかを知っておくことが望ましい。