長持ちするデータ基盤、構築ノウハウは4点

島田優子＝日経 xTECH／日経SYSTEMS

2018.08.23

出典：日経 xTECH、2018年 7月 4日
（記事は執筆時の情報に基づいており、現在では異なる場合があります）

　データ活用基盤は、これまでのDWH（データウエアハウス）とは異なる発想で構築する必要がある。ビッグデータをAIで分析するような基盤はどのように構築するのか。押さえるべきポイントを解説する。

ポイント1：スモールスタートで始める

　データ活用基盤の構築は、PoC（概念実証）を実施した後に、最低限の機能で始めるのが望ましい。稼働後に、必要に応じて機能を追加していく方針を採ろう。

　「必要になるたびに機能を追加する発想で構築すれば、最新の技術を随時、取り入れられるようになる」とウルシステムズの野上恭平シニアコンサルタントは話す。特にAWSの場合、「この3年で日本企業がデータ活用基盤の構築に採用できるサービスが圧倒的に増えてきた」（野上シニアコンサルタント）。

　3年前はストレージサービスの「S3」と、DWH（データウエアハウス）サービスのRedshiftを使う構成が一般的だった。それが今は、分散処理ツール「Hadoop」のマネージドサービスである「Amazon EMR」や、ストリームデータの処理を行う「Amazon Kinesis」などデータの処理や蓄積を支援するサービスが数多く登場している。

データ分析基盤を構築するクラウドの例

[画像のクリックで拡大表示]

　業務システムからのデータだけを収集するDWHであれば、一度構築したら5年以上は使い続けられた。データ活用基盤になった今、一度構築したらそのまま利用するのではなく、随時、新しいサービスや技術を取り込む姿勢が求められる。

ポイント2：製品選択はオープンに

　データ活用基盤は、非構造化データなど様々なデータを蓄積する目的で構築するデータレイクや、データレイクのデータを分析用に加工したり集約したりするETL（抽出・変換・ロード）など、複数のツールを組み合わせて構築する。

　データ活用基盤は相当の処理能が必要になるので、スケーラビリティが重要になる。スモールスタートで作ったデータ分析基盤は、稼働後に扱うデータ量やデータの種類がどんどん増えると想定される。業務システムのデータと違ってサイジングが難しい分、スケールアウトできる製品やサービスを選択したい。

　見落としがちなのは、サービス料金やソフトウエアのライセンス費用の体系だ。CPU単位で課金するソフトウエアをクラウドで採用している場合、スケールアウトすると右肩上がりでライセンス費用が上がる。構築時点の費用だけでなく、スケールアウトを前提にコストを考える必要がある。

この先は日経クロステック Active会員の登録が必要です

会員の方はこちら
ログイン
未登録の方はこちら
会員登録

日経クロステック Activeは、IT／製造／建設各分野にかかわる企業向け製品・サービスについて、選択や導入を支援する情報サイトです。製品・サービス情報、導入事例などのコンテンツを多数掲載しています。初めてご覧になる際には、会員登録（無料）をお願いいたします。

長持ちするデータ基盤、構築ノウハウは4点

ポイント1：スモールスタートで始める

ポイント2：製品選択はオープンに

この先は日経クロステック Active会員の登録が必要です

#データウエアハウス

どのようなことに困っていますか？データ利活用に関する意識調査

情報のサイロ化を解消しデータ分析活性化、ネット広告企業が見いだした解決策

大規模データ活用でETLに課題が！メガクラウドで使える「ELT」の魅力とは

なぜデータ連携が不要になるの？知っておきたい「レイクハウス」の仕組み

#データレイク

ミッションクリティカルの設計思想が息づいたデータ連携基盤「ACMS Apex」の実力

なぜデータ連携が不要になるの？知っておきたい「レイクハウス」の仕組み

CDPは他ツールとの重複にとらわれず、ビジネスインパクトで導入を判断せよ

IBMが「watsonx」の一般提供開始、基盤モデルを活用したAIの開発を支援

#EAI／ETL

ERP刷新だけだと40％の企業が失敗、成功に必要なB2B連携のポイント5選

次世代ERPにしても良さを生かせない！未然に防げる統合戦略ポイント3選

ミッションクリティカルの設計思想が息づいたデータ連携基盤「ACMS Apex」の実力

大規模データ活用でETLに課題が！メガクラウドで使える「ELT」の魅力とは

このコラムのバックナンバー

データ基盤の主役はOSS、オラクルやテラデータの選び方

「5年以上使い続ける」は時代遅れ、データ活用基盤の新常識

現行システムは限界に、盛り上がるデータ活用基盤の作り直し

ポイント1：スモールスタートで始める

ポイント2：製品選択はオープンに

この先は日経クロステック Active会員の登録が必要です

編集部イチ押しの資料（ホワイトペーパー）

なぜ生成AI時代にAPI管理が重要か？ 分断されたデータを自動的にまとめて活用

世界の通信キャリアがクラウド活用を加速！通信業界の最新ユースケースは

AI環境を自前でつくる：ベンダー4社が解説するインフラ構築のポイントとは？

ID／パスワード入力はもう要らない！これからのSSOの「新しいカタチ」とは

ビジネスプロセスをつなぎ、データをつなぐ 変革を支えるSAP BTPの魅力

バックオフィス系クラウドサービス増加で生じた新たな課題への解決策とは

#データウエアハウス

どのようなことに困っていますか？ データ利活用に関する意識調査

情報のサイロ化を解消しデータ分析活性化、ネット広告企業が見いだした解決策

大規模データ活用でETLに課題が！ メガクラウドで使える「ELT」の魅力とは

なぜデータ連携が不要になるの？ 知っておきたい「レイクハウス」の仕組み

#データレイク

ミッションクリティカルの設計思想が息づいたデータ連携基盤 「ACMS Apex」の実力

なぜデータ連携が不要になるの？ 知っておきたい「レイクハウス」の仕組み

CDPは他ツールとの重複にとらわれず、ビジネスインパクトで導入を判断せよ

IBMが「watsonx」の一般提供開始、基盤モデルを活用したAIの開発を支援

#EAI／ETL

ERP刷新だけだと40％の企業が失敗、成功に必要なB2B連携のポイント5選

次世代ERPにしても良さを生かせない！ 未然に防げる統合戦略ポイント3選

ミッションクリティカルの設計思想が息づいたデータ連携基盤 「ACMS Apex」の実力

大規模データ活用でETLに課題が！ メガクラウドで使える「ELT」の魅力とは

このコラムのバックナンバー

データ基盤の主役はOSS、オラクルやテラデータの選び方

「5年以上使い続ける」は時代遅れ、データ活用基盤の新常識

現行システムは限界に、盛り上がるデータ活用基盤の作り直し

なぜ生成AI時代にAPI管理が重要か？分断されたデータを自動的にまとめて活用

ビジネスプロセスをつなぎ、データをつなぐ変革を支えるSAP BTPの魅力

どのようなことに困っていますか？データ利活用に関する意識調査

大規模データ活用でETLに課題が！メガクラウドで使える「ELT」の魅力とは

なぜデータ連携が不要になるの？知っておきたい「レイクハウス」の仕組み

ミッションクリティカルの設計思想が息づいたデータ連携基盤「ACMS Apex」の実力

なぜデータ連携が不要になるの？知っておきたい「レイクハウス」の仕組み

次世代ERPにしても良さを生かせない！未然に防げる統合戦略ポイント3選

ミッションクリティカルの設計思想が息づいたデータ連携基盤「ACMS Apex」の実力

大規模データ活用でETLに課題が！メガクラウドで使える「ELT」の魅力とは