データ基盤の主役はOSS、オラクルやテラデータの選び方

島田優子＝日経 xTECH／日経SYSTEMS

2018.08.24

出典：日経 xTECH、2018年 7月 5日
（記事は執筆時の情報に基づいており、現在では異なる場合があります）

　データ活用基盤を構築する際にどのソフトを利用するのか。OSS（オープンソースソフトウエア）やクラウドの普及により、選択肢は増えている。選択時に知っておきたいポイントをまとめた。

　「データ活用基盤に関わるエンジニアには、目利きが求められている」。NTTデータの村山弘城ビジネスソリューション事業本部 AI＆IoTビジネス部ソリューションセンタ課長はこう強調する。データ分析基盤の構築には、クラウドサービスやOSSを採用して構築するのが当たり前になっている。

　一方で業務システムのトランザクションデータの処理のみを想定した従来のDWH（データウエアハウス）では、DWHに最適化したアプライアンスを利用したり、RDBMSを用いたりするのが一般的だった。米テラデータ（Teradata）や米オラクル（Oracle）などの専業ベンダーは、ハードウエアの力を活用して大容量のデータを検索・分析するアプライアンスを販売。DWHを構築したいユーザーやITエンジニアは、DWH向けに用意された製品の中から要件やコストに合致したシステムを選択するのが当たり前だった。

　ところが今、データ活用基盤構築の主役がクラウドサービスやOSSに移り、多くの選択肢が登場している。非構造化データを格納するソフトウエアだけでも、OSSの分散処理ツール「Hadoop」やNoSQLデータベース（DB）である「Cassandra」、「Redis」など、複数の候補が挙がる。

　Hadoopひとつとっても導入方法や選択肢は多岐にわたる。OSSのHadoopをオンプレミス環境に導入するのか、AWSや米Google、米Microsoftなどが提供するマネージドサービスを選ぶのか、それともHadoopにサポートや可用性を高めるソフトウエアなどを付けた商用製品を使うのか。システムの運用体制やコスト、将来的なデータ量などを踏まえて選ぶ必要がある。

データ活用基盤を構築するための主な製品やサービス

[画像のクリックで拡大表示]

周辺ソフトの充実で使いやすく

　データ活用基盤の構築に向け製品やサービスを選ぶ際に、注目すべき動きが3つある。OSSの充実、従来型DWHベンダーのOSSサポートの拡充、そしてETL製品の進化だ。

　1つめのOSSの充実では、Hadoopを中心に、様々なソフトウエアが登場している。

　頻繁に利用されるのが、「Hive」や「Spark」だ。HiveはSQLを使ってHadoopに格納したデータの検索・分析を可能にするソフトだ。Sparkは分散処理の高速化を支援する。「一般企業での導入は余り進んでいなかったHadoopだが、SQLが利用可能になるなど、利用環境が整ってきたことで導入が進み始めている」と伊藤忠テクノソリューションズ（CTC）の小塚剛流通・EPビジネス企画室プロダクトビジネス推進部プロダクトビジネス推進第3課主任は話す。

　こうしたHadoopを中心にしたデータ活用基盤の構築に使える主要なOSSを、AWSや米Google、米Microsoftなどがマネージドサービスとして提供している。こうしたマネージドサービスを利用すれば、運用の手間が省けるメリットを得られる。

　最近では「一般企業の導入が増えてきて、GUIによる管理画面が必要であったり、サポートが必要だったりする。そのため商用版のHadoopを利用するケースも増えている」（CTCの小塚主任）という。Hadoopの商用版は、米クラウデラ（Cloudera）や米ホートンワークス（Hortonworks）、米マップアール・テクノロジーズ（MapR Technologies）などが提供している。

　マップアール・テクノロジーズの「MapRコンバージド・データ・プラットフォーム」の場合、分散ファイルシステムとして、Hadoopの「HDFS」を利用するのではなく、マップアール・テクノロジーズの独自製品を提供している。「処理速度を上げたり、耐障害性を高めたりするためだ」とマップアール・テクノロジーズの板垣輝広ソリューションエンジニアは説明する。

この先は日経クロステック Active会員の登録が必要です

会員の方はこちら
ログイン
未登録の方はこちら
会員登録

日経クロステック Activeは、IT／製造／建設各分野にかかわる企業向け製品・サービスについて、選択や導入を支援する情報サイトです。製品・サービス情報、導入事例などのコンテンツを多数掲載しています。初めてご覧になる際には、会員登録（無料）をお願いいたします。

データ基盤の主役はOSS、オラクルやテラデータの選び方

周辺ソフトの充実で使いやすく

この先は日経クロステック Active会員の登録が必要です

#データウエアハウス

どのようなことに困っていますか？データ利活用に関する意識調査

情報のサイロ化を解消しデータ分析活性化、ネット広告企業が見いだした解決策

大規模データ活用でETLに課題が！メガクラウドで使える「ELT」の魅力とは

なぜデータ連携が不要になるの？知っておきたい「レイクハウス」の仕組み

#データレイク

ミッションクリティカルの設計思想が息づいたデータ連携基盤「ACMS Apex」の実力

なぜデータ連携が不要になるの？知っておきたい「レイクハウス」の仕組み

CDPは他ツールとの重複にとらわれず、ビジネスインパクトで導入を判断せよ

IBMが「watsonx」の一般提供開始、基盤モデルを活用したAIの開発を支援

#EAI／ETL

ERP刷新だけだと40％の企業が失敗、成功に必要なB2B連携のポイント5選

次世代ERPにしても良さを生かせない！未然に防げる統合戦略ポイント3選

ミッションクリティカルの設計思想が息づいたデータ連携基盤「ACMS Apex」の実力

大規模データ活用でETLに課題が！メガクラウドで使える「ELT」の魅力とは

このコラムのバックナンバー

長持ちするデータ基盤、構築ノウハウは4点

「5年以上使い続ける」は時代遅れ、データ活用基盤の新常識

現行システムは限界に、盛り上がるデータ活用基盤の作り直し

周辺ソフトの充実で使いやすく

この先は日経クロステック Active会員の登録が必要です

編集部イチ押しの資料（ホワイトペーパー）

なぜ生成AI時代にAPI管理が重要か？ 分断されたデータを自動的にまとめて活用

世界の通信キャリアがクラウド活用を加速！通信業界の最新ユースケースは

AI環境を自前でつくる：ベンダー4社が解説するインフラ構築のポイントとは？

ID／パスワード入力はもう要らない！これからのSSOの「新しいカタチ」とは

ビジネスプロセスをつなぎ、データをつなぐ 変革を支えるSAP BTPの魅力

バックオフィス系クラウドサービス増加で生じた新たな課題への解決策とは

#データウエアハウス

どのようなことに困っていますか？ データ利活用に関する意識調査

情報のサイロ化を解消しデータ分析活性化、ネット広告企業が見いだした解決策

大規模データ活用でETLに課題が！ メガクラウドで使える「ELT」の魅力とは

なぜデータ連携が不要になるの？ 知っておきたい「レイクハウス」の仕組み

#データレイク

ミッションクリティカルの設計思想が息づいたデータ連携基盤 「ACMS Apex」の実力

なぜデータ連携が不要になるの？ 知っておきたい「レイクハウス」の仕組み

CDPは他ツールとの重複にとらわれず、ビジネスインパクトで導入を判断せよ

IBMが「watsonx」の一般提供開始、基盤モデルを活用したAIの開発を支援

#EAI／ETL

ERP刷新だけだと40％の企業が失敗、成功に必要なB2B連携のポイント5選

次世代ERPにしても良さを生かせない！ 未然に防げる統合戦略ポイント3選

ミッションクリティカルの設計思想が息づいたデータ連携基盤 「ACMS Apex」の実力

大規模データ活用でETLに課題が！ メガクラウドで使える「ELT」の魅力とは

このコラムのバックナンバー

長持ちするデータ基盤、構築ノウハウは4点

「5年以上使い続ける」は時代遅れ、データ活用基盤の新常識

現行システムは限界に、盛り上がるデータ活用基盤の作り直し

なぜ生成AI時代にAPI管理が重要か？分断されたデータを自動的にまとめて活用

ビジネスプロセスをつなぎ、データをつなぐ変革を支えるSAP BTPの魅力

どのようなことに困っていますか？データ利活用に関する意識調査

大規模データ活用でETLに課題が！メガクラウドで使える「ELT」の魅力とは

なぜデータ連携が不要になるの？知っておきたい「レイクハウス」の仕組み

ミッションクリティカルの設計思想が息づいたデータ連携基盤「ACMS Apex」の実力

なぜデータ連携が不要になるの？知っておきたい「レイクハウス」の仕組み

次世代ERPにしても良さを生かせない！未然に防げる統合戦略ポイント3選

ミッションクリティカルの設計思想が息づいたデータ連携基盤「ACMS Apex」の実力

大規模データ活用でETLに課題が！メガクラウドで使える「ELT」の魅力とは