Hadoopって何がすごいの

リッテル

2012.03.12

　Hadoopは、普及品のPCサーバーを多数つなげて、莫大な情報を処理できるようにしたオープンソース・ソフトウエアです。Yahoo!やFacebookなどのWebサービスの開発者が多数、Hadoopの開発に参加していて、これらの企業によって実際に活用されています。

　本連載ではまず、いま熱い視線を集めているHadoopを実際に触っていくことで、Webサービスを支えている「大規模データ処理」を体験していきます。

　まず最初に、Hadoopとは何か、何が「うれしい」のか、を説明します。それには、「スケールアウト」という言葉の意味を知っておく必要があります。Hadoopのメリットは、スケールアウトの問題点を克服しているところにあるからです。

スケールアップとスケールアウト

　あなたが、企業のWebサーバーの管理者だったとしましょう。

　サーバーを立ち上げた当初は、Webサイトの訪問者も少なく、1台のPCで勤務時間内に余裕でアクセスログの集計処理を終えることができていました。しかし会社の規模が大きくなって、訪問者数が徐々に増えてきました。集計処理に長い時間がかかってしまい、勤務時間内には終わらなくなってしまいました。

　このような問題が起こったとき、あなたは以下のうちどちらを選びますか？

解決策(1) PCをより高性能なものに買い換える
解決策(2) 同程度のスペックのPCをもう1台買い増しする

　2番目の方法の場合、アクセスログを2つに分割、2台のPCで同じ集計プログラムを実行し、それぞれ得られた結果を最後に合算することになります。

　あなたがもし「楽をしたい」のなら、(1)が有利でしょう。(2)の方法は、アクセスログを分割したり、合算したりという余分な手間がかかってしまいます。

　でも、さらにアクセス数が増えていき、買い換えた新しいPCでも処理が間に合わなくなってきたとしたらどうでしょうか？　「そんなの簡単だよ。増えた利益でもっと高性能のPCを買えばいいんじゃない？」と思うかもしれません。

　しかし2倍の値段のPCを買えば、性能は2倍になるでしょうか？　2倍のコストをかけても、性能はせいぜい数割アップする程度ではないでしょうか。(1)の方法は、当面の解決策にはなりますが、そのうちコスト面で限界に達してしまいます。

　(1)の方法を「スケールアップ」、(2)の方法を「スケールアウト」と呼んでいます。処理の規模がどんどん拡大していくタスクについては、いかにスケールアウトさせるかを考えておくことが必要になります。

スケールアップとスケールアウト

あなたにお薦め

今日のピックアップ

常駐・SES・多重下請け全部やらない、大塚商会流「人手に頼らないSI」の極意

3年でセキュリティー投資額は2倍以上に、プロ人材を集め「先守後攻」貫く日清食品

ZOZOマリンスタジアムに現れたスマートゴミ箱、観客動員増続く千葉ロッテの追い風に

東芝系がリバースエンジニアリングに生成AIを活用、20万行の解析を倍速の3カ月で

IPv6とIPv4の混在期は当分続く、習得したい3つの「共存技術」

上司や顧客に言われた無理難題を部下や後輩に押し付けない方法

JavaScript使いこなしの鍵を握る関数、場合によって適した方式を見極める

開発時のCO2排出量は準備段階含む、NTT系・NEC・富士通・日立がルール策定

ビジネスメールを最低限の指示でパパッと、5つのAIサービスによる作文の「出来」

安くて便利な指紋認証リーダーを増設、ログインが簡単で素早く

タブの操作性はChromeとEdgeで同レベル、再表示やグループ化の機能が両方に

安さで選ぶと泣きを見る、将来性を重視するなら中級機以上のスマホがお薦め

注目記事

ID／パスワード入力はもう要らない！これからのSSOの「新しいカタチ」とは

AI環境を自前でつくる：ベンダー4社が解説するインフラ構築のポイントとは？

ビジネスプロセスをつなぎ、データをつなぐ 変革を支えるSAP BTPの魅力

なぜ生成AI時代にAPI管理が重要か？ 分断されたデータを自動的にまとめて活用

バックオフィス系クラウドサービス増加で生じた新たな課題への解決策とは

世界の通信キャリアがクラウド活用を加速！通信業界の最新ユースケースは

おすすめのセミナー

「仮説立案」実践講座

CIO養成講座 【第35期】

改革リーダーのコミュニケーション術

パワポ資料が見違える「ビジネス図解」4つのセオリー

間違いだらけの設計レビュー

オンライン版「なぜなぜ分析」演習付きセミナー実践編

問題解決のためのデータ分析活用入門

業務改革プロジェクトリーダー養成講座【第16期】

注目のイベント

プラチナフォーラム 2024 Spring

日経クロステックNEXT 関西 2024

日経ビジネスCEOカウンシル

VUCA時代に勝ち残る戦略的サプライチェーン構築に向けて

人手不足を乗り越える 日本の産業界成長のシナリオ2024

キャリア・オーナーシップが社会を変える

DX Insight 2024 Summer

WOMAN EXPO 2024

デジタル立国ジャパン2024

DIGITAL Foresight 2024 Summer

おすすめの書籍

ソフトバンク もう一つの顔 成長をけん引する課題解決のプロ集団

対立・抵抗を解消し合意に導く 改革リーダーのコミュニケーション術

もっと絞れる AWSコスト超削減術

優秀な人材が求める３つのこと 退職を前提とした組織運営と人材マネジメント

Web3の未解決問題

ロボット未来予測2033

日経BOOKプラスの新着記事

はじめに：『図解 木造住宅トラブルワースト20＋3 「雨漏り事故」「構造事故」の事例から学ぶ原因と対策』

はじめに：『美術館に行く前3時間で学べる 一気読み西洋美術史』

はじめに：『ジオストラテジクス マンガで読む地政学 世界の紛争・対立・協調がわかる』

東京・吉祥寺 街々書林 旅心を刺激する魅惑の本屋さん

田内学「お金自体には価値がない」 この問いはなぜ生まれたのか

マッキンゼーが分析 日本企業のM＆Aの傾向とこれから

はじめに：『ソフトバンク もう一つの顔 成長をけん引する課題解決のプロ集団』

もはやひとごとではない物語 石原壮一郎が選ぶ夫婦関係を見直す2冊

競馬・宝くじと比べれば明快 生命保険は行動経済学的に不合理

はじめに：『東京大改造2030 都心の景色を変える100の巨大プロジェクト』

日経クロステック Special

What's New

経営

クラウド

アプリケーション／DB／ミドルウエア

運用管理

サーバー／ストレージ

クライアント／OA機器

ネットワーク／通信サービス

セキュリティ

この機能は会員登録（無料）で使えるようになります

フォロー連載・特集

設定

ビジネスプロセスをつなぎ、データをつなぐ変革を支えるSAP BTPの魅力

なぜ生成AI時代にAPI管理が重要か？分断されたデータを自動的にまとめて活用

CIO養成講座【第35期】

人手不足を乗り越える日本の産業界成長のシナリオ2024

ソフトバンクもう一つの顔　成長をけん引する課題解決のプロ集団

対立・抵抗を解消し合意に導く　改革リーダーのコミュニケーション術

もっと絞れる　AWSコスト超削減術

優秀な人材が求める３つのこと　退職を前提とした組織運営と人材マネジメント

はじめに：『図解木造住宅トラブルワースト20＋3　「雨漏り事故」「構造事故」の事例から学ぶ原因と対策』

はじめに：『美術館に行く前3時間で学べる　一気読み西洋美術史』

はじめに：『ジオストラテジクス　マンガで読む地政学　世界の紛争・対立・協調がわかる』

東京・吉祥寺　街々書林　旅心を刺激する魅惑の本屋さん

田内学「お金自体には価値がない」　この問いはなぜ生まれたのか

マッキンゼーが分析　日本企業のM＆Aの傾向とこれから

はじめに：『ソフトバンクもう一つの顔　成長をけん引する課題解決のプロ集団』

もはやひとごとではない物語　石原壮一郎が選ぶ夫婦関係を見直す2冊

競馬・宝くじと比べれば明快　生命保険は行動経済学的に不合理

はじめに：『東京大改造2030　都心の景色を変える100の巨大プロジェクト』