2012年出展のご案内
こちら

雲の中をのぞいてみよう

ITpro

[分散処理]処理を高速化する唯一の解

2008/11/04
中田 敦=日経コンピュータ,島田 昇=日経コミュニケーション
出典:ITpro Magazine Vol.2  pp.43-45
(記事は執筆時の情報に基づいており、現在では異なる場合があります)

 PCサーバー用の3.5インチHDDの回転数が,現時点で最高の1万5000回転/分に達したのは2001年のことだ。またIntel製プロセッサの動作周波数の最高記録は,2004年11月に発売されたPentium 4の「3.8GHz」であった。PCサーバーの各構成要素の単体性能は,長らく頭打ちの状況にある。

 クラウド・コンピューティングでは,データ処理の大規模化,高速化が必須だ。だが,単体ハードウエアの性能向上はあまり期待できない。そこで,プロセシングやデータのI/O処理をネットワーク経由で大量のPCサーバーに分散させ,処理の並列度を高めることが必要になる。

 クラウドの主要プレーヤは,大規模分散データ処理技術の開発にしのぎを削っている。先行しているのがGoogle。分散処理に特化したストレージ技術「GFS(Google File System)」や,分散メッセージ処理技術「Map Reduce」を開発した(図4)。

図4●主な分散処理技術とその開発企業や利用企業
[画像のクリックで拡大表示]

 GFSでは,ファイルは64Mバイトのブロック(チャンク)に分割され,3台のサーバーに重複保存される。この3台の組み合わせは一定ではない。つまり,1個のファイルが最低でも数十台のサーバーに重複して並列保存されるのだ。こうして,データI/Oの高速化と冗長化を図っている。分散保存されているデータをつなぎ合わせて処理するのがMapReduceの役割となる。

 GFSやMapReduceは「Hadoop」として,オープンソース化されており,Yahoo!や楽天も使用している。楽天では2008年に,新しい商品レコメンド・エンジン(ある商品に対するお勧めの商品を,ユーザーの購買データを基にリストアップする機能)を,Hadoopベースで開発した。

 楽天技術研究所の森正弥所長は「Hadoopの良いところは,サーバーを追加した分だけ,処理能力がリニア(線形関数的)に増加するところ」と,分散処理技術の効用を語る。楽天では,独自の分散ストレージ技術「Roma」と分散処理技術「Fairy」を開発中だ。両ソフトウエアとも,オープンソースとして公開する予定だという。

この記事に対する読者コメント

コメントに関する諸注意 投稿 一覧 
ITpro EXPO on Twitter
ITpro EXPO on facebook
ITpro Magazine 2011
ITpro Magazine  ITproは10月3日、ITpro EXPO 2011に事前登録した方への特典として、スマートフォンで読む電子雑誌「ITpro Magazine EXPO版 2011年秋号」を発行した。「スマートフォン分析」「サイバー犯罪」の2大特集のほか、インタビュー、コラム、そしてITpro EXPO 展示会を楽しみ尽くすためのコンテンツが盛りだくさんな内容となっている。
詳細はこちら
ITpro EXPO AWARD
ITpro EXPO AWARD 2010 受賞製品/サービス  ITpro EXPO AWARD 2011は、ITpro EXPO 2011に出展されるすべての製品/サービスを対象として、日経BP社が発行するIT/ネットワーク誌、Webメディアの編集部が取材・審査し、優れた製品/サービスを表彰するものです。
詳細はこちら

協力メディア

日経コンピュータ 日経コミュニケーション 日経SYSTEMS 日経情報ストラテジー 日経NETWORK 日経ソフトウエア 日経Linux 日経ニューメディア ITpro