米ScaleMPは、複数のPCサーバーを束ねたクラスターを単一のSMP(対称型マルチプロセッシング)サーバーとして利用できるようにする基盤ソフト「vSMP Foundation」を開発しているベンダーである(関連記事)。vSMP Foundationは、大量のメモリーを使った計算処理を安価に実現できるので、多くの場面で分散処理がいらなくなる、としている。ITproは、同社の出資者で社長兼CEOのShai Fultheim氏に、SMPクラスターの意義を聞いた。

(聞き手は日川 佳三=ITpro


企業におけるSMPクラスターの意義は。

米ScaleMPの出資者で、社長兼CEOのShai Fultheim氏
米ScaleMPの出資者で、社長兼CEOのShai Fultheim氏

 「ビッグデータを安価に分析できる」---。これがSMPクラスターの意義だ。

 分散処理は、そこそこ安いが、使いにくい。巨大なSMPマシンは、使いやすいが、高い。その点、SMPクラスターは、非常に安くて、使いやすい。

 分散処理(Hadoopやサーバー内蔵フラッシュストレージ)は、かつてのSMPマシンを置き換えた。そして今、SMPクラスターは分散処理を置き換える。

背景を詳しく説明してほしい。

 企業の目下の課題はビッグデータだ。分析しなければならないデータが急増している。一方で、サーバーの処理能力は「ムーアの法則」程度にしか増えない。データの増え方がサーバー能力を置き去りにしている。

 では、どうすればいいのか。

 解決策の一つはスケールアップだ。これまでよりも巨大なメモリー空間とCPU能力を持った巨大なSMPサーバーに切り替えるのだ。

 だが、スケールアップには大きな問題があった。費用が高いのだ。サーバー機は、CPUソケット数(関連してメモリー容量)が増えると、指数関数的に価格が上がる。8ソケットのサーバー機は2ソケットのサーバー機の4倍の価格では済まない。

 巨大なSMPサーバーを代替する解決策として広まったのが、サーバーのランクを上げることなく、「分析するデータの方を変えてしまう」というアプローチだ。つまり、スケールアウトだ。データを細かく分割し、分散処理させる。実際に、多くの企業で、データの分析にHadoopが使われている。

 だが、スケールアウトにも問題がある。データを分割して分析対象のデータを用意しなければならない。いつも使っているRDBMS(リレーショナルデータベース管理システム)のテーブルをそのまま利用できない。さらに、クラスターの運用管理も難しい。

 こうした問題を解決する新しい解決策が、SMPクラスターだ。SMPクラスターは、言うならば「安価に購入できる巨大な1台のワークステーション」だ。分散処理クラスターのアプローチとの違いは「データを変えるのではなく、サーバーの方を変える」ということだ。

サーバーをどのように変えるのか。

 SMPクラスターは、巨大な1台のワークステーションを安価に作り上げる技術だ。安価なPCサーバーを束ねてクラスターを組むだけで、あたかも巨大な1台のワークステーションであるかのように使うことができる。SMPサーバー(費用が指数関数的に増えるサーバー)を、分散処理クラスター(費用がリニアにしか増えないサーバー)のように安価に調達できる。

 SMPクラスターは、SMPサーバーよりも安いというだけでなく、実は分散処理クラスターよりも安くつく。分散処理は、データの加工やクラスターの運用管理にコストがかかるが、それだけではない。ハードウエアの導入費用も、SMPクラスターの方が、分散処理クラスターよりも安い。

 分散処理のクラスターよりも安い、とは、どういうことか。

 分散処理では、安価なPCサーバーに対して、データの処理を割り振ることができる。ところが、安価なPCサーバーに搭載できるメインメモリーの量は少ない。このため、ビッグデータ分析では、メインメモリー上ではなくストレージ上にデータを置かざるを得ない。

 目を覚ましてほしい。メインメモリーは、実はフラッシュストレージよりも安いのだ。分散処理でよく使われる米Fusion-ioのPCI接続型フラッシュストレージの販売価格は、容量2.4TバイトのMLCタイプで400万円を超える。一方、メインメモリーは16Gバイト当たり1万数千円程度だ。

 つまり、ストレージI/Oの性能が要求されるようなケース(ハードディスクでは遅過ぎるケース)においては、最初からデータをメインメモリー上に置いておく方が安い。安価なPCサーバーを使いながら、ストレージと同じくらいの大容量のメモリー空間を扱うことができれば、これが一番よい。

 「メモリー空間を安価に増やすことができる」---。現在では、このようにvSMP Foundationのメリットをアピールしている。最新バージョンのvSMP Foundation 5.1(2013年6月に出荷)では、メモリー拡張機能をさらに高めた。具体的には、CPU数を増やすことなくメインメモリーだけを増やせるメモリー専用ノードを利用できるようにした。新版ではまた、フリー版「vSMP Foundation Free」も用意した。