ビッグデータ分析などで大量の電力を使うITインフラを、電力料金が安い海外に設置する動きが出てきた。ヤフーは日本の約6分の1という安さの電力を求め、サーバー1400台で構成する大規模なデータ分析基盤を米国ワシントン州で稼働させた。2017年10月、同社が導入するサーバーの技術検証や設計を支援した伊藤忠テクノソリューションズ(CTC)の発表で明らかになった。

 ヤフーは同州に設置したデータセンターを2015年からコンテンツのバックアップやサービスの開発環境として本格利用したところ、想定通りの電力削減効果を得られたため、使用する電力が大きいデータ分析基盤ではさらに大きい効果が得られると判断した。消費者にニュースやショッピングなどのサービスを提供するサーバーは引き続き国内の複数のデータセンターに置く。データ分析基盤は遅延時間が多少長くなってもほとんど影響がないため海外に置きやすいと考えた。

 サーバー1400台で構成するデータ分析基盤は、ヤフーの米国子会社であるアクタピオ(Actapio。2017年9月にYJ Americaから社名変更)が所有するデータセンターに設置し、2017年夏に稼働した。データセンターの電力容量は最大2.4メガワット。この地域は、コロンビア川の豊富な流量を生かした水力発電が盛んで、米国の中でも電力料金が安い地域として知られている。電力料金は1kWh当たり2.5セント程度と、国内の約6分の1の水準だ。

ヤフーが導入したOCP仕様のサーバー
ヤフーが導入したOCP仕様のサーバー
(出所:ヤフー)
[画像のクリックで拡大表示]

Open Compute Project仕様のサーバーやラックを採用

 1400台のサーバーは約40ラック構成で、主に分散処理ミドルウエア「Hadoop」を使ったデータ分析基盤として利用する。データセンター用ハードウエアの設計図を公開する米Open Compute Project(OCP)の仕様に沿ったサーバーやラック、電源装置を使う。OCPを始めた米フェイスブックと同じサーバーを採用したことで、保守にかかる人件費やサーバーの故障率を低く抑えられると見込む。CTCが技術検証や設計を支援したほか、ハードウエアの調達や運用段階の保守を担当する。サーバーや電源装置をラックに組み込んだうえで納入している。

 ヤフーの宮坂学社長は「2017年度以降は領域を超えたデータの活用で事業を伸ばす『データドリブン化』を推進する」と話す。サービスの競争力向上をめざし、Webの検索履歴を基にショッピングサイトで商品を推奨するといったサービス横断型のデータ分析を推進している。ディープラーニング(深層学習)などの技術を活用した新しい手法で記事を推奨して利用者の滞在時間を延ばすことにも成功した。新しいデータ分析基盤で、こうしたデータ活用をさらに推進する。アクタピオの松谷氏は「いずれは消費者にコンテンツを配信するサーバーよりもデータ分析に使うサーバーの方が多くなるだろう」と話す。