背景写真:Getty Images
背景写真:Getty Images

スマートフォン向けプロセッサで95%超のシェアを誇る半導体設計大手の英アームがエンタープライズ分野に再挑戦する。米インテルの盟友として「Wintel」の時代を築いた米マイクロソフトと米ヒューレット・パッカード・エンタープライズというソフトウエアとサーバーの世界最大手と組んでインテルの牙城に攻め込む。サーバー市場でのシェアを現在のほぼゼロから4年後の2021年までに25%まで引き上げる狙いだ。アームとインテルの「AI戦争」の号砲が鳴った。

 米ヒューレット・パッカード・エンタープライズ(HPE)と米マイクロソフト――。エンタープライズ向けプロセッサ市場の王者インテルと長年にわたり盟友関係にあったIT大手2社が「ARMサーバー」の採用に動き出した。ARMサーバーは英アームが設計した仕様に基づき製造されたCPUを載せたサーバーを指す。

 マイクロソフトとインテルの蜜月関係は1990年代には「Wintel」と呼ばれ、マイクロソフトはインテルによるPCとサーバー用のプロセッサ市場の寡占に大きく貢献した。HPEは旧HPの時代に64ビット版プロセッサ「Itanium」をインテルと共同開発。大型サーバーからPCまでインテル製プロセッサを搭載した数々の製品を世界で製造・販売してきた。そんな2社がARMサーバーの採用を相次ぎ公表した。

 HPEは2017年5月16日(米国時間)、社運を賭けて開発中の新型コンピュータ「The Machine」のプロトタイプ(試作機)を公表し、ファブレス半導体メーカーである米カビウムのARMサーバー用SoC(システム・オン・ア・チップ)「ThunderX2」の採用を明らかにした。プロトタイプは160テラバイト(TB)ものメモリーを「単一のメモリー」として管理できるのが特徴だ。40台の物理ノード(コンピュータ)が光ケーブルでつながり、各ノードのプロセッサは他ノードのメモリーを自ノードのメモリーと同じように扱える。

 従来のクラスター構成では各ノードのプロセッサが自ノードのメモリーを管理していたため、他ノードのメモリーにアクセスする際には、各ノードのプロセッサを介する必要があった。

 The Machineはシステムの中心に巨大なメモリーを備え、各プロセッサがそれを共有する。HPEが「メモリー駆動コンピューティング(Memory-Driven Computing)」と呼ぶ新たなコンセプトである。今のコンピュータの中心はプロセッサだが、HPEはプロセッサとメモリーの関係を逆転させる考え。サーバー世界最大手のHPEが数年がかりで開発する新型機の中核にARMの技術を採用するインパクトは小さくない。

 The Machineはプロセッサとメモリー、ストレージを共通の高速インタフェースでつなぐ。HPEは高速インタフェースを独自に開発しているが、その仕様は「Gen-Zコンソーシアム」を通じて他社と共通化し業界標準を狙う。同コンソーシアムはプロセッサやメモリーをノードをまたいでつなぐ「ファブリック」の仕様を共同開発する団体だ。

米ヒューレット・パッカード・エンタープライズ(HPE)が公開した「The Machine」のプロトタイプ。米カビウムのサーバー用ARMプロセッサを搭載(写真提供:米HPE)
米ヒューレット・パッカード・エンタープライズ(HPE)が公開した「The Machine」のプロトタイプ。米カビウムのサーバー用ARMプロセッサを搭載(写真提供:米HPE)
[画像のクリックで拡大表示]

「インテル以外」の世界大手と陣営

 HPEやアーム、カビウムのほか米AMD(アドバンスト・マイクロ・デバイセズ)や米クレイ、米デルテクノロジーズ、中国ファーウェイ(華為技術)、米IBM、中国レノボ、米マイクロン、韓国サムスン電子、米シーゲイト・テクノロジー、韓国SKハイニックス、米ウェスタンデジタル、米ザイリンクスが参加する。言い換えると「インテル以外」の主なプロセッサメーカーやサーバーメーカー、メモリーメーカー、ストレージメーカーがファブリック仕様を共通化しようとしている。

 HPEは製品版でどの企業が開発したプロセッサを採用するか明言していない。ただThe Machineの肝がGen-Z仕様の高速ファブリックにあるのなら、製品版でもARMプロセッサが採用される可能性は高い。

 マイクロソフトも2017年3月に開催した「OCP Summit 2017」で、自社開発したARMサーバーを公表した。OCPとはサーバーなどの仕様をオープンソースとして公開する団体、米オープン・コンピュート・プロジェクトだ。マイクロソフトはアームの技術に基づくサーバー用の「ARMプロセッサ」を搭載したマザーボードを2種類発表した。

 一つは米クアルコム製のサーバー用ARMプロセッサ「Centriq 2400」を搭載したもの。Centriq 2400はプロセッサコアを48個搭載する。このマザーボードはマイクロソフトが開発し、OCPで仕様を公開したラックマウントサーバー「プロジェクトオリンポス」に搭載できる。

 もう一つはカビウムのThunderX2を搭載。このマザーボードを搭載したサーバーを台湾のサーバーメーカーであるインベンテック(英業達集団)が製品化する計画だ。

図 ARMサーバーの主なプレイヤー
7社以上がサーバー用ARMプロセッサを製造へ
図 ARMサーバーの主なプレイヤー
[画像のクリックで拡大表示]

MSはWindowsを移植

 マイクロソフトはARMサーバーの性能を検証するためにサーバーOS「Windows Server」をARMプロセッサ向けに移植した。ARM版のWindows Serverは社内検証用で、外部に公開していない。だがクラウドサービス「Microsoft Azure」の上級エンジニアであるリンデルト・ヴァン・ドーン氏は「マイクロソフトのクラウドサービスでARMサーバーを展開する計画がある」と明言している。

 ドーン氏はARMサーバーの用途について「特に検索やインデックス生成、ストレージ、データベース、ビッグデータ、機械学習といったクラウドアプリケーションに有用だ」と述べる。半導体の集積度が約2年で倍増する「ムーアの法則」が終焉を迎えようとするなか、ARMプロセッサはスマートフォン向けに大きな需要が見込めることからプロセッサメーカーの数が増えている。「サーバーの選択肢の『カンブリア爆発』が起きている」(ドーン氏)とみた。

 ドーン氏はARMサーバーを採用した理由と今後の期待として3点を挙げる。第一に様々なプロセッサメーカーによるサーバー用ARMプロセッサの開発が盛んで、プロセッサコアやスレッド数、キャッシュメモリー、アクセラレーターなどの選択肢が増えていること。第二にARMプロセッサに関連するソフトウエアのエコシステムが既に存在していること、第三にARMプロセッサの命令セットアーキテクチャー(ISA)が「アウト・オブ・オーダー実行」など性能を高める手法を採用することで、性能の改善が見込まれることだ。

米マイクロソフトが開発した米クアルコムのプロセッサを搭載するARMサーバー(写真提供:米マイクロソフト)
米マイクロソフトが開発した米クアルコムのプロセッサを搭載するARMサーバー(写真提供:米マイクロソフト)
[画像のクリックで拡大表示]

6年前のリベンジなるか

 ARMサーバーは2011年ごろにもIT業界の注目を集めたことがあった。当時の主役はスタートアップ企業の米カルゼーダ。1億3000万ドルもの資金を調達してサーバー用ARMプロセッサを独自開発していた。しかし当時のARMアーキテクチャーは、サーバーに向かない32ビット対応しか無かったこともあり、普及しなかった。カルゼーダは2014年1月に経営破綻している。

 HPEやマイクロソフトとの動きは、ARMサーバーの「リベンジ」でもある。6年前と異なるのは、サーバーに適した64ビットのARMアーキテクチャーが既に存在すること。さらにサーバー用のARMプロセッサを開発するメーカーだけでも大手を含め既に7社あるなど、ARMサーバーの「エコシステム」が順調に育っている点も大きい。マイクロソフトも選択肢の多さを評価している。リベンジが成功する条件は整いつつある。

「Mac」は既にARM搭載

 2017年下期にはPC分野でのリベンジも始まる。クアルコム製のARMプロセッサ「Snapdragon 835」を搭載した「Windows 10」PCが登場する予定だ。マイクロソフトは2012年にARMプロセッサを搭載したWindowsタブレット「Surface」を発売していた。しかしこの時の搭載OSは「Windows RT」。同OSが「Windowsストアアプリ」にしか対応しておらず、既存の「Win 32アプリ」を動かせないという問題があったため、売れ行きはよくなかった。

 2017年下期に登場する「Windows 10 on ARM」PCはインテル仕様のプロセッサ(IAプロセッサ)をエミュレーションする機能を備えているため、既存のPC向けWin 32アプリを使える。さらに省電力性に優れたARMプロセッサの採用により、バッテリー駆動時間の大幅な改善が見込めるとしている。既存のWindows 10搭載PCと同じデバイスドライバも搭載しており、既存の周辺機器の多くが利用できる見通しだ。

 2006年に「PowerPC」からIAプロセッサに移行した米アップルのPC「Mac」も、ARMプロセッサへの移行の噂が絶えない。アップルは2016年に発売した「MacBook Pro」の一部のモデルにARMプロセッサを搭載済みだ。ファンクションキーをタッチパネルに置き換えた「TouchBar」の処理を、アップルが独自開発したARMプロセッサが既に担っている。しばらくはIAプロセッサとARMプロセッサの両方を搭載し、ARMプロセッサが担う処理を徐々に増やすシナリオがあり得そうだ。

グーグル、エヌビディア… ライバルはインテル以外にも

 データセンター分野への進出をたくらむアームだが、その道のりは険しい。ディープラーニング(深層学習)の活用が拡大し、GPU(グラフィックス処理プロセッサ)や深層学習専用チップなどの新たなプロセッサが台頭しているからだ。演算処理(コンピューティング)をほぼ独占していたインテルに加えて、米グーグルなど新たなライバルが現れた。

 GPUや深層学習専用チップの強みは、特定の用途に特化することで圧倒的に高い性能を発揮できる点にある。米グーグルが2017年5月に発表した「Cloud TPU」は深層学習専用チップ「TPU(テンサー・プロセッシング・ユニット)」の第2世代で、1枚のボードにプロセッサを4個搭載する。この1枚が1秒間にこなせる演算回数は180兆回、つまり処理性能は180テラFlopsだ。さらに64枚のCloud TPUを独自の高速ネットワークで接続して「TPUポッド」を構成すると、演算回数は約64倍の11.5ペタ(1万1500テラ)Flops、つまり1秒当たり1京(1兆の1万倍)回を超える。

 理化学研究所のスーパーコンピュータ「京」は1秒間に1京回の演算ができることから京と名付けられた。つまり10ペタFlopsである。京の10ペタFlopsは「倍精度」の浮動小数点演算での数字だ。Cloud TPUの浮動小数点演算の精度は不明であるものの、1秒当たりの演算回数だけで比べるなら8万個のプロセッサによって構成する京を1個のTPUポッドが上回ることになる。

 第1世代のTPUは画像認識などの「推論」にのみ対応していたが、第2世代ではビッグデータからモデルを構築する「学習」にも対応する。

 グーグルがTPUの自社開発を決断したのは2013年のことだ。深層学習の利用が社内で本格化したことから、深層学習に必要なコンピュータ資源の所要量を見積もったところ、数百万台のサーバーを擁するとされるグーグルの全データセンターの2倍に相当する計算能力が早期に必要となることが判明した。

 そこで同社はわずか1年3カ月の開発期間で第1世代のTPUを完成させ、その1年後に第2世代を作り出した。グーグルはTPUによって数十万~数百万台分のサーバー投資を節約したことになる。

 GPU最大手の米エヌビディアも2017年5月に深層学習に特化したGPU「Tesla V100」を発表した。1秒間に120兆回(120テラFlops)の演算が可能で、その性能は「CPUの数百個分」に相当すると主張した。

 エヌビディアはアームの親会社であるソフトバンクグループが40億ドル(約4500億円)を出資したとの報道があるほか、ARMアーキテクチャーを採用したSoCを販売しているが、AI用半導体ではアームとライバル関係にある。

「Cloud TPU」を発表するグーグルのスンダー・ピチャイCEO
「Cloud TPU」を発表するグーグルのスンダー・ピチャイCEO
[画像のクリックで拡大表示]

「水平分業」に徹する強み

 HPEやマイクロソフトなど世界の名だたるIT企業を味方につけてインテルの牙城に攻め入るアームの強みは「水平分業」に徹してきたことに尽きる。

 アームはCPUコア(ARM7/9/11、Cortex-A/M/R)やGPUコア(Mali)などの回路設計図や命令セットのライセンスをチップベンダーに提供する事業に特化してきた。チップ全体の設計や製造には踏み込まない。チップベンダーやIT企業にとって、アームはパートナーであり、競合にはならない。

 自らは黒子に徹してARMアーキテクチャーの仲間を集め、エコシステムを形成した。IoT関連のスタートアップ企業Cerevo(セレボ)の岩佐琢磨CEOは「AndroidなどLinuxベースのOSが動き、多くのSoCベンダーが参入しているためチップの調達が容易。IoTのスタートアップにとって、アームのCPUを使わない選択肢はない」と断言する。

 アームは1990年代以降、主に携帯電話機向けにCPUコアを提供。その後、スマートフォンや車載機器、IoT(インターネット・オブ・シングズ)機器へと適用範囲を広げた。

 SoCベンダーはCPUコアの開発をアームに委ねることで、周辺回路や開発キットなどの領域に開発リソースを集中。その領域で激しい競争を繰り広げることで、アームの技術をベースとした強固なエコシステムが育った。「SoCベンダーは世界で1年間に100社が生まれ、うち10社は大手に買収され、残りは消える。競争を通じて、様々なIoT機器の特性にあった多様なSoCが開発され、入手できるようになった」(セレボの岩佐CEO)。

図 ARMコアのシリーズ別チップ出荷数と主な用途
IoT機器向けに急成長中(出所:英アームの資料を基に本誌作成)
図 ARMコアのシリーズ別チップ出荷数と主な用途
[画像のクリックで拡大表示]

「Dockerが使えるのが魅力」

 オープンソースソフト(OSS)のARM対応も進んできた。推進役は2010年にアームがチップベンダーなどと新設した団体「Linaro」だ。「ARM上でも、(OSSの仮想化関連技術の)Dockerのようなサーバー向け技術がサポートされているのが魅力」。2016年12月にARMサーバーを使ってクラウドサービスを始めた米パケットのザッカリー・スミスCEOはこう話す。パケットは顧客が物理サーバーを専有できる「ベアメタル」に強みを持つ。

 「今後は(IoT機器に近い)エッジデバイスとサーバーの双方で、同一のARMコンテナを動かせるようになる。エッジとクラウドが容易に連携しながら負荷を分担できるようになるだろう」とスミスCEOは期待を寄せる。

 水平分業と並ぶもう一つの強みがアームにはある。それは、数年先の技術トレンドや需要を予測し、必要な技術を用意しておく研究開発体制だ(囲み記事「ソフトバンク孫社長は「水晶玉」を手に入れた」参照)。先読みが必要なのは「アームが技術を開発してから、チップベンダーが採用し、最終製品になるまで3~5年かそれ以上かかる」(アーム日本法人の内海弦社長)ためだ。

 先読みのために企業買収やパートナー企業との協業も積極的に活用する。特に直近の2年ほどでは、IoTセキュリティやHPC(高性能コンピューティング)、医療分野での動きが活発だ。

買収でIoTセキュリティを強化

 IoTセキュリティの分野では2015年7月、イスラエルのサンサセキュリティを買収した。サンサは半導体チップに埋め込む暗号化回路を設計する企業。IoT機器がネットワーク経由でデータを安全に送受信するのに不可欠となる技術だ。

 アーム自身もIoTセキュリティの開発を強化している。あらかじめチップに暗号鍵を組み込み、他のソフトからは見えない形で暗号化処理などを実行できる技術「TrustZone」を、2016年10月からマイコン向けのCortex-Mシリーズでも使えるようにした。ファームウエアを更新する際、ソフトの改ざんやウイルス感染の有無を検知するのに使える。従来はスマートフォン向けのCortex-Aシリーズに適用していたが、今後はより小型のIoT機器でも同様の機能が使える。

 さらに、ファームウエアの安全な更新を含めたIoT機器の管理を担うSaaS(ソフトウエア・アズ・ア・サービス)「mbed Cloud」の提供を始めた。アームがSaaSのようなクラウドサービスを提供するのはこれが初めてだ。

 IoTセキュリティに詳しい米インタートラストのデビッド・マハー CTO(最高技術責任者)は「今後のIoT機器はファームウエアを安全に更新することが極めて重要になる。ファームウエアの安全性をチップレベルで担保する技術の採用が進むだろう」と語る。IoTの時代が訪れる直前に、アームは必要な技術を用意してみせたわけだ。アームのサイモン・シガースCEOは「IoTに必要なセキュリティ技術は既にそろっている」と胸を張る(インタビュー参照)。

図 アームによる2015年~2016年の主な買収・協業
ARMの適用分野を拡大へ布石
図 アームによる2015年~2016年の主な買収・協業
[画像のクリックで拡大表示]

HPCでの協業がサーバーにも波及

 HPC分野の技術開発は富士通とのパートナー関係が中核となる。アームは2016年8月、富士通をパートナー企業とし、HPC向けの拡張命令セットを共同で開発していると明らかにした。

 富士通は2020年に国内で稼働予定の次世代スパコンに、ARMのHPC拡張命令セット「ARMv8-A SVE」を組み込んだ自社開発プロセッサを採用する見通しだ。HPCにおける富士通とのパートナーシップは、ARMサーバーの市場拡大にもつながる可能性が高い。

 というのも、1コア当たりの性能(シングルスレッド性能)が高い「大規模コア」を搭載したプロセッサを開発できるのは、世界を見渡してもインテル、IBM、AMD、富士通などに限られる。大規模コアの開発経験が長い富士通がARMプロセッサを供給すれば、かつてのARMサーバーの弱点を克服できるからだ。

 弱点とは1コア当たりの性能が高くなかったこと。これまでARMサーバーの市場が拡大しなかった理由について、あるソフト開発者は「1コア当たりの性能がインテルのXeonなどと比べて相対的に低く、ソフト開発の面では使いづらかった」と明かす。

AI向けの命令セットも追加

 人工知能(AI)や機械学習の分野では、アームは米エヌビディアやインテルの陰に隠れがちだが、挽回に向けて着実に手を打っている。

 まず、富士通とパートナーを組んで開発しているHPC用新命令セットに、ディープラーニング(深層学習)で多用する半精度(16ビット)浮動小数点演算と8ビット整数演算のSIMD(シングル・インストラクション・マルチプル・データ)命令を組み込む見通しだ。従来からある単精度(32ビット)や倍精度(64ビット)演算と比べ、深層学習の演算を省電力でこなしやすくなる。

 スマホなどのプロセッサに使うCortex-Aにも、同じくAI演算に適した命令セットを加える。これにより「3~5年でAI演算パフォーマンスを50倍高める」(アームのプレスリリースより)。スマホに代表されるエッジ側のデバイスで、画像認識や音声認識などのAI演算を効率的に実行できるようになる。

 水平分業を強みに敵を作らない戦術にたけたアームが、インテルに真っ向から挑む「AI」戦争。勝敗の行方はまだわからないが、競争が進めばユーザー企業やITベンダーがクラウドやIoT、AIなどの新技術を一段と使いやすくなることは確かだ。

図 AI/機械学習の演算性能を高めるアームの新技術
「3~5年でAI演算性能を50倍に高める」
図 AI/機械学習の演算性能を高めるアームの新技術
[画像のクリックで拡大表示]
ソフトバンク孫社長は「水晶玉」を手に入れた

 アームの技術力は半導体の世界にとどまらない。自動車や電子機器、医療、農業など様々な分野の未来を予測し、どんな機器が必要となるのかを見極め、求められる半導体の性能や機能を逆算する研究開発力が競争力の源泉だ。

 東北の自動車関連工場から、西日本の工作機器メーカーまで──。アームの研究者たちは頻繁に来日し、日本企業の生産拠点や研究拠点を訪れる。アームの技術に基づくCPUが搭載された機器の使われ方を知るとともに、訪問先の研究者と議論を重ねる。

 「こんなことをやっているのか」「こう使われているのか」。アームの研究者たちは貪欲に情報を集める。訪問先は自動車関連やデジタルカメラ、複合機、ファクトリーオートメーション(FA)、工作機械、農機などのメーカーはもちろん、医療機関や農業関連、スマートシティーの推進組織など多岐にわたる。秘密保持契約を交わしたうえで互いの研究内容にも触れ、夜は地元料理に舌鼓を打ちながら議論に花を咲かせる。

 アームで未来予測を担う研究者は約50人。R&D(研究開発)部門に所属する。アームのサイモン・シガースCEOは「医療や農業といった分野別のトレンドを理解する役割を担う」と話す。例えば医療分野なら医療機器の進歩で病院の診察の仕方がどう変わるかはもちろん、高齢化や医療費の増加といった社会的な問題を技術でどう解決できるかといった観点まで踏み込んで、アームの中核技術がどう役立つのか考える。個別の企業や組織についてではなく、業界全体の将来について見極める。

 1~2カ月など短期間ではなく、2~3人が2年がかりでじっくりと取り組む。「5~10種類の新しい市場を常に見ている」とシガースCEOは明かす。

 アームの技術に基づく半導体の製造会社やその半導体を搭載した最終製品のメーカーから将来のニーズを聞き出して製品開発に生かすDNAは創業時からのものだ。「(フィンランドの通信機器大手)ノキアのおかげだ」。アーム日本法人の内海弦社長はこう振り返る。

 創業から数年後の1990年代半ば、今よりもずっと小さなベンチャー企業だったアームは携帯電話向け事業の拡大を狙って大手メーカーだったノキアの門をたたいた。無線通信や信号を制御する「ベースバンドチップ」に求められるニーズをいち早く取り込んでノキアの製品に採用されると、ノキアが携帯電話を世界で大ヒットさせたのに合わせて順調にシェアを拡大。その後ノキアはスマートフォンへの転換が遅れ携帯電話事業から撤退したが、アームはスマホの需要もうまくとらえた。20年後のいま、スマホ向けCPUのシェア95%以上という結果につながる。

 「相乗効果はない」。アームを3兆3000億円で買収したソフトバンクグループの孫正義社長は言い切る。同社にとって最大の価値は、IoT時代に需要が増える半導体チップの基礎技術を得たことよりも、アームの先読み力を取り込んだことにある。例えるなら将来を映し出す水晶玉を手に入れたようなもの。2017年5月にサウジアラビアの政府系ファンドや米アップルなど世界のIT大手と10兆円ファンドを設立したのは、水晶玉を通じて未来を見通せるとの自信の表れでもある。(大和田 尚孝)

写真提供:英アーム
写真提供:英アーム
[画像のクリックで拡大表示]