急成長するデジタルサービスをいつでも、快適に、安全に――。米グーグル発祥の「SRE(Site Reliability Engineering)」と呼ぶITインフラ作りの新手法が、日本でも広がりつつある。安定運用という「守り」と絶え間ない機能改良という「攻め」を、ソフトウエアエンジニアリングの力で両立させる。いち早く採用したのは、メルカリ、Retty、freeeといったネット企業。日商エレクトロニクスは非ネット企業に向けた支援事業の開発に着手した。DevOpsやマイクロサービスと並び、デジタルビジネスを支える新たな潮流となりそうだ。

 SREとはコーディングやソフトウエアエンジニアリングによって、ハードウエアを含めたシステム全体の性能や可用性、セキュリティを高める活動全般を指す方法論。米グーグルがSREという言葉を最初期に提唱・実践したとされる。

 明確な定義はないが、大規模なITインフラを使い、絶えず改善を繰り返すデジタルビジネスを運営する企業にとっては、必然的に取り組んできた活動でもある。グーグルが言葉にしたことで、ネット企業を中心に注目が高まりつつある。

 3月中にもSRE専任の組織を設けるのが、実名のクチコミによるグルメ情報サービスを運営するRetty(レッティ)だ。クラウド会計ソフトのfreeeは日商エレクトロニクスと組んで、SREに基づく企業向けのITインフラアウトソーシングサービスの開発を進めている。freee自身も2016年から、SRE活動を本格化しており、これまでの知見を生かす。

Rettyの樽石CTOは「利用者が急増してもサービスを安定稼働できていることが、SREの成果だ」と話す
Rettyの樽石CTOは「利用者が急増してもサービスを安定稼働できていることが、SREの成果だ」と話す
[画像のクリックで拡大表示]

アプリケーション開発者の煩わしさをなくす

 「サービスの信頼性という観点を取り入れた点が新しい。事業が目指す目標をエンジニアが共有し、逆算して必要な手段を選ぶ」。Rettyの樽石将人CTO(最高技術責任者)は、SREの意義をこう説明する。樽石CTOはかつてグーグルに在籍し、SREに取り組んできた当事者その人である。

 主務となる活動そのものは、「従来のITインフラ開発や運用とさほど変わらない」(樽石CTO)。サービスの稼働率やレイテンシー(通信の遅延時間)、レスポンスタイム(応答速度)など、サービスの健全性を測る指標に基づいてITインフラを運用・改善する。

 「インフラ部隊を解散するのが目標」。freeeのCTOを務める横路隆取締役はこう語る。稼働率の目標に沿ったインフラ運用の自動化を突き詰め、最小限の人数でサービスを稼働できるようにする。究極的には、専任組織を設けずとも、サービスを安定稼働させるとの意気込みを示した目標だ。

 SREの重要な点は、「システムの安定運用は守りつつ、アプリケーション開発者がより積極的に挑戦したり開発にかかわるストレスを減らしたりできるようにする活動」(freeeでソフトウェアエンジニアとしてSREチームに所属する浅羽義之エンジニアマネージャー)である。

 一例がデプロイ(コードの配置作業)やプロビジョニング(資源割り当て)の効率化。SREチームはこれらの作業を自動化する仕組みを開発し、アプリケーション開発者がワンタッチでデプロイできるようにする。