「部長や部員が次々と辞め、残った4、5人がシステムのトラブル処理に追われる。システム部員は疲れ果て、危機を回避するための抜本的な手を打てない、という悪循環に陥っていた」。楽天証券の今井隆和取締役常務執行役員(CIO)は、コンサルティング会社から楽天証券に転じた2007年2月当時の状況を振り返る。

「過去に起こった障害記録を徹底的に分析」楽天証券 取締役常務執行役員(CIO) 今井 隆和氏
「過去に起こった障害記録を徹底的に分析」
楽天証券 取締役常務執行役員(CIO) 今井 隆和氏

 システム部員を疲弊させていたのが、次から次へと発生するオンライン証券取引システムなどのシステム障害だった。楽天証券は、データベースサーバーの相次ぐトラブルやリスク管理体制の不備を指摘され、2005年11月から2009年3月にかけて、金融庁から業務改善命令を3度受けた。

 今井CIOは、システム部員のトラブル対応の進め方に問題があると見ていた。「穴が開いた部分だけをふさぐ、といった具合に対処療法にとどまっていた」(今井CIO)。

 今井CIOは、障害が頻発する状況を脱するには、システム部員が再発防止策を自ら事前に考え、行動に移すことが重要と考えた。当然、システムの開発や運用・保守は、プロであるITベンダーに任せる。ただし、「外部に頼るばかりではなく、我々がもっと当事者意識を持たなければならない」と今井CIOは反省した。

 今井CIOはまず、大小を問わず過去に発生したすべてのトラブルをデータベース化するよう、システム部員に指示。さらに、新たに発生したトラブルについては、A4用紙2枚のトラブルレポートとしてまとめることを義務付けた。このレポートには、トラブルの発生日時や、検知・対応者、最初に取った行動、復旧作業内容、復旧完了時間などを明記する。

 トラブルレポートの締め切りはトラブルが発生した当日、というルールにした。トラブルのデータベースには、2010年12月までに約500件のトラブルの対応記録が登録されている。

過去に発生したトラブル
証券取引システムのバッチ処理の不具合で2008年11月、約7時間サービスが停止。それ以前にもシステムトラブルが相次ぎ、金融庁から3度の業務改善命令を受けた。
(日経コンピュータ2008年12月15日号「動かないコンピュータ」)

 これらトラブルに関する情報の分析結果を、楽天証券のシステム部員や協力会社であるITベンダーが、新規システムの開発プロジェクトで活用する。楽天証券は、トラブルレポートを参考に、システム成果物のテスト段階で用いるチェック項目を順次追加する。「チェック項目は増えており、新たに開発するシステムの品質が確実に高まっている」と、今井CIOは手応えを感じている。