日立製作所は2017年9月25日、「システム稼働リスク可視化ソリューション(RVS)」を提供開始した。AI(人工知能)を活用してシステムの潜在リスクをリアルタイムに検知し、リスク要因を推定、可視化する。「システムのスローダウンや、エラーとして検知されないサイレント障害などに加えて、社内に侵入したマルウエアの動きなども検知できる」。日立製作所 通信ネットワーク事業部 ネットワークサービス本部 共通基盤開発部長の立川敦氏は、RVSの特徴をこう説明する。価格は117万円から。

システム稼働リスク可視化ソリューションの概要
システム稼働リスク可視化ソリューションの概要
(出所:日立製作所)
[画像のクリックで拡大表示]

 一般の監視システムでは検知できないような「潜在リスク(不調)」を対象に、「不調検知」「不調要因推定」「見える化」の3機能を提供する。不調検知では、ネットワークを流れるパケットをキャプチャーし、トラフィック量や、通信元/通信先、TCPエラー率などの情報を収集。一定期間にわたる機械学習を通じて“正常状態”を把握しておく。このベースラインに基づいて通信のリアルタイム監視を行い、乖離した場合に不調と判断する。例えば「マルウエアによるスキャン行為は、一つのIPアドレスから放射状にパケットが出ている動きなどが手掛かりになる」(立川氏)。

 不調要因推定では、不調検知をトリガーに各種リソースの使用状況を調査し、原因の一時切り分けを行う。ネットワーク機器からはパケット数など、サーバーからはCPU使用率やメモリー使用量、ディスクI/Oといった情報を集める。これらの情報と、あらかじめ用意した「評価テーブル」を掛け合わせて、不調要因を推定する。「評価テーブルには、日立が培ってきたノウハウを生かし、発生事象に応じた不調要因のスコアを設定してある」(日立製作所 通信ネットワーク事業部 ネットワークサービス本部 共通基盤開発部の岡田孝宣氏)。システムの稼働状況はコンソールを通じて可視化される。

 RVSは単独で用いるほか、同社の統合システム運用管理ソフト「JP1」に連携させたり、IoTプラットフォーム「Lumada」を活用したソリューションの一つとして展開したりと、システムの安定稼働を幅広く支援。将来は、自動制御による復旧迅速化も計画している。「システムが複雑化するなか、不調の原因特定や対処のスピードを上げる必要性が一段と高まっている」。日立製作所 通信ネットワーク事業部 ネットワークサービス本部 共通基盤開発部の西由美子氏はRVS提供の狙いをこう話す。