この連載ではエンタープライズIT分野で急速に注目を集めている「RPA(Robotic Process Automation)」について、できるだけ分かりやすく実践的な内容を意識して説明している。

 前回はRPAとは何かに加えて、注目を集めている背景を紹介した。ホワイトカラー(頭脳労働者)が担う事務作業を「ロボット(ソフトウエアロボット)」で自動化するRPAが今なぜ注目されているのかをお分かりいただけたと思う。

 企業がRPAを導入する際は多くの場合「RPAツール」を利用する。今回からはRPAツールについて、より深く見ていくことにしたい。今回はRPAツールを構成する技術要素と仕組みを取り上げる。

 RPAの役割は人間の作業を代替することにある。このため、RPAツールの技術要素は「人間でいうと何に当たるのか」で捉えると理解しやすい。ここでは人間の「目」に当たる技術、「脳」に当たる技術、「手」に当たる技術に分けて説明したい。RPAツールは複数の「枯れた」技術を連携させて実現したソリューションである点をご理解いただけると思う。

RPAツールの構成技術
RPAツールの構成技術
[画像のクリックで拡大表示]

「目」に当たる技術

 「目」に当たる技術として、構造解析技術や画像認識技術、OCR(光学式文字読み取り)などが挙げられる。PCの画面から操作対象を特定する、情報を取得するといった役割を果たす。

構造解析技術:操作対象を特定

 構造解析技術は、RPAツールが操作対象とするアプリケーションの画面がどのような要素で構成されるかを解析する。ここでいう要素にはメニュー、入力エリア、ボタン、選択項目(ラジオボタン、ドロップダウンリスト)などが含まれる。