野村総合研究所の「Shingan」は、文章から意味のあるデータを抽出し、抽出したデータの項目を推定するソフトである。フォーマットが異なる複数の文書から自動的にデータを抽出し、後続のシステムに連携できるようにする。

Shinganで文書からデータを抽出した画面
Shinganで文書からデータを抽出した画面
(出所:野村総合研究所)
[画像のクリックで拡大表示]

 形態素解析や構文解析などの日本語処理技術と、機械学習/ディープラーニング技術を組み合わせている。読み込む文書の特性に応じて、事前に学習させたAIモデルと辞書を利用する。

 ダッシュボード画面では、抽出したデータと、抽出したデータの確度を確認できる。抽出したデータごとに、抽出結果の確度(0~100%)を一覧で表示する。

 野村総合研究所では、投資信託における各種業務を対象に、実証実験を実施した。野村アセットマネジメントとの間では、運用報告書に記載した各種文章の整合性をチェックした。NRIプロセスイノベーションとの間では、項目の抽出と他システムへのデータ連携について検証した。

 なお、Shinganは、crossnote(アップデイティット製)などの文書管理システムの上で稼働する。

Shinganの概要
用途と機能 文章から意味のあるデータを抽出し、抽出したデータの項目を推定するソフト
主な目的フォーマットが異なる複数の文書から自動的にデータを抽出し、後続のシステムに連携できるようにする
要素技術形態素解析や構文解析などの日本語処理技術と、機械学習/ディープラーニング技術を組み合わせた。読み込む文書の特性に応じて、事前に学習させたAIモデルと辞書を利用する
ダッシュボード画面抽出したデータと、抽出したデータの確度を確認できる。抽出したデータごとに、抽出結果の確度(0~100%)を一覧で表示する
実証実験投資信託における各種業務を対象に、実証実験を実施した。野村アセットマネジメントとの間では、運用報告書に記載した各種文章の整合性をチェックした。NRIプロセスイノベーションとの間では、項目の抽出と他システムへのデータ連携について検証した
価格(税別)■導入と稼働までのコンサルティング費用は100万円から
■利用料は、月額30万円から
発表日2019年2月28日
提供開始日2019年2月28日