野村総合研究所の「Shingan」は、文章から意味のあるデータを抽出し、抽出したデータの項目を推定するソフトである。フォーマットが異なる複数の文書から自動的にデータを抽出し、後続のシステムに連携できるようにする。
形態素解析や構文解析などの日本語処理技術と、機械学習/ディープラーニング技術を組み合わせている。読み込む文書の特性に応じて、事前に学習させたAIモデルと辞書を利用する。
ダッシュボード画面では、抽出したデータと、抽出したデータの確度を確認できる。抽出したデータごとに、抽出結果の確度(0~100%)を一覧で表示する。
野村総合研究所では、投資信託における各種業務を対象に、実証実験を実施した。野村アセットマネジメントとの間では、運用報告書に記載した各種文章の整合性をチェックした。NRIプロセスイノベーションとの間では、項目の抽出と他システムへのデータ連携について検証した。
なお、Shinganは、crossnote(アップデイティット製)などの文書管理システムの上で稼働する。
Shinganの概要
用途と機能 | 文章から意味のあるデータを抽出し、抽出したデータの項目を推定するソフト |
---|---|
主な目的 | フォーマットが異なる複数の文書から自動的にデータを抽出し、後続のシステムに連携できるようにする |
要素技術 | 形態素解析や構文解析などの日本語処理技術と、機械学習/ディープラーニング技術を組み合わせた。読み込む文書の特性に応じて、事前に学習させたAIモデルと辞書を利用する |
ダッシュボード画面 | 抽出したデータと、抽出したデータの確度を確認できる。抽出したデータごとに、抽出結果の確度(0~100%)を一覧で表示する |
実証実験 | 投資信託における各種業務を対象に、実証実験を実施した。野村アセットマネジメントとの間では、運用報告書に記載した各種文章の整合性をチェックした。NRIプロセスイノベーションとの間では、項目の抽出と他システムへのデータ連携について検証した |
価格(税別) | ■導入と稼働までのコンサルティング費用は100万円から ■利用料は、月額30万円から |
発表日 | 2019年2月28日 |
提供開始日 | 2019年2月28日 |