言葉と言葉の関係を表すデータベースを自動で構築できるAI技術「word2vec」。ある単語の意味を別の単語との関係で表す「分散表現」を機械学習で自動生成する。「東京」と「日本」の関係は、「パリ」に当てはめると「フランス」になる、といった意味の判定が可能だ。

単語同士の関係が分かる辞書を生成できる「word2vec」
単語同士の関係が分かる辞書を生成できる「word2vec」
[画像のクリックで拡大表示]

word2vecをインストール

 word2vecは、米Googleが開発し、オープンソースとして公開している。ここでは動作環境として、前回も利用したUbuntu 16.04 LTSを利用する。Ubuntu環境がない場合は、配布ページから「ubuntu-16.04.2-desktop-amd64.iso」をダウンロードし、DVDやUSBメモリーに書き込んだインストールメディアからインストールしておく。