言葉と言葉の関係を表すデータベースを自動で構築できるAI技術「word2vec」。ある単語の意味を別の単語との関係で表す「分散表現」を機械学習で自動生成する。「東京」と「日本」の関係は、「パリ」に当てはめると「フランス」になる、といった意味の判定が可能だ。
word2vecをインストール
word2vecは、米Googleが開発し、オープンソースとして公開している。ここでは動作環境として、前回も利用したUbuntu 16.04 LTSを利用する。Ubuntu環境がない場合は、配布ページから「ubuntu-16.04.2-desktop-amd64.iso」をダウンロードし、DVDやUSBメモリーに書き込んだインストールメディアからインストールしておく。