ヤフーは2007年6月18日、日本語の文章を解析し、細かな単位に分割できる「日本語形態素解析Webサービス」のAPIを公開した。ヤフーの日本語処理技術部が、同社の研究所と共同で開発してきた日本語処理技術を、外部に無償公開した。

 形態素とは、語として意味をなす最小の単位のこと。ある文章を解析し、形態素の単位に分割するのが形態素解析である。日本語は英語とは異なり単語間にスペースを入れずに記述するため、形態素解析は日本語をコンピューターで扱う際に必須の技術となっている。ヤフーは、独自に開発した形態素解析技術を、「Yahoo!JAPAN」の検索エンジンの一部や、ブログ検索の「評判検索機能」などで利用している。

 今回のAPIでは、形態素の品詞や読み、各形態素の出現回数などを取得できる。これを活用することで、対象となる文章にどんな単語が多く含まれているかを把握できる。また検索APIなどと組み合わせることで、入力された文章に関連性の高い文書を探すなどといったマッシュアップサービスが開発できるようになる。

ヤフーの該当サイト