国立情報学研究所は3月6日、ヤフーのQ&Aサイト「Yahoo!知恵袋」のデータを研究利用する契約を結び、Yahoo!知恵袋のデータを研究コミュニティに無償提供すると発表した。

 Yahoo!知恵袋は、2004年4月にサービスを開始した国内最大のQ&Aサイトである。登録ユーザーは94万人、質問数は1000万件、回答数は3500万件に達する。今回国立情報学研究所は、Yahoo!知恵袋から、質問311万件、回答1347万件、文字数で16億のデータ提供を受ける。

 現在、ブログやQ&Aサイトなどによるユーザーからの情報発信による「情報爆発」が起こっているが、国立情報学研究所は、大量の情報を分析して新しい価値を発見することが重要と考えている。だが、これらのユーザー発信型の情報はプロバイダーなどが所有しており非公開だったうえ、個人情報を含んでいるため、研究での利用が難しかったという。

 国立情報学研究所は4月に、情報検索/分析/活用などの研究目的の利用者にデータの提供を始める。また、研究所内の情報関連プロジェクトでも活用していく。

 同研究所は、Yahoo!知恵袋からの情報提供を第一弾と考えており、今後は他のプロバイダなどからユーザー発信型の情報の提供を受け、情報量を増やしていきたい考えだ。