米国会図書館は現地時間2013年1月4日、ミニブログサービス「Twitter」で公開されたツイートのアーカイブ化プロジェクトに関する方針について明らかにした。今後は研究者などが幅広く有効活用できるようするための技術的課題に取り組む。

 同図書館は2010年4月に、2006年のTwitterサービス開始以来、一般公開で投稿された過去の全ツイートをアーカイブ取得することで米Twitterと合意した。さらに、同様の条件でその後投稿されるツイートを取得することでも合意を結んだ。

 同図書館はまず、2006年~2010年のツイートをアーカイブ化し、日々投稿されるツイートをリアルタイムで入手して保存するための安全で安定性のあるプロセスを構築することを目指した。2011年2月末には2006~2010年のツイート約210億件と関連メタデータを取得し、2012年12月1日時点でさらに約1500億ツイートと関連メタデータを追加。アーカイブの規模は約1700億ツイートにのぼった。

 同図書館が1日あたりに受け取るツイート量は、リアルタイムのデータ転送を開始した2011年2月には1億4000万件だったが、2012年10月時点では約5億件と拡大し続けている。

 取得したアーカイブの処理および整理は、2013年1月中に完了する見込み。アーカイブの具体的な使用目的について同図書館は明らかにしていないが、研究者や政策立案者が有効活用できる方法でアクセス可能にするとしている。

[発表資料(公式ブログ)]
[発表資料(PDF文書)]