資料の紹介
国立遺伝学研究所DDBJセンターは、急速に膨れ上がるDNAデータを安全に保管し、迅速に提供するために、2018年春、30ペタバイト規模という日本最大級のストレージ基盤を構築した。高速性と安全性を両立させるために同センターが採用したのは、高速並列ファイルシステムを搭載したストレージサーバーと、テープライブラリ装置だった。
DDBJセンターは、世界中の研究者が自由に利用できる国際塩基配列データベースの日本の拠点として1986年からデータベースを構築・公開しているほか、データ解析環境も提供している。近年では、既存のオープンアクセスデータについて、データ登録・利用の利便性を向上すると同時に、年2倍のペースで急増し続けている個人ゲノムのデータに対応することが課題となっていた。
本資料では、こうした課題を解決するために、国立遺伝学研究所DDBJセンターが導入したストレージ基盤について紹介する。同研究所の要件は大きく3つあった。アクセス頻度が低いデータもオンラインで提供できること、データが確実に保全されること、そして、構築時の容量を30ペタバイトとし、拡張性に富み、膨大なデータを高速に扱えることである。