提携を発表する慶應義塾大学の杉山伸也・図書館長、安西祐一郎・大学長、米Googleのアダム・スミス・プロダクト・マネージメント・ディレクター、村上憲郎・日本法人社長(左から)
提携を発表する慶應義塾大学の杉山伸也・図書館長、安西祐一郎・大学長、米Googleのアダム・スミス・プロダクト・マネージメント・ディレクター、村上憲郎・日本法人社長(左から)
[画像のクリックで拡大表示]

 慶応義塾大学は7月6日、米Googleと提携すると発表した。大学図書館の蔵書約430万冊のうち、著作権保護期間が切れたり、権利関係が明確になっている書籍約12万冊を対象に電子化を進める。その成果はインターネット上で無料公開し、Googleの検索エンジンで検索できるようにする。

 同図書館の杉山伸也館長(経済学部教授)は、「慶応大学の蔵書を世界中の日本研究者に開放することで、国際的な学術の発展に貢献したい。これまでの『来館型図書館』とは違う、インターネット時代の新しい図書館のあり方も模索したい」と狙いを語った。

 Googleは5日、「Google ブック検索」日本語版のサービスを開始したばかり(関連記事)。今回の提携によって、新刊書だけではなく、図書館にしかないような古い本や稀少書も検索・閲覧できるようになる。

 Google日本法人の村上憲郎社長は、「世界中のあらゆる情報を電子化して検索できるようにするのがGoogleのミッション。その中で本は重要な位置を占める。早急に進めるのではなく、著作権者や出版社の理解を得ながら徐々に電子化を進めたい」と話した。

 電子化は今年から6年間かけて進める計画だ。費用は、書籍の輸送費などを除き、基本的にGoogle側が負担する。対象には明治期以降の比較的新しい本のほか、江戸時代に出版されたような古い本も含まれる。まず慶応義塾の創始者である福沢諭吉のゆかりの書など権利関係が明確なものから電子化を進める。作業は原則として日本国内で行うが、輸送中や作業中に破損するなどのリスクがあるため、保存状態の良い本を優先して電子化する。

 Googleは既に各国の図書館と同様の提携を進めており、慶大図書館は26番目の提携相手になる。欧米以外の地域の大学としては初めて。電子化では、まず本のページそのものをスキャンし、その後OCR(光学文字読み取りソフト)を使って自動的にテキストデータを抽出する。

 日本語の場合、英語圏とは違って文字の種類が多く、古い本では現在使われていないような文字も多い。米Googleプロダクト・マネージメント・ディレクターのアダム・スミス氏は、「日本の古い本では、自動的なテキスト化は技術的に困難が予想されるが、時間をかけて挑戦していきたい」と話した。