「どこでどういった問題が起こるのか分からない。まさかデータベースが壊れるということはないと思うが」――。国内大手ベンダーの幹部は不安そうに話す。この幹部が懸念するのは、Windows Vistaで採用された新文字セットの情報システムへの影響である。別の大手ベンダーのシステム構築部門も、「情報システムのクライアントとしてVistaを見た場合、最大の問題は日本語の文字セットだ。現在、共通の基盤技術セクションで影響を調査している」という。

 企業向けVistaの出荷開始を目前に控え、Vistaの新文字セット採用が大きな問題として浮上してきた。

 Windows Vistaは、新しい文字セットに関するJIS規格「JIS X 0213:2004」に準拠した日本語フォントを標準で搭載する。これにより、既存の漢字のうち122文字の字形が変更になり、約900文字の漢字、約200文字の非漢字(英語の発音記号や記号、アイヌ文字など)が新たに表示可能になる(関連記事:マイクロソフト,新文字セット「JIS2004」への移行措置を明らかに)。例えば、逗子市の「逗」は、従来は「1点しんにょう」で表現されていたが、Vistaのフォントでは「2点しんにょう」になる(関連記事:“同じ”文字とは何が同じなのか)。さらに、追加される新しい文字の一部をUnicodeで表現すると、通常の2バイトではなく4バイトで表現されるものがある。

 文字セット変更により発生する問題は、多岐にわたる。最も典型的なのが、Windows Vistaで新規追加文字を使って作成した文書を、Windows XPやWindows 2000などの古い環境で見る際に、文字化けを起こすなどして適切に表示できないことだ。葛飾区の「葛」のように字形が変更になる文字については、字形は変わるものの文字コードは同じで、同じ文字としてそのまま通用するため問題は少ない。

 影響は単にクライアントだけで収まらず、サーバー側を含むシステム全体に波及しそうだ。まず問題が顕在化しそうなのが、一般コンシューマー向けにWebベースでサービスを提供するシステムである。来年1月末以降は、コンシューマー向けのWindows Vistaが発売され、Vista標準搭載のパソコンが世の中で使われるようになる。「Vistaを使うユーザーは、本人が意識することなく新規追加文字を使ってしまう可能性がある。制御不能だ」と冒頭の大手ベンダー幹部は頭を抱える。

 新規に追加された文字セットを含むデータがサーバー側に入ってきた場合は、「サーバーでエラーが発生する可能性がある。印刷や表示する際に、文字化けが起こることもある」(大手ベンダーで全社共通の基盤技術を担当する部長)という。また、カラムの長さを固定しているデータベースに、4バイト文字を登録するようなケースもありうる。「通常ならばそういったケースを想定して、“はねる”仕組みにしているはず。しかし、文字入力するフロント部分で排除することを前提に、エラー排除の仕組みを組み込んでいないこともありうる。最終的に、どこにどういった影響が出るか、すべてを把握できていない」(同部長)のが現状だ。

 一方、企業内の情報システムの場合は、現在稼働している情報システムの対応が済むまで、Windows Vistaを導入しなければ基本的に問題は発生しない。また、マイクロソフトは、Windows Vistaで旧字体を使えるようにするフォントや、Windows XPで新字体を使えるようにするフォントを提供する予定なので、これらを利用して社内環境を統一する方法も取れる。マイクロソフトは、Vistaで旧字体を使えるようにする互換フォント(Vista用JIS90互換フォント)を今年12月に、XP向けに新字体を使えるようにするフォント(XP用JIS2004対応フォント)もコンシューマー向けVistaが発売になる来年1月にダウンロードできるようにする模様だ。

 なお、2バイトで表現できない文字は、JISの第三水準、第四水準の文字の一部なので、使用する漢字を第一水準、第二水準に限定する手もある。Vistaの仮名漢字変換ソフト(MS-IME)で第一水準、第二水準以外の文字を入力する際には、「環境依存文字」だという注意が表示される。

 今後、ユーザー企業は、現在使用しているミドルウエアやパッケージ製品が新文字セットに対応しているかどうかを、早急にベンダーに問い合わせる必要があるだろう。

 今回の問題は、Windows Vistaという広く使われるOSに、新文字セットが標準で組み込まれたことで起こったものであり、Vistaや新文字セット自体に問題があるわけではない。マイクロソフトは昨年7月にWindows Vistaで新文字セットに対応することを発表している。