既に報道されているとおり,Windows Vistaでは,日本語の扱いについて大きく2つの変更がある。1つは,一部の文字について形(字形)が変わること。もう1つは,利用できる文字が増えることである。これは,経済産業省が2004年に漢字コードに関するJIS規格を変更したことに対応するものだ。この新しい規格を「JIS X0213:2004(JIS2004)」と呼ぶ。
JIS2004では,168文字に対して字形が変更された(字体が変更されたのはその内の94文字)。例えば,「芦」「逗」「祇」などだ(図1)。これらはおおざっぱに言うと,これまでのWindowsが対応していた文字セット「JIS90」の字形(現在この記事を読者の皆さんが見ている文字の形)が日本語本来の形ではなかったものを,本来の形に変更するというものだ。字形が変わってもキャラクタ・コードは変わらないので,旧Windowsで作成した文書をWindows Vistaで開いたり,その逆をしても,文字が消えてしまうことはない。語弊はあるものの,同じ文字を明朝体で表示したときと教科書体で表示したときで,違った形に見えるのとほぼ同じだ。字形がJIS2004準拠となるフォントは,「MS 明朝」「MS P明朝」「MS ゴシック」「MS Pゴシック」「MS UI Gothic」「メイリオ」である。
それに対して追加された文字の扱いは,今後問題になりそうだ。主にJIS第3水準と同第4水準の,あまり一般的には使われない文字が中心だが,中には通常使う文字が含まれる。それは,先の字体の変更ではなく,追加となった10文字だ。具体的には次の通りである(図2)。
倶 剥 叱 呑 嘘 妍 屏 并 痩 繋
これらの文字の正字を使うと,これまで使っていた略字とは別のキャラクタ・コードになる。検索などが面倒になるだけでなく,これらの文字を使ってWindows Vistaで作った文書を,JIS2004に対応していない既存のWindowsで開くと,「・」や「■」などで表示される恐れがある(図3)。
さらに,これらの追加文字を使った文書を保存するときは,エンコーディングをUnicodeにする必要がある。シフトJISやEUCにすると,キャラクタ・コードを変換できないため,文字がなくなってしまう。例えばメモ帳でこれらの文字を使った文書を,シフトJISで保存すると,その文字の部分が「?」に置き換えられてしまう。
ファイル名にこれらの文字を使うと,既存のWindowsでも開けるものの,ファイル名が「・」などになり,区別が付かなくなる恐れがある。
なおマイクロソフトは,Windows Vista向けに,既存のWindowsと同じ字形のフォントを提供する予定である。例えば1点しんにょうの「辻」を表示したければ,フォントを入れ替えれば済む。既に説明したように,キャラクタ・コードは変わらないので,文字を置換する必要はない。また,Windows XP/2003向けには,Windows Vistaと同じJIS2004に準拠したフォントが提供される。
今後ITproでは,Windows Vistaと文字セットについての解説記事を公開する予定である。