メールのやり取りやWebブラウザーの閲覧で、いまだに「文字化け」を目にすることがあるだろう。コンピュータの内部や通信用の「文字コード」で違う種類のものが使われていたりすると、それが原因で文字化けが起こる。Webブラウザーのエンコード設定画面を見ると、EUC、Unicode、UTF-16、ISO 2022、シフトJISなど、文字コードの名前がずらりと並ぶ。

Windows VistaとXP以前とで字体が変わった第一水準漢字116字(うち人名用漢字80字)
Windows VistaとXP以前とで字体が変わった第一水準漢字の例
[画像のクリックで拡大表示]

 過去には、文字コードに起因する諸問題が取り沙汰された。例えば2006年には、Windows Vistaで標準利用される文字コードが変更された。その際、Vistaで入力したテキストファイルをWindows XPで表示すると、一部の漢字が異なる字体に化ける現象が起こった。また、2010年に新常用漢字表が告示された際、「シフトJIS」にない漢字が新常用漢字表に追加された。これにより、環境によっては文字化けする可能性があると話題になった。

 このように文字コードの世界はいろいろ複雑でややこしい。そこで今週の週末スペシャルでは、文字コードの世界を探ってみることにしよう。文字コードの誕生から発展の歴史をたどっていくと、何種類もある文字コードの仕組みや用途の変遷がよく分かるはずだ。

文字コード基礎講座

文字コードの発展経緯から役割と仕組みを学ぶ

文字コード規格の基礎

Vista文字セット問題(2006年)

Vistaで化ける字、化けない字

Vistaで化ける字、化けない字(続)

VistaでUnicode以外の選択肢はなかったのか?──京大助教授が語る

VistaをXPの字体に戻すというjp90タグの罠

新常用漢字が引き起こす文字コード問題(2010年)

新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能

漢字1文字が最大8バイト、Unicodeの「IVS」とは?

UnicodeのIVSがもたらすメリットとデメリット