メールのやり取りやWebブラウザーの閲覧で、いまだに「文字化け」を目にすることがあるだろう。コンピュータの内部や通信用の「文字コード」で違う種類のものが使われていたりすると、それが原因で文字化けが起こる。Webブラウザーのエンコード設定画面を見ると、EUC、Unicode、UTF-16、ISO 2022、シフトJISなど、文字コードの名前がずらりと並ぶ。
過去には、文字コードに起因する諸問題が取り沙汰された。例えば2006年には、Windows Vistaで標準利用される文字コードが変更された。その際、Vistaで入力したテキストファイルをWindows XPで表示すると、一部の漢字が異なる字体に化ける現象が起こった。また、2010年に新常用漢字表が告示された際、「シフトJIS」にない漢字が新常用漢字表に追加された。これにより、環境によっては文字化けする可能性があると話題になった。
このように文字コードの世界はいろいろ複雑でややこしい。そこで今週の週末スペシャルでは、文字コードの世界を探ってみることにしよう。文字コードの誕生から発展の歴史をたどっていくと、何種類もある文字コードの仕組みや用途の変遷がよく分かるはずだ。
文字コード基礎講座
Vista文字セット問題(2006年)
VistaでUnicode以外の選択肢はなかったのか?──京大助教授が語る
新常用漢字が引き起こす文字コード問題(2010年)
新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能