週末スペシャル

「文字コードの迷宮」を読み解く

ITpro

2012.05.18

　メールのやり取りやWebブラウザーの閲覧で、いまだに「文字化け」を目にすることがあるだろう。コンピュータの内部や通信用の「文字コード」で違う種類のものが使われていたりすると、それが原因で文字化けが起こる。Webブラウザーのエンコード設定画面を見ると、EUC、Unicode、UTF-16、ISO 2022、シフトJISなど、文字コードの名前がずらりと並ぶ。

Windows VistaとXP以前とで字体が変わった第一水準漢字116字（うち人名用漢字80字）

Windows VistaとXP以前とで字体が変わった第一水準漢字の例

[画像のクリックで拡大表示]

　過去には、文字コードに起因する諸問題が取り沙汰された。例えば2006年には、Windows Vistaで標準利用される文字コードが変更された。その際、Vistaで入力したテキストファイルをWindows XPで表示すると、一部の漢字が異なる字体に化ける現象が起こった。また、2010年に新常用漢字表が告示された際、「シフトJIS」にない漢字が新常用漢字表に追加された。これにより、環境によっては文字化けする可能性があると話題になった。

　このように文字コードの世界はいろいろ複雑でややこしい。そこで今週の週末スペシャルでは、文字コードの世界を探ってみることにしよう。文字コードの誕生から発展の歴史をたどっていくと、何種類もある文字コードの仕組みや用途の変遷がよく分かるはずだ。

文字コード基礎講座

文字コードの発展経緯から役割と仕組みを学ぶ

文字コード規格の基礎

Vista文字セット問題（2006年）

Vistaで化ける字、化けない字

Vistaで化ける字、化けない字（続）

VistaでUnicode以外の選択肢はなかったのか？──京大助教授が語る

VistaをXPの字体に戻すというjp90タグの罠

新常用漢字が引き起こす文字コード問題（2010年）

新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能

漢字1文字が最大8バイト、Unicodeの「IVS」とは？

UnicodeのIVSがもたらすメリットとデメリット

この記事の目次へ戻る

あなたにお薦め

今日のピックアップ

注目記事

おすすめのセミナー

セミナー一覧

注目のイベント

おすすめの書籍

日経BOOKプラスの新着記事

日経クロステック Special

What's New

経営

クラウド

アプリケーション／DB／ミドルウエア

運用管理

サーバー／ストレージ

クライアント／OA機器

ネットワーク／通信サービス

セキュリティ