最近,パソコンで扱う文字について改めて考えさせられた。UNICODE仕様が決められたときなど,これまでも何度か議論されたことだが,「同じ文字と違う文字」についてだ。そのきっかけは「超漢字V」である。普段Windowsだけを使っているとあまり文字の形について意識させられることはないが,超漢字Vを使うと,実はパソコン上では本来とは違う形の文字を扱っているのだということに気付く。

 超漢字Vは,BTRON仕様に準拠したパーソナルメディアの独自OSで,多くの文字を扱える点が特長である。超漢字Vは,VMware Player上の仮想マシンとして実装されているので,Windows上の1つのアプリケーションとして気軽に利用できる。多くの文字を扱え,文字検索機能が充実している(関連記事)。

 試しにいろいろと文字を検索しているうちに,明らかに形が違うのに同じ文字として扱われているものや,形が似ているのに違う文字として扱われているものがあることに気付いた。「同じ文字」とは文字コードが同じだということである。形の違いは,単にフォント(グリフ)が違うということだ。それに対して「違う文字」とは,異なる文字コードが割り当てられていることを意味する。

 例えば「羽」である。日本では一般に,かまえの内側の「テンテン」部分を「ン」と書く。それに対して韓国では,「挧」のつくりのように「ノノ」と書くようだ。超漢字Vでは,これら2つの文字を,「違う文字」として扱っている(図1)。その一方で,「挧」のつくりは,日本でも韓国漢字と同じ形である。単独の文字では異体字として扱われているが,別の文字のつくりとしては同じ文字として扱われているのだろうか。

図1●「羽」とその異体字。超漢字Vでは異なる文字として扱える
[画像のクリックで拡大表示]

 異体字は,特に人名漢字に多く存在する。例えば渡邊さんの「邊」や,齊藤さんの「齊」には,形が微妙に異なる複数の文字があり,超漢字Vではそれぞれを「違う文字」として扱える(図2)。例えば1点しんにょうの「邊」は,2点しんにょうの「邊」とは違う文字として扱われている。異体字の「辺」も別の文字として扱われているだけでなく,1点しんにょうの「辺」と2点しんにょうの「辺」が「違う文字」として扱われている。

図2●超漢字Vで利用可能な「邊」の異体字
[画像のクリックで拡大表示]

 一般に「同じ文字」と認識されていると思われる文字でも,人名となると「違う文字」と認識される場合もあるようだ。例えば参議院は,インターネットのホームページで,「議員氏名の正確な表記」という情報を掲示している。その中で,鈴木さんの「鈴」は,正しくは超漢字Vで台湾漢字として扱われている文字だとしている(図3右上)。この違いは,アルファベットの活字体と筆記体の違いと同様なもの,つまりデザインの違いであり,多くの人は「同じ文字」と認識しているのではないだろうか。ところが,「挧」のつくり部分が「羽」とは「違う文字」だとするなら,「鈴」と図3右上の文字も「違う文字」とすべきなのかもしれない。

図3●「鈴」の日本漢字の形と台湾漢字の形。日本では2つの文字は区別されずに,同じ文字として認識されることが多い
[画像のクリックで拡大表示]

 ほかにも最近話題に上ったものでは,Windows Vistaが標準で備える日本語フォントが「JIS X 0213:2004」対応になることが挙げられる。これによって,これまでパソコン上では「1点しんにょう」で表されていた逗子市の「逗」が「2点しんにょう」になったり,「祇」の「しめすへん」が「ネ」だったものが「示」になったりする(図4)。これまでのパソコン上の文字が間違いで,本来の形に戻ったとも言えるが,これらは画数まで違うのに同じ文字なのだろうか。

図4●Windows Vistaの「MSゴシック」フォントで表示した「逗子市」と「祇園祭」の文字

 文字は,その成り立ちや,使われ方など,文化に非常に強く結びついている。そのため,単純に形だけで“同じ”や“違う”とは言えないところが難しい。