1994年12月の戸籍法改正により、コンピュータで戸籍を扱えるようになった。それまで各市区町村は、紙の形でしか戸籍を扱えなかったが、この法改正によって戸籍電算化への道が開かれたのである。

 しかし戸籍電算化は各市区町村でバラバラに実施されたため、それぞれのシステムごとに異なる文字コードが使われる結果となった。これに対して法務省は、2004年4月に戸籍統一文字を通達した。戸籍データ交換の際には、この戸籍統一文字を用いることで、システムごとに異なる文字コードを使っていても、文字化けなくデータ交換が行える環境を整備したのである。

 現在、戸籍統一文字は漢字5万5271字、非漢字773字、合わせて56044字が収録されている。各文字には10進6桁のコードが割り振られているが、一の位は常に0であり、漢字は000010~552710に、非漢字は900010~907730に収録されている。

 戸籍統一文字の漢字は戸籍に使える正字および俗字であり、常用漢字や人名用漢字に加えて、『大漢和辞典』『新大字典』などの漢和辞典に掲載されている正字・俗字から構成されている。

 ただし戸籍統一文字は、旧版の常用漢字表(1981年10月内閣告示)に依拠しているため、現在の常用漢字表(2010年11月内閣告示)とは字形が微妙に違っている。

 代表的な例として「摂」を以下に示す。旧版の常用漢字字形は戸籍統一文字140810に収録されているが、現在の常用漢字字形は戸籍統一文字に収録されていない。

旧常用漢字 新常用漢字
140810-

 ただし、新版の常用漢字表で追加された「蔑」の字形は、2010年11月に突如として戸籍統一文字552680に追加されたことから、今後「摂」に関しても、何がしかの追加が行われる可能性は否めない。

新常用漢字
358090 359280 361010 552680

 一方、人名用漢字の字形は戸籍統一文字に完全に一致している。というのも、2010年11月の戸籍法施行規則の改正において、人名用漢字の表は戸籍統一文字を用いて官報にオフセット印刷されたからである。