今回のポイント
HTMLはUTF-8で書くのがトレンド

 前回,HTMLに対してCSSを適用する簡単な例を見てみました。HTMLに対してCSSで装飾を施す方法は3種類あります。前回の例はその一つにすぎません。CSSについて深く追求していくにあたって,3種類あるCSSの書き方をマスターしておくことにしましょう。

 と,その前に,まずはCSSで装飾するベースとなるHTMLについて説明しておきましょう。HTMLにはHTML 4.01,XHTML 1.0,XHTML 1.1などいくつかの規格があります。大枠として基本部分での差異はさほどありません。

 2008年2月現在,マイクロソフトのサイトではXHTML1.0が使われています。GoogleはHTML 4.01を使っています。Amazonは特に明示的なバージョン表記はありません。大手でも常に最新規格(上記例の中ではXHTML 1.1が最も新しい)を使っているわけではないということです。勧告から10年近く経つ古いHTML規格が未だに大手サイトでも使われているんです。

 本記事はXHTML1.0をベースにすすめていきます。XHTML 1.0でサンプルを作ると次のようになります(リスト1)。

リスト1●XHTML 1.0のサンプル

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html 
    PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
    "DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="ja" lang="ja">
  <head>
  <meta http-equiv="Content-Type" content="text/html;charset=utf-8" />
    <title>ページタイトル</title>
  </head>
  <body>
    <p>本文と<a href="http://xxxx.xxxxx.xxxx/">リンク</a>の例</p>
  </body>
</html>

 冒頭部は

<?xml version="1.0" encoding="UTF-8"?>

です。この書き方を覚えてください。これはXML バージョン1.0の仕様に従って記述し,文字コードはUTF-8(Unicode Translation Format-8)を使うということを意味しています。続いて<!DOCTYPE~>があって,<html>のところも少しごちゃごちゃと書かれていますが,<head>以降は雑誌記事などに見られる,いわゆる簡略化されたHTMLと同じ構造です。冒頭部にちょっとだけ手間がかかるというわけです。

 2006年あたりからHTMLを記述する文字コードはUnicode(ユニコード)のUTF-8が標準になっています。数年前まではLinuxなどのUNIX系ではEUCという日本語文字コードが主流でしたし,Windowsの標準はシフトJISでした。現在はこうしたOSごとの文字コードの違いは,関係各所の啓蒙活動と尽力からかUTF-8に統一されてきています。

 XHTMLは,その名前の通りXMLとHTMLを融合させようという流れの中から出てきた規格です。XMLの記述はUTF-8の使用が望ましいですし,更新情報を提供するRSSもUTF-8が前提になっています。したがって,サイトと関連するシステム全体の親和性から考えてもUTF-8を使うことが極めて妥当な時代になっていると解釈してください。「携帯サイトなのでどうしてもシフトJISで書かなくてはならない」などの理由がなければ,今後,HTMLはUTF-8で記述されることをおすすめします。