プログラ放送を推進するブロマガ

HTMLの歴史

2014/03/18 20:16 投稿

コメント:1

  • タグ:
  • プログラミング
  • HTML
  • Web

HTMLについて書いてほしいとリクエストをもらいました。
専門家でも何でもないので間違いなどあるかもしれません。主にWikipediaの情報を参考に書いていきます。気づいたことがあればコメントいただけると嬉しいです。

HTMLの提案

HTMLの起源は、Tim Berners-Leeが1989年に提出した、CERN内の情報をやり取りするためのhypertext systemの提案書だとされているようです。この提案書は公開されており見ることができます。

The original proposal of the WWW, HTMLized

Berners-Leeを中心として、この提案の実装が行われました。それがWebサーバhttpdとブラウザWorldWideWebです。1991年に最初のWebサイト info.cern.ch が公開され、1993年、CERNがWebの規格やプログラムをパブリックドメインとすることを宣言し、Webが普及していくことになります。この頃、日本ではNECのPC-98シリーズが隆盛を誇り、また1989年にゲームボーイが、1990年にスーパーファミコンが発売されています。16ビットOSであるMS-DOS全盛の時代であり、同時に16ビットの限界を見せていた時代です。NeXTSTEPというOS上でhttpdとWorldWideWebは開発されており、一般の人々がWebサイトを見られるようになるのはもう少し先になります。

最初のWebサイト info.cern.ch を現在でも見ることができます。

http://info.cern.ch/hypertext/WWW/TheProject.html

これはCERNが復刻公開したもので、このURLは1991年にBerners-Leeがalt.hypertextニュースグループに投稿したドキュメントに書かれているURLと全く同じURLです。公のドキュメントにURLが表されたのはこれが最初だと思われます。
上記のページのソースを見るとDOCTYPE宣言とHTML要素がないですが、現在の多くのブラウザはエラーを無視してページを表示してくれるようです。とても簡素なWebページです。

この時代のHTMLは標準がなくブラウザの実装者が自由にタグを決めてよい言語だったようです。Berners-LeeはHTML Design Constraintsという文書でHTMLの規範を示しています。HTMLは文書の構造を記述するものであり、文書の見た目はスタイルシートに記述するものとされています。しかし、実際のところはすべて実装に任せてしまっており、複数のWebブラウザが出現するとそれらの互換性が問題になってしまいました。

HTMLの普及と規格の策定

1995年にWindows95が発売されると、実用的なGUIが安価なPCで実現されました。このOSにはWebブラウザが同梱されていました。そのブラウザはInternet Explorerといい、最初のバージョンは表も表示できないものだったそうです。そんなIEですがバージョンが上がるにつれて機能を強化し、当時、最も人気があるブラウザだったNetscape Navigatorと覇権を争うようになります。両者は独自機能を実装し、文書の見た目をよくするためにHTMLにタグを追加していきました。
HTMLの標準化がタグの氾濫と互換性の問題を治めるために必要でした。
ようやく、World Wide Webの各種技術の標準化を目的として1994年に創設されたW3CによってHTML 3.2が1997年1月に勧告されました。しかし、HTML 3.2は一般化してしまったいくつかの独自拡張を含めた規格であり多くの批判を受けたそうです。このHTML 3.2に対する批判を受けて同年12月に素早くHTML 4.0が勧告されました。異例としてHTML 4.0は、使用するタグを定めた文書であるDTD(Document Type Definition)を複数用意しました。HTMLを書くときにDOCTYPE宣言で使用するDTDを宣言し、そしてそのDTDに従ったHTMLを書くわけです。HTML 3.2に含まれる、文書の見た目を記述するタグを許した過渡的なDTDとそれらを廃した厳格なDTDなどがあります。厳格なDTDに従うことのできるブラウザの実装がまだなかったためにこのような措置が取られたようです。なお1998年にHTML 4.0は改定され、1999年に修正が加えられたHTML 4.01が勧告されています。

現在はHTML5が2014年の正式勧告を目指して策定されています。広義のHTML5はGmailやTwitterのようなWebブラウザ上のアプリケーションを制作可能にする機能のことも指します。各ブラウザで共通のコードによってWebアプリケーションを動かすことを目的とした規格群がHTML5と呼ばれているわけです。主要なWebブラウザは現在すでにHTML5の実装が実用的にはできておりセキュリティの検証などが行われている段階のようです。

これからのHTMLの書き方

これからHTMLを書く場合、W3Cの勧告はまだありませんが、HTML5に従って書くことをおすすめします。すでに多くのブラウザがHTML5に対応しており、またHTML5は古いブラウザのことも考えられたうえで記述が簡潔になっています。ちなみにニコニコのサイトは、DOCTYPE宣言を見ると2014年3月現在、HTML 4.01のページとHTML5のページが混在してることがわかります。

混乱しそうな、HTMLとよく似た規格にXHTMLがあります。HTMLの構文をプログラムが処理しやすいXMLに従うように変更を加えたものがXHTMLであり、HTML 4.01の次世代の規格として期待されていたようです。しかし当時、XHTMLに対応していない古いブラウザが今よりも多く、また厳格な構文を要求するXHTMLは一般には普及しなかったようです。ただXHTMLは廃れてなくなってしまう規格というわけではなくHTML5と同時にXHTML5という規格が策定されています。HTMLとXHTMLとで処理を切り替えるためにブラウザはHTTPレスポンスヘッダに書かれたMIME型を確認します。HTMLのMIME型はtext/html、XHTMLのMIME型はapplication/xhtml+xmlとされています。このときのapplication型は「アプリケーションプログラム固有のフォーマット」を意味しています。MIME型の意味を考えるとXHTMLは特殊用途用のフォーマットだという位置付けのようです。

HTMLのひな形はこんな感じです。

<!DOCTYPE html>
<html lang="ja">
<head>
<meta charset="utf-8">
<title>プログラ</title>
<link rel="stylesheet" href="main.css">
</head>
<body>
<h1>プログラ</h1>
<p>本文</p>
</body>
</html>

文字の大きさや色、背景などはCSSに記述します。
タイトルや見出し、段落などの意味をタグによって記述します。
HTMLはこのように文書の構造的な意味を記述する言語です。
ブログやニコニコのサイトで、BRタグがレイアウトのために使われたりしてしまっていますが、本来の役割を考えると、これは誤用です。

Webがどんな形になっていくとしてもHTMLがWebの根幹であることに変わりありません。ブログやWikiなどがあるためHTMLを書く機会は減ったかもしれません。しかしHTMLを直接見る機会がなくても、あらゆるWebサイトがHTMLによって書かれていることは変わらず、HTMLを理解することがWebを理解する第一歩になります。

コメント

伊崎
No.1 (2014/04/22 13:50)
もっと歴史が古いのかと思ってましたが、1989年が始まりなんですね。
HTML 4.01が10年以上も使われ続けていたというのも驚きです。

HTML5が正式にリリースされるということは、新しいWEBの時代が始まるということなんですかね。
少し前から、よく「HTML5が~」という言葉を耳にしましたが、
そう考えると今各所で大きく取り上げられていることについても納得できました。

すごく読みやすくて分かりやすかったです。
ありがとうございました!
コメントを書き込むにはログインしてください。

いまブロマガで人気の記事