DE  |  FR  |  IT

HTML

Informations générales

TitreHypertext Markup Language; Langage de balisage hypertexte
CatégorieHypertexte
AbréviationHTML
Extension de fichier.html et .htm
Mime Typetext/html et application/xhtml+xml
Pronom PUIDfmt/96, fmt/97, fmt/98, fmt/99, fmt/100, fmt/102, fmt/103
VersionHTML 2.0 est la première version formellement spécifiée par le World Wide Web Consortium (W3C) en 1995. Les versions principales suivantes sont la 3.2 et la 4.0. En 2002 elles sont enrichies par XHTML et après une longue interruption dans le développement, elles sont remplacées fin 2014 par HTML5.

Description

HTML est un langage de balisage basé sur du texte destiné à structurer des documents numériques. HTML utilise des balises plus ou moins explicites pour la structuration sémantique, le formatage exact du balisage revenant au logiciel d’affichage (navigateur) et à la mise en page (CSS). En plus de structurer, le HTML permet d’inclure des liens, des métadonnées et des images. Le HTML est une forme simplifiée du langage de balisage SGML développé spécialement pour le web.

Evaluation

Ouverture du format: 4
La spécification HTML est administrée et développée par le World Wide Web Consortium (W3C).

Licence libre: 3
Il n’existe pas de patente connue pour le HTML.

Diffusion: 4
Par sa diffusion sur le web, le format est l’un des plus répandus du monde informatique.

Fonctionnalités: 2
Le HTML couvre complètement les fonctionnalités des données hypertextes. La séparation de la sémantique et de la forme a en revanche perdu de son importance avec le temps, bien qu’une réglementation claire existe avec la séparation HTML/CSS. Beaucoup de pages internet mettent l’accent sur la présentation graphique dans la fenêtre du navigateur.

Implémentation: 4
Il existe plusieurs implémentations de navigateurs techniquement indépendantes les unes des autres pour HTML 2.0 jusqu’à 4.1.

Densité de mémorisation: 2
À cause de l’utilisation de balises redondantes, la densité de mémorisation n’est pas très élevée.

Vérifiabilité: 3
Dans les versions HTML plus récentes, on peut visualiser aussi bien la version que le codage des signes depuis l’en-tête du fichier (header) et les métadonnées. De ce point de vue, les versions plus anciennes sont peu fiables. Il existe divers validateurs HTML, mais en raison de la grande tolérance aux erreurs de la plupart des navigateurs, il existe également beaucoup de codes HTML invalides.

Bonnes pratiques: 1
HTML n’est pas recommandé ni utilisé comme format d’archivage.

Perspectives: 1
Seul HTML5 présente un potentiel en vue de développer un format adapté pour l’archivage.

Classe de formats: A
Il s’agit d’un des plus anciens formats du domaine de l’informatique

Conclusion

Du fait de la séparation de la structure des contenus et de la présentation formelle, le format répondrait en fait aux besoins de base de l’archivage numérique, puisqu’il rendrait l’archivage indépendant du développement du logiciel de visualisation. Par contre, le développement très rapide de la technologie des navigateurs a modifié entretemps le format et il s’avère que le contenu de beaucoup de pages internet n’est compréhensible que si la présentation graphique est correcte. Cela signifie que c'est dans une large mesure la rétrocompatibilité du navigateur qui garantit le fait que nous puissions regarder les anciennes pages internet dans leur apparence initiale et en comprendre le contenu.
La nécessité d’archiver séparément les ressources externes qui vont avec chaque page HTML a un effet très négatif et a mené au développement de formats conteneurs pour pages HTML tels que MHTML, ARC et WARC.

Références

Hypertext Markup Language - 2.0, September 22, 1995
https://www.w3.org/MarkUp/html-spec/html-spec_toc.html
HTML 3.2 Reference Specification, W3C Recommendation 14-Jan-1997
https://www.w3.org/TR/REC-html32
HTML 4.01 Specification, W3C Recommendation 24 December 1999
https://www.w3.org/TR/html4/
XHTML (TM) 1.0 The Extensible HyperText Markup Language (Second Edition), A Reformulation of HTML 4 in XML 1.0, W3C Recommendation 26 January 2000, revised 1 August 2002
https://www.w3.org/TR/xhtml1/

Bibliographie

Ian S. Graham « The HTML SourceBook » New York, 1995
Rainer Klute « Das World Wide Web » Bonn Addison-Wesley, 1996
Erik Wilde « World Wide Web, Technische Grundlagen » Berlin Heidelberg, 1999

Articles connexes

HTML5
MHTML

Catalogue des formats de fichiers pour l'archivage version 6.2, décembre 2021