Titre | Extensible Markup Language |
Catégorie | Données structurées et semi-structurées |
Abréviation | XML |
Extension de fichier | .xml |
Mime Type | application/xml, text/xml |
Pronom PUID | fmt/101 (XML 1.0), fmt/1776 (XML 1.1) |
Version | XML 1.0 [1] et XML 1.1 [2] suivent la recommandation du W3C (World Wide Web Consortium) |
XML est un format de texte pur qui permet de structurer et d'échanger des données. Il est lisible par l'homme et par la machine. Un XML est constitué d'éléments de données qui se composent de données structurelles (balises XML) et d’une charge utile (attributs, valeurs). XML est le format le plus important et le plus répandu pour l'échange de données structurées et semi-structurées. Une description détaillée du format est disponible dans [3] et dans [4]. Actuellement, il existe deux versions de XML (XML 1.0 [1] XML 1.1 [2]), basées sur une recommandation du consortium W3. Une représentation simplifiée de la structure d'un XML se trouve dans [1] (voir également l'illustration 1) et une liste des principales propriétés dans l'article du Cfa sur JSON.
Illustration 1 : structure d’un XML, illustration tirée de [3].
Ouverture du format: 4 Licence libre: 4 Diffusion: 4 Fonctionnalités: 4 Implémentation: 4 Densité de mémorisation: 3 Il existe de nombreux outils pour valider des fichiers XML (p. ex. Notepad++). Lors de la validation, on vérifie si la syntaxe respecte les points suivants de la recommandation W3C (voir des exemples : https://www.ibm.com/docs/en/b2bis?topic=syntax-xml-rules):
En plus d'une validation du format, une validation du schéma peut également être effectuée si un fichier XSD (XML Schema Definition File) est disponible. Le fichier XSD définit aussi bien les types de données utilisés que la structure d'un XML. Un fichier DTD peut également être présent à la place d'un XSD. Un DTD ne peut toutefois pas être utilisé pour la validation, car il ne contient que des informations sur les types d'éléments autorisés. Bonnes pratiques: 4 Perspectives: 3 Classe de formats: A |
Une analyse comparative de XML et JSON se trouve dans l'article du Cfa consacré à JSON.
XML répond parfaitement à la plupart des exigences archivistiques (à l'exception notable de la conservation de la mise en page) et est donc indiscutable en tant que format d'archivage. Pour les données structurées, le XML est actuellement préférable à d'autres formats de fichiers tels que JSON ou CSV, car il offre davantage de possibilités pour la description des données (voir l'article du Cfa sur JSON).
Extensible Markup Language (XML) 1.0 (Fifth Edition)
https://www.w3.org/TR/xml/
Extensible Markup Language (XML) 1.1 (Second Edition)
https://www.w3.org/TR/2006/REC-xml11-20060816/
[1] World Wide Web Consortium (W3C), „Extensible Markup Language (XML) 1.0 (Fifth Edition),“
https://www.w3.org/TR/xml/
[2] World Wide Web Consortium, „Extensible Markup Language (XML) 1.1 (Second Edition),“
https://www.w3.org/TR/2006/REC-xml11-20060816/
[3] Wikipedia, „Extensible Markup Language,“
https://fr.wikipedia.org/wiki/Extensible_Markup_Language
[4] S. Schinkinger, „XML-Kompression und optische Codierung für den Transfer von Geschäftsdokumenten,“ Universität Passau, Passau, 2016.
Catalogue des formats de fichiers pour l'archivage | version 7.0, juin 2024 |