Nous différencions les jeux et les codages de caractères.
Traditionnellement, les jeux et les codages de caractères coïncidaient: un caractère était représenté directement par une séquence de bits. Cela s’applique notamment à:
Avec Unicode, les jeux et le codage de caractères sont séparés. Unicode définit en premier lieu les différents caractères des polices d’écriture respectives (jusqu’ici plus de 100 000) et leur attribue un dénommé code point, ou code caractère. Ce code caractère peut ensuite être converti de différentes manières dans une séquence de bits:
ASCII
American National Standards Institute (ANSI) X3.4-1967 (ASCII-1967)
ISO/IEC 646:1991, Technologie de l’information — Jeu ISO de caractères codés à 7 éléments pour l'échange d'information
https://www.iso.org/standard/4777.html
[payant]
ISO 8859
ISO/IEC 8859-1:1998, Technologie de l’information — Jeux de caractères graphiques codés sur un seul octet — Partie 1: Alphabet latin no. 1
https://www.iso.org/standard/28245.html
[payant]
http://std.dkuug.dk/jtc1/sc2/wg3/docs/n411.pdf
[gratuit, version bêta anglophone]
Unicode
Unicode 13.0.0
http://www.unicode.org/versions/Unicode13.0.0/
UTF-8
http://tools.ietf.org/html/rfc3629
Spolsky, Joel: The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)
http://www.joelonsoftware.com/articles/Unicode.html
Wikipédia, ISO 8859-1
http://fr.wikipedia.org/wiki/ISO_8859-1
Tero, Paul: Unicode, UTF8 & Character Sets: The Ultimate Guide
Smashing Magazine, 2012
https://www.smashingmagazine.com/2012/06/all-about-unicode-utf8-character-sets/
Unicode
UTF-8
http://www.utf-8.com/
Wikipedia: Comparatif de l’UTF-8 avec d’autres codages de caractères UNICODE
http://en.wikipedia.org/wiki/UTF-8#Advantages_and_disadvantages
Catalogue des formats de fichiers pour l'archivage | version 7.0, juin 2024 |