Unicode

> >

Passage de ISO-8859-1 à UTF-8 - La Cellule Informatique de l'IMB. Préambule La représentation informatique des caractères (lettres, chiffres, symboles) est standardisée très tôt, avec l’apparition du code ASCII vers 1960.

Malheureusement, ce standard ne concerne qu’un petit nombres de caractères, juste suffisant pour l’écriture de textes en anglais ou de programmes. Plusieurs extensions (ISO 646, CP437, Mac OS Roman...) sont développées pour étendre ce format, par exemple pour représenter des caractères accentués. Elles sont hélas incompatibles et rendent problématiques l’échange de textes d’un système à l’autre.

[Haskell] Unicode advice request. Conrad Parker: Survey: Haskell Unicode support. Charsets et encoding. ( Cet article est la traduction française de ) Si vous pensez que texte = ASCII = 8 bits = 1 octet par caractère, vous avez tout faux. C'est une façon de voir très étriquée. Il y a quelquechose que tout développeur devrait savoir, sans quoi il se prendra forcément les pieds dedans un jour ou l'autre: Charsets et encoding (Jeux de caractères et encodage)