UTF-8 encoding table and Unicode characters | Cerca per titolo, autore, parola chiave | ||||||||
UTF-8 encoding table and Unicode characters di Tomas Schild. In questo sito, sono riportate le corrispondenze tra codifica UTF-8 e caratteri Unicode. Lo standard internazionale ISO 10646 definisce lo Universal Character Set ( UCS ). UCS contiene tutti i caratteri necessari a rappresentare tutte le lingue esistenti. Alla fine degli anni '80, esistevano due progetti differenti per la creazione di un set universale di caratteri. Uno era il progetto ISO 10646 dell'International Organization for Standardization ( ISO). L'altro era il progetto Unicode, organizzato da un consorzio di produttori software. Fortunatamente, i partecipanti ai due progetti compresero presto che sarebbe stato auspicabile unire i loro sforzi e lavorare insieme, al fine di creare una tabella di caratteri universale. UCS ed Unicode sono un insieme di tabelle nelle quali a ciascun numero viene fatto corrispondere un carattere. Ma, la rappresentazione di ciascuno di quei numeri, o caratteri, presi come sequenze di byte, può differenziarsi in più algoritmi di codifica. UTF-8 è la più popolare tra queste codifiche.
|
|||||||||
UTF-8 encoding table and Unicode characters | Disclaimer: questo è un link a contenuti ospitati su server esterni. |