RFC 3629 - UTF-8 | Cerca per titolo, autore, parola chiave | ||||||||
RFC 3629 - UTF-8 UTF-8, il transformation format di ISO 10646 ( UCS - UNICODE ). Request for Comments: 3629. Network Working Group. F. Yergeau. Novembre 2003. ISO/IEC 10646-1 definisce un set di caratteri chiamato Universal Character Set ( UCS ), che comprende la gran parte dei sistemi di scrittura esistenti al mondo, ed è lo stesso set di caratteri definito da Unicode. L'encoding proposto originariamente, però, non era compatibile con molte applicazioni e protocolli, e questo problema ha portato alla stesura di UTF-8, l'oggetto di questa memo. UTF-8 ha la peculiarità di preservare l'intero insieme di code point di ASCII, offrendo così una piena compatibilità con i file system, compilatori ed altri software che utilizzano i valori di ASCII. ISO/IEC 10646 e Unicode, infatti, definiscono diversi formati di codifica per il loro repertorio di caratteri: UTF-8, UCS-2, UTF-16, UCS-4 e UTF-32. In un formato di codifica ciascun carattere è rappresentato come una o più unità di codifica della grandezza di almeno due ottetti ( byte ), rendendo arduo il suo utilizzo in tante applicazioni e protocolli che assumono come base 7 o 8 bit. UTF-8, invece, ha una unità di codifica composta da un solo ottetto ( byte ). Questa memo sostituisce e rende obsoleta la RFC 2279.
|
|||||||||
RFC 3629 - UTF-8 | Disclaimer: questo è un link a contenuti ospitati su server esterni. |