Ho letto che C non definisce se un char è firmato o non firmato, e nella pagina GCC questo dice che può essere firmato su x86 e senza firma in PowerPPC e ARM.Char C domanda sulla codifica firmata/non firmata
Okey, sto scrivendo un programma con GLIB che definisce char come gchar (non più di questo, solo un modo per la standardizzazione).
La mia domanda è, che dire di UTF-8? Usa più di un blocco di memoria?
Dire che ho un
unsigned variabile stringa char * = "La mia stringa con il circuito di codifica UTF-8 ~> CA";
Sede, se dichiaro la mia variabile come
unsigned
avrò solo 127 valori (quindi il mio programma per immagazzinare più blocchi di MEM) o UTF-8 cambia anche in negativo?
Scusa se non riesco a spiegarlo correttamente, ma penso che sia un po 'complesso.
NOTA: Grazie per tutti rispondono
Non capisco come viene interpretato normalmente.
Penso che come ASCII, se ho un char firmato e non firmato sul mio programma, le stringhe hanno valori diferenziali, e questo porta a confondere, immaginarlo in utf8 così.
Se si utilizza una macchina moderna, il char senza segno supporta i valori 0..255. Ma UTF-8 è una codifica multi-byte: utilizza 1,4 byte per ogni carattere Unicode. –
Sto parlando di @Michael Burr ha detto. – drigoSkalWalker