penso che è in gran parte storica, ma c'è una chiara distinzione. Una tabella codici è una tabella di ricerca, un particolare byte mappa per un determinato carattere. Le diverse code page usano differenti mappature. Nei tempi antichi, quelle mappature non venivano effettivamente eseguite. Il che richiedeva anche di disporre di caratteri con glifi che corrispondessero alla tabella codici. Ancora un problema oggi btw, le finestre di console hanno una pagina di codice.
Non esiste alcuna associazione in una codifica Unicode. Hanno semplicemente bisogno di spremere 32 bit in un formato efficiente. Diverse codifiche Unicode usano diversi modi per spremere i bit. Il personaggio ha sempre un valore fisso (codepoint in Unicode speak).
I file di testo con codifica UTF devono avere una distinta base che consente al lettore di rilevare automaticamente la codifica. Non esiste alcuna convenzione di questo tipo per i file di testo che sono stati codificati con una tabella codici. Ottenere un buon testo da loro è un po 'un tiro di merda. È un male che dovrebbe morire già :)
fonte
2010-08-25 21:04:44
+1 Grazie per il collegamento dell'articolo! –