Sto analizzando molti siti. Tutto funziona bene, sto leggendo anche le dichiarazioni del charset per convertire le codifiche. Ora ho un problema con http://celleheute.de/sonntagsfuhrung-3/.Preferire la dichiarazione del set di caratteri nel metatag HTML o nell'intestazione HTTP?
Il meta tag HTML dice che il contenuto è codificato come ISO-8859-2, ma l'intestazione HTTP dice che è UTF-8. E in realtà, il contenuto è codificato in UTF, quindi quando il mio parser tenta di convertire il contenuto in ISO, si romperanno alcuni caratteri.
Ora la mia domanda è, quale dichiarazione dovrei preferire? Devo ignorare i meta tag, quando posso trovare la dichiarazione nell'intestazione HTTP o viceversa? Cosa farà la maggior parte dei browser web?