Ho un modulo HTML e alcuni utenti stanno copiando/incollando testo da MS Word. Quando ci sono le virgolette singole o doppi apici, essi vengono tradotti in caratteri divertenti come:Perché le virgolette diventano caratteri buffi quando vengono inviate in un modulo HTML?
' €  ™ e à ¢ â €  ™
La colonna del database è collazione utf8_general_ci.
Come visualizzare i caratteri appropriati?
Modifica: Problema risolto. Ecco come l'ho risolto:
Ran mysql_query("SET NAMES 'utf8'");
prima di aggiungere/resettare dal database. (grazie al commento di Donal qui sotto).
E un po 'strano, la funzione di php urlencode($text)
è stata applicata durante la visualizzazione, quindi è stato necessario rimuoverlo.
Mi sono anche assicurato che le intestazioni per la pagina e la richiesta/risposta ajax fossero tutte utf8.
MS Word modifica le virgolette in "virgolette", che sono tutt'altro che intelligenti. Usano una "code page" Microsoft al posto di Unicode. –
Lo noterete anche con alcuni trattini. – Buggabill
Se tutte le codifiche sono state specificate correttamente, queste dovrebbero essere automaticamente convertite nel loro equivalente Unicode. Dubito che il problema sia specifico di Word; prova a digitare per es. Alt + 130 (é) direttamente, e vedere se si imbatte in modo pulito. – Thomas