Nel nostro sito Web, alcuni utenti Mac hanno problemi quando copiano e incollano il testo da file PDF in una TextArea (gestita da TinyMCE). Tutti i caratteri accentati sono danneggiati e sono diventati ad esempio e?
per un é
, i?
per un î
, ecc. Non riesco a riprodurre questo problema con un computer Windows.PHP: carattere accentato e segni diacritici
Quando ho scritto il contenuto di TextArea su un file (prima di inserirlo nel database), ho appena scoperto che l'iniziale é
è visivamente diversa da quella tradizionale é
(su Vim, vedi sotto).
Infatti:
// the corrupted é - first line of the screenshot
echo bin2hex($char); // display 65cc81
// traditionnal é
echo bin2hex('é'); // display c3a9
Dopo aver cercato un sacco, eccomi qui: Sembra che Mac OS copie Unicode caratteri accentuato come una combinazione di due caratteri: nel nostro esempio, e + ́
. Finora, non ho trovato alcuna soluzione per sostituire corrotto é
con quello reale, per evitare e?
nel database.
E io sono un po 'disperata.
http://unicode.org/reports/tr15/ – hakre