Nel mio codice C#, sto estraendo il testo da un documento PDF. Quando lo faccio, ottengo una stringa in codifica UTF-8 o Unicode (non sono sicuro su quale). Quando uso Encoding.UTF8.GetBytes(src);
per convertirlo in un array di byte, noto che lo spazio bianco è in realtà due caratteri con valori di byte di 194 e 160.Come risolvere la codifica UTF per gli spazi bianchi?
Ad esempio la stringa "azione CLE" si presenta come
[67, 76, 69, 194 ,160, 65 ,99, 116, 105, 111, 110]
in un array di byte, dove lo spazio bianco è 194 e 160 ... E a causa di questo src.IndexOf("CLE action");
restituisce -1 quando ne ho bisogno per restituire 1.
Come posso risolvere la codifica della stringa?
Come posso sostituire uno spazio non interrotto con uno spazio comune? – omega
@omega: src = src.Replace ('\ u00A0', ''); – RichieHindle