Il mio problema:Rimozione di caratteri nascosti dalle stringhe
Ho un'applicazione .NET che invia newsletter via email. Quando le newsletter sono visualizzate in Outlook, Outlook visualizza un punto interrogativo al posto di un personaggio nascosto che non può riconoscere. Questi personaggi nascosti provengono da utenti finali che copiano e incollano html che costituisce la newsletter in un modulo e lo invia. Un C# trim() rimuove questi caratteri nascosti se si verificano alla fine o all'inizio della stringa. Quando la newsletter viene visualizzata in gmail, gmail fa un buon lavoro ignorandoli. Quando si incollano questi caratteri nascosti in un documento word e si attiva l'opzione "mostra segni di paragrafo e simboli nascosti", i simboli appaiono come un rettangolo all'interno di un rettangolo più grande. Anche il testo che compone la newsletter può essere in qualsiasi lingua, quindi accettare i caratteri Unicode è obbligatorio. Ho provato ad andare in loop attraverso la stringa per rilevare il personaggio ma il loop non lo riconosce e lo passa sopra. Chiedendo anche all'utente finale di incollare l'html nel blocco note prima di inviarlo è fuori questione.
La mia domanda:
Come posso rilevare ed eliminare questi caratteri nascosti usando C#?
Mettere un esempio qui .. –
Esempio valori non validi sarebbe simpatico. Sto indovinando le sue stringhe Unicode in testo ascii, ma di nuovo questo è solo un tentativo. –
regex, consente solo lettere numeri –