ho cercato di analizzare HTML con il HtmlAgilityPack nel seguente modo:Rimuovere gli spazi bianchi e ritorni a capo durante l'analisi con HtmlAgilityPack
HtmlDocument htmlDoc = new HtmlDocument();
htmlDoc.LoadHtml(xhtmlString);
Purtroppo la xhtmlString contiene spazi vuoti inutili e caratteri di nuova riga, in modo che il _text di HTMLDOC ora assomiglia a questo :
<html xmlns=\"http://www.w3.org/1999/xhtml\">\n\t<head></head>\n\t<body>\n\n<p>Alle Auktionen<br /></p>\n\n\t</body>\n</html>
Questo è un problema per me quando si lavora con gli elementi figlio del corpo.
Qual è il modo più semplice per rimuovere questi caratteri non necessari?
HtmlAgilityPack offre qualche tipo di funzione per la pulizia dell'HTML da newline e schede?
C'è un modo si potrebbe usare String.Replace per risolvere questo? –