2010-10-04 14 views
5

Ho un'applicazione C# che riceve un file html. Voglio analizzare e convalidarlo. All'uscita restituirà un elenco di errori o che il mio html è valido.Come convalidare un file html con C#?

Qualcuno ha idea di come posso fare questo?

+0

possibile duplicato di [Qual è il modo migliore di analizzare il codice HTML in C#?] (Http://stackoverflow.com/questions/56107/what-is-the-best-way -to-parse-html-in-c) –

+2

La parte di convalida di questa domanda lo rende molto diverso dalle domande relative alla semplice analisi dell'HTML. – Quentin

+0

Esatto, non mi interessa analizzare l'html, sono interessato a convalidarlo per possibili errori. –

risposta

1

Ciò è rilevante alla tua domanda: (!)

Looking for C# HTML parser

+0

Non proprio. È alla ricerca di qualcosa che possa recuperare dagli errori, non testarli. – Quentin

+0

Sì, gli errori possono essere recuperati da molte delle opzioni elencate all'interno. – Dave

+2

Un po 'più di dettaglio su di loro sarebbe bello, non penso che la caccia attraverso le risposte rivela quell'informazione, quindi le persone dovrebbero esaminare la documentazione per ciascuno di essi a turno. – Quentin

1

C'è un DLL oscura nella versione 1.0 quadro Microsoft.mshtml.dll e che è l'unico modo nel quadro per gestire DOM. Se HTML è XHTML e un XML valido, allora puoi usare XML ma altrimenti questa è l'unica possibilità.

+0

Sarei sorpreso che quello fosse il * solo * modo di trattare con DOM. – Quentin

+0

Nel framework Mr negativo ... – Aliostad

+0

hmmm, spiegami come puoi convalidare un file html molto elaborato con xml. Ci ho pensato anch'io, e penso che non sia il modo migliore. –

3

È possibile utilizzare HTML Tidy. Esiste un wrapper per .NET chiamato TidyManaged

+1

TidyManaged non fornisce alcuna dll funzionale –

+1

Hai provato qui? http://github.com/markbeaton/TidyManaged/downloads – gcores

+0

Ho un post su blog tidy.net e tidymanaged http://www.jphellemons.nl/post/Tidy-your-HTML-with-AspNet-TidyManaged-vs- Tidynet.aspx –

Problemi correlati