Supponendo di dover utilizzare java, qual è il miglior parser html che sia flessibile per analizzare molti contenuti HTML diversi e non richiede anche un intero lotto di codice per eseguire tipi complessi di analisi?qual è il miglior parser html per java?
6
A
risposta
10
lo consiglio Jsoup per questo. Ha una API molto bella con supporto per jQuery like CSS selectors and non-verbose element iteration. Per fare una copia di this answer come esempio, viene stampato alla tua domanda e il nome di tutti i answerers qui:
URL url = new URL("https://stackoverflow.com/questions/3121136");
Document document = Jsoup.parse(url, 3000);
String question = document.select("#question .post-text").text();
System.out.println("Question: " + question);
Elements answerers = document.select("#answers .user-details a");
for (Element answerer : answerers) {
System.out.println("Answerer: " + answerer.text());
}
Un'alternativa sarebbe XPath, ma JSoup è più utile per webdevelopers che hanno già una buona conoscenza su Selettori CSS.
1
Problemi correlati
- 1. Html Agility Pack è ancora il miglior parser .NET HTML?
- 2. Qual è il miglior parser YAML in elisp?
- 3. Il miglior parser JSON per Qt?
- 4. Qual è il miglior editor per AutoHotkey?
- 5. qual è il miglior linguaggio di programmazione per scrivere parser e compilatori?
- 6. Qual è il miglior stack SIP Java in circolazione?
- 7. parser HTML per GAE
- 8. qual è il miglior linguaggio di programmazione per l'elaborazione video?
- 9. Quale parser HTML è il migliore?
- 10. Qual è il miglior componente di Wicket per il rendering di HTML arbitrario?
- 11. Qual è il miglior editor python?
- 12. Qual è il miglior editor XLIFF gratuito?
- 13. Qual è il miglior motore 3D Actionscript3?
- 14. Qual è il modo migliore per riutilizzare il parser Lua?
- 15. Qual è il miglior modulo Drupal Survey
- 16. Qual è il miglior blog di XNA?
- 17. Qual è il miglior objugatore di javascript?
- 18. Qual è il miglior font piccolo per Eclipse?
- 19. Qual è il miglior schema SQL per questo progetto?
- 20. Qual è il miglior tutorial per l'apprendimento di Mongoid?
- 21. Qual è il miglior sostituto per FlowDocument in Silverlight?
- 22. Qual è il miglior backend CouchDB per Django?
- 23. Qual è il miglior designer GUI per le app GTK?
- 24. Qual è il miglior libro di bioinformatica per un informatico?
- 25. Qual è il miglior IDE per lo sviluppo in Tomcat?
- 26. Qual è il miglior IDE per la programmazione DigitalMars D?
- 27. Qual è il miglior IDE per lo sviluppo su BlackBerry?
- 28. Qual è il miglior filesystem Linux per MySQL (InnoDB)?
- 29. Qual è il miglior valore per make -j
- 30. Qual è il miglior eBook per un principiante di Hibernate?
Grazie! Questo sembra fantastico. – egervari
Prego. – BalusC