come classe DOMDocument in PHP, esiste una classe in RUBY (cioè il core RUBY), per analizzare e ottenere il valore degli elementi del nodo da un documento HTML.Metodo per analizzare il documento HTML in Ruby?
risposta
Non esiste ancora un parser HTML incorporato, ma alcuni sono disponibili, in particolare Nokogiri.
Meta-risposta: per esigenze comuni come queste, mi consiglia di controllare il sito Ruby Toolbox. Noterai che Nokogiri è la migliore raccomandazione per HTML parsers
Si consiglia di verificare hpricot. È straordinariamente buono. Non è un rubino "core", ma è una gemma comunemente usata.
Puoi provare anche Oga di Yorick Peterse.
È un parser XML/HTML scritto in Ruby che non richiede librerie di sistema come libxml. Potete trovare qui. https://github.com/YorickPeterse/oga
Ruby Cheerio - Un parser HTML in stile jQuery in rubino. Una versione semplificata di Nokogiri per i crawler. Questa è la versione rubino del pacchetto NodeJS più popolare cheerio.
Follow the link for a simple crawler example.
gem install ruby-cheerio
require 'ruby-cheerio'
jQuery = RubyCheerio.new("<html><body><h1 class='one'>h1_1</h1><h1>h1_2</h1></body></html>")
jQuery.find('h1').each do |head_one|
p head_one.text
end
# getting attribute values like jQuery.
p jQuery.find('h1.one')[0].prop('h1','class')
# function chaining similar to jQuery.
p jQuery.find('body').find('h1').first.text
Ottimo approccio! Bella raccomandazione! Grazie a @dineshsprabu. –
Grazie Fernando Kosh – dineshsprabu
- 1. Utilizzando XPath per analizzare un documento XML
- 2. Come utilizzare ScrapySharp per analizzare gli elementi in un documento html?
- 3. analizzare il file HTML locale
- 4. Documento HTML in PDF?
- 5. Python aggiorna il documento HTML
- 6. Striscia di testo da un documento HTML usando Ruby
- 7. Tagsoup non riesce ad analizzare il documento HTML da una StringReader (java)
- 8. Come analizzare HTML malformato in python
- 9. Libreria per convertire il testo del documento Word in HTML
- 10. Come analizzare HTML in PHP?
- 11. Analizzare gli indirizzi stradali in Ruby
- 12. Come analizzare il file html usando clojure?
- 13. Swift: il modo più veloce per analizzare HTML
- 14. Ottieni il documento Google come HTML
- 15. Incorpora dati grezzi in HTML per analizzare in jQuery
- 16. Quale documento HTML?
- 17. Formato documento HTML
- 18. Libreria per analizzare SVG in Ruby o Python
- 19. Eredita il metodo initialize() in ruby?
- 20. Come analizzare facilmente il JSON multidimensionale in html?
- 21. Ruby "count" metodo per hash
- 22. Aggiornamenti del documento usando il driver mongo-ruby?
- 23. Come analizzare HTML in DOM con Grunt
- 24. Qual è il simbolo del metodo per + = in ruby?
- 25. Il metodo `nodes()` mantiene l'ordine del documento?
- 26. Argomenti metodo sistema ruby
- 27. Come analizzare e modificare il file HTML in Java
- 28. Python: Esiste un pacchetto integrato per analizzare html in dom
- 29. Come utilizzare le espressioni regolari per analizzare HTML in Java?
- 30. Carica documento html in javascript dal testo
Hpricot purtroppo non c'è più. Nokogiri è ora la soluzione preferita. – superluminary