Ho notato qualcosa di strano usando Nokogiri di recente. Tutto il codice HTML che avevo analizzato era stato dato all'inizio e alla fine dei tag <html>
e <body>
.Come impedire a Nokogiri di aggiungere tag <DOCTYPE>?
<!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.0 Transitional//EN\" \"http://www.w3.org/TR/REC-html40/loose.dtd\">\n<html><body>\n
Come impedire a Nokogiri di eseguire questa operazione?
IE, quando lo faccio:
doc = Nokogiri::HTML("<div>some content</div>")
doc.to_s
o:
doc.to_html
ottengo l'originale:
<html blah><body>div>some content</div></body></html>
quale versione di Nokogiri? – shingara
nokogiri (1.4.3.1) – holden