PHP "pretty print" HTML (non Tidy)

Sto usando l'estensione DOM in PHP per creare alcuni documenti HTML e voglio che l'output sia formattato correttamente (con nuove linee e rientri) in modo che sia leggibile, tuttavia , dai numerosi test che ho fatto:PHP "pretty print" HTML (non Tidy)

"formatOutput = true" non funziona affatto con saveHTML(), solo saveXML()
Anche se ho usato saveXML(), è ancora solo funziona sugli elementi creati tramite il DOM, non sugli elementi inclusi con loadHTML(), anche con "preserveWhiteSpace = false"

Se qualcuno lo sa diversamente, mi piacerebbe davvero sapere come l'hanno fatto funzionare.

Quindi, ho un documento DOM e sto usando saveHTML() per emettere l'HTML. Dal momento che proviene dal DOM, so che è valido, non è necessario "Tidy" o convalidarlo in alcun modo.

Sto semplicemente cercando un modo per ottenere un output ben formattato dall'output ricevuto dall'estensione DOM.

NB. Come avrai intuito, non voglio usare l'estensione Tidy come a) lo fa molto di più che ne ho bisogno anche io (il markup è già valido) eb) in realtà apporta modifiche al contenuto HTML (come il doctype HTML 5 e alcuni elementi).

Follow Up:

OK, con l'aiuto della risposta qui sotto ho lavorato perché l'estensione DOM non funzionava. Sebbene l'esempio dato funzioni, non funzionava ancora con il mio codice. Con l'aiuto del commento this ho scoperto che se si hanno nodi di testo in cui isWhitespaceInElementContent() è true, non verrà applicata alcuna formattazione oltre quel punto. Ciò accade indipendentemente dal fatto che preserveWhiteSpace sia o meno falso. La soluzione è rimuovere tutti questi nodi (anche se non sono sicuro che ciò possa avere effetti negativi sul contenuto effettivo).

fonte

2009-04-20 Jack Sleight

hai ragione, non sembra esserci alcun rientro per HTML (others are also confused). XML funziona, anche con il codice caricato.

<?php 
function tidyHTML($buffer) { 
    // load our document into a DOM object 
    $dom = new DOMDocument(); 
    // we want nice output 
    $dom->preserveWhiteSpace = false; 
    $dom->loadHTML($buffer); 
    $dom->formatOutput = true; 
    return($dom->saveHTML()); 
} 

// start output buffering, using our nice 
// callback function to format the output. 
ob_start("tidyHTML"); 

?> 
<html> 
    <head> 
    <title>foo bar</title><meta name="bar" value="foo"><body><h1>bar foo</h1><p>It's like comparing apples to oranges.</p></body></html> 
<?php 
// this will be called implicitly, but we'll 
// call it manually to illustrate the point. 
ob_end_flush(); 
?>

risultato:

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd"> 
<html> 
<head> 
<title>foo bar</title> 
<meta name="bar" value="foo"> 
</head> 
<body> 
<h1>bar foo</h1> 
<p>It's like comparing apples to oranges.</p> 
</body> 
</html>

lo stesso con saveXML() ...

<?xml version="1.0" standalone="yes"?> 
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd"> 
<html> 
    <head> 
    <title>foo bar</title> 
    <meta name="bar" value="foo"/> 
    </head> 
    <body> 
    <h1>bar foo</h1> 
    <p>It's like comparing apples to oranges.</p> 
    </body> 
</html>

probabilmente dimenticato di impostare PreserveWhitespace = false prima loadHTML?

disclaimer: ho rubato la maggior parte del codice demo da tyson clugg/php manual comments. pigro me.

UPDATE: Ora ricordo qualche anno fa ho provato la stessa cosa e incontrato lo stesso problema. Ho risolto questo problema applicando una soluzione sporca (non era critico per le prestazioni): ho solo in qualche modo convertito tra SimpleXML e DOM fino a quando il problema non fosse scomparso. Suppongo che la conversione si sia sbarazzata di quei nodi.forse caricare con dom, importare con simplexml_import_dom, quindi stampare la stringa, analizzare questo con DOM di nuovo e quindi stamparlo piuttosto. per quanto mi ricordo ha funzionato (ma era in realtà lento).

fonte

2009-04-20 14:04:47 stefs

Grazie. Con i tuoi esempi e i commenti su php.net ho risolto il problema (vedi il seguito sopra). –

La soluzione con DOM mi sembra abbastanza pesante. Quanto è veloce o lento? Vale la pena utilizzarlo anche su piccoli frammenti o solo sull'intera pagina? – sumid

Si è verificato un problema durante l'utilizzo di 'saveXML()' con alcuni tag senza valore come '' lo converte in ' 'c'è un modo per sistemarlo? – <span class="text-secondary"> <small> <span></span> </small> </span> </p> </div> </div> </div> </div> </div> </article> <div> <script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="4319274062" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <article class="board-top-1 padding-top-10"> <div class="post-col vote-info"> <span class="count">5<i class="fa fa-thumbs-up"></i></span> </div> <div class="post-offset"> <div class="answer fmt"> <p>Quando ho avuto un po 'di XML namespace TidyHTML non piaceva, sono imbattuto in questo:</p> <p><a href="http://gdatatips.blogspot.com/2008/11/xml-php-pretty-printer.html" rel="noreferrer">http://gdatatips.blogspot.com/2008/11/xml-php-pretty-printer.html</a></p> </div> <div class="post-info"> <div class="post-meta row"> <p class="text-secondary col-lg-6"> <span class="source"> <a rel="noopener" target="_blank" href="https://stackoverflow.com/q/3534409">fonte</a> </span> </p> <p class="text-secondary col-lg-6"> <span class="float-right date"> <span>2010-08-20 19:54:38</span> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/194021/">Garvin</a></span> </p> <p class="col-12"></p> <p class="col-12"></p></div> </div> </div> </article> <article class="board-top-1 padding-top-10"> <div class="post-col vote-info"> <span class="count">0<i class="fa fa-thumbs-up"></i></span> </div> <div class="post-offset"> <div class="answer fmt"> <p>È possibile utilizzare il codice per la funzione <a href="http://www.bioinformatics.org/phplabware/sourceer/sourceer.php?&Sfs=htmLawed.php&Sl=.%2Finternal_utilities%2FhtmLawed" rel="nofollow">hl_tidy</a> della biblioteca <a href="http://www.bioinformatics.org/phplabware/internal_utilities/htmLawed/index.php" rel="nofollow">htmLawed</a>.</p> <pre><code class="prettyprint-override">// indent using one tab per indent, with all HTML being within an imaginary div $out = hl_tidy($in, 't', 'div') </code></pre> </div> <div class="post-info"> <div class="post-meta row"> <p class="text-secondary col-lg-6"> <span class="source"> <a rel="noopener" target="_blank" href="https://stackoverflow.com/q/11936506">fonte</a> </span> </p> <p class="text-secondary col-lg-6"> <span class="float-right date"> <span>2012-08-13 14:37:01</span> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/594694/">user594694</a></span> </p> <p class="col-12"></p> <p class="col-12"></p></div> </div> </div> </article> </div> <div class="clearfix"> </div> <div class="relative-box"> <div class="relative">Problemi correlati</div> <ul class="relative_list"> <li> 1. <a href="http://it.voidcc.com/question/p-etrmaclf-cb.html" target="_blank" title="Pretty print namedtuple"> Pretty print namedtuple </a> </li> <li> 2. <a href="http://it.voidcc.com/question/p-bjowhazb-br.html" target="_blank" title="Pretty print JSON python"> Pretty print JSON python </a> </li> <li> 3. <a href="http://it.voidcc.com/question/p-behlgsay-cd.html" target="_blank" title="Winston non si pretty-print per consolare"> Winston non si pretty-print per consolare </a> </li> <li> 4. <a href="http://it.voidcc.com/question/p-kcorginm-o.html" target="_blank" title="Pretty-Print JSON in Java"> Pretty-Print JSON in Java </a> </li> <li> 5. <a href="http://it.voidcc.com/question/p-fsteaayc-cb.html" target="_blank" title="Pretty Print SQL in Ruby"> Pretty Print SQL in Ruby </a> </li> <li> 6. <a href="http://it.voidcc.com/question/p-dxwunjul-h.html" target="_blank" title="Nome modello C++ pretty print"> Nome modello C++ pretty print </a> </li> <li> 7. <a href="http://it.voidcc.com/question/p-woyxjuxr-v.html" target="_blank" title="Pretty Print Distances per iOS"> Pretty Print Distances per iOS </a> </li> <li> 8. <a href="http://it.voidcc.com/question/p-nmocyuqy-by.html" target="_blank" title="PHP HTML Tidy: limite dimensioni al buffer"> PHP HTML Tidy: limite dimensioni al buffer </a> </li> <li> 9. <a href="http://it.voidcc.com/question/p-vxzqzgfm-br.html" target="_blank" title="JSON pretty-print senza modificare l'ordine"> JSON pretty-print senza modificare l'ordine </a> </li> <li> 10. <a href="http://it.voidcc.com/question/p-hgfkzliq-s.html" target="_blank" title="Codice sorgente haskell pretty-print con commenti"> Codice sorgente haskell pretty-print con commenti </a> </li> <li> 11. <a href="http://it.voidcc.com/question/p-hhrasgsx-bg.html" target="_blank" title="Pretty print ByteString to hex nibble-wise"> Pretty print ByteString to hex nibble-wise </a> </li> <li> 12. <a href="http://it.voidcc.com/question/p-tnhhswqj-bc.html" target="_blank" title="json pretty-print in python (modo pythonic)"> json pretty-print in python (modo pythonic) </a> </li> <li> 13. <a href="http://it.voidcc.com/question/p-menxlhfi-bx.html" target="_blank" title="pretty print to a file in ruby "> pretty print to a file in ruby </a> </li> <li> 14. <a href="http://it.voidcc.com/question/p-pztfjvyp-n.html" target="_blank" title="Pretty-print per script di shell"> Pretty-print per script di shell </a> </li> <li> 15. <a href="http://it.voidcc.com/question/p-eaqrvtef-ca.html" target="_blank" title="Pretty-print una mappa in Java"> Pretty-print una mappa in Java </a> </li> <li> 16. <a href="http://it.voidcc.com/question/p-khqmesjv-bm.html" target="_blank" title="TextFX HTML sostituzione Tidy (formato HTML)"> TextFX HTML sostituzione Tidy (formato HTML) </a> </li> <li> 17. <a href="http://it.voidcc.com/question/p-dxkbcccx-u.html" target="_blank" title="Tidy HTML output con javascript"> Tidy HTML output con javascript </a> </li> <li> 18. <a href="http://it.voidcc.com/question/p-gswzpmyg-g.html" target="_blank" title="Versione C# di HTML Tidy?"> Versione C# di HTML Tidy? </a> </li> <li> 19. <a href="http://it.voidcc.com/question/p-wrdxheek-q.html" target="_blank" title="Configurazione e utilizzo di HTML Tidy"> Configurazione e utilizzo di HTML Tidy </a> </li> <li> 20. <a href="http://it.voidcc.com/question/p-xykiofbr-c.html" target="_blank" title="php: echo "", print(), printf()"> php: echo "", print(), printf() </a> </li> <li> 21. <a href="http://it.voidcc.com/question/p-sgkxvrlc-q.html" target="_blank" title="Rientro, codice pretty-print tra cui i tag template Django, HTML, CSS e JavaScript"> Rientro, codice pretty-print tra cui i tag template Django, HTML, CSS e JavaScript </a> </li> <li> 22. <a href="http://it.voidcc.com/question/p-nwayiwnb-bv.html" target="_blank" title="Problemi con l'utilizzo di GSON a pretty-print JSON String"> Problemi con l'utilizzo di GSON a pretty-print JSON String </a> </li> <li> 23. <a href="http://it.voidcc.com/question/p-pdfgefqt-bh.html" target="_blank" title="Modulo per Pretty Printing HTML?"> Modulo per Pretty Printing HTML? </a> </li> <li> 24. <a href="http://it.voidcc.com/question/p-zekmrqeg-p.html" target="_blank" title="commenti di strip da file xml e pretty-print it"> commenti di strip da file xml e pretty-print it </a> </li> <li> 25. <a href="http://it.voidcc.com/question/p-xgmgmvju-ba.html" target="_blank" title="HTML debug pretty-printing per Python"> HTML debug pretty-printing per Python </a> </li> <li> 26. <a href="http://it.voidcc.com/question/p-aszuddcz-by.html" target="_blank" title="Pretty URLs in framework PHP"> Pretty URLs in framework PHP </a> </li> <li> 27. <a href="http://it.voidcc.com/question/p-odprwdfz-x.html" target="_blank" title="HTML Tidy nuova riga vuota dopo il tag di chiusura"> HTML Tidy nuova riga vuota dopo il tag di chiusura </a> </li> <li> 28. <a href="http://it.voidcc.com/question/p-sscfimvo-r.html" target="_blank" title="Esiste un'alternativa all'HTML Tidy?"> Esiste un'alternativa all'HTML Tidy? </a> </li> <li> 29. <a href="http://it.voidcc.com/question/p-gkmhlxbp-by.html" target="_blank" title="HTML/Javascript One Click Print (senza dialoghi)"> HTML/Javascript One Click Print (senza dialoghi) </a> </li> <li> 30. <a href="http://it.voidcc.com/question/p-ukwqfjrn-bt.html" target="_blank" title="Disabilita html syntasic/tidy checker per un file"> Disabilita html syntasic/tidy checker per un file </a> </li> </ul> </div> <div> <script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-format="autorelaxed" data-ad-client="ca-pub-6208739752673518" data-ad-slot="3534119089"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="padding-top-10"></div> </div> </div> <script type="text/javascript" src="http://img2.voidcc.com/voidso/script/side.js?t=1652515422436"></script> <script type="text/javascript" src="http://img2.voidcc.com/voidso/plugin/highlight/highlight.pack.js"></script> <link href="http://img2.voidcc.com/voidso/plugin/highlight/styles/docco.css" media="screen" rel="stylesheet" type="text/css" /> <script type="text/javascript"> $('pre').each(function(i, e) { hljs.highlightBlock(e, "<span class='indent'> </span>", false) }); </script> <div class="col-lg-3 col-md-4 col-sm-5"> <div id="rightTop"> <div class="row"> <script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script>  <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="3862022848" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="row sidebar panel panel-default"> <div class="panel-heading font-bold"> Ultima domanda </div> <div class="m-b-sm m-t-sm clearfix"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://it.voidcc.com/question/p-onudfjad-cd.html" target="_blank" title="Conversione di array di stringhe C in array di stringhe Swift"> Conversione di array di stringhe C in array di stringhe Swift </a> </li> <li class="side_article_list_item"> 2. <a href="http://it.voidcc.com/question/p-hfbnxsbe-bu.html" target="_blank" title="Perché la serializzazione Spring MVC json è 10 volte più lenta rispetto alla chiamata manuale di jackson?"> Perché la serializzazione Spring MVC json è 10 volte più lenta rispetto alla chiamata manuale di jackson? </a> </li> <li class="side_article_list_item"> 3. <a href="http://it.voidcc.com/question/p-esmfuafw-bn.html" target="_blank" title="Tipo 'URL' non ha alcun membro 'fileURL' - Swift 3"> Tipo 'URL' non ha alcun membro 'fileURL' - Swift 3 </a> </li> <li class="side_article_list_item"> 4. <a href="http://it.voidcc.com/question/p-gcukvpuf-bp.html" target="_blank" title="Errore tensore: "Il tensore deve provenire dallo stesso grafico del tensore ...""> Errore tensore: "Il tensore deve provenire dallo stesso grafico del tensore ..." </a> </li> <li class="side_article_list_item"> 5. <a href="http://it.voidcc.com/question/p-xulsxekr-by.html" target="_blank" title="come convertire una matrice di valori in una matrice binaria"> come convertire una matrice di valori in una matrice binaria </a> </li> <li class="side_article_list_item"> 6. <a href="http://it.voidcc.com/question/p-dovjdwft-br.html" target="_blank" title="Differenze tra RxJava1 e RxJava2"> Differenze tra RxJava1 e RxJava2 </a> </li> <li class="side_article_list_item"> 7. <a href="http://it.voidcc.com/question/p-uwivakvf-bm.html" target="_blank" title="Utilizzo di LocalStorage con React?"> Utilizzo di LocalStorage con React? </a> </li> <li class="side_article_list_item"> 8. <a href="http://it.voidcc.com/question/p-urttivsw-bo.html" target="_blank" title="Qual è la differenza tra Task.Run() e Task.Factory.StartNew()"> Qual è la differenza tra Task.Run() e Task.Factory.StartNew() </a> </li> <li class="side_article_list_item"> 9. <a href="http://it.voidcc.com/question/p-hjksfmuz-bn.html" target="_blank" title="Risorse riferimento dal manifesto non può variare in base alla configurazione"> Risorse riferimento dal manifesto non può variare in base alla configurazione </a> </li> <li class="side_article_list_item"> 10. <a href="http://it.voidcc.com/question/p-yvhoxmiw-bw.html" target="_blank" title="devise_token_auth & Rails 5 - IndexError: stringa non abbinati"> devise_token_auth & Rails 5 - IndexError: stringa non abbinati </a> </li> </ul> </div> </div> </div> <p class="article-nav-bar"></p> <div class="row sidebar article-nav"> <div class="row box_white visible-sm visible-md visible-lg margin-zero"> <div class="top"> <h3 class="title"><i class="glyphicon glyphicon-th-list"></i> Problemi correlati</h3> </div> <div class="article-relative-content"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://it.voidcc.com/question/p-etrmaclf-cb.html" target="_blank" title="Pretty print namedtuple"> Pretty print namedtuple </a> </li> <li class="side_article_list_item"> 2. <a href="http://it.voidcc.com/question/p-bjowhazb-br.html" target="_blank" title="Pretty print JSON python"> Pretty print JSON python </a> </li> <li class="side_article_list_item"> 3. <a href="http://it.voidcc.com/question/p-behlgsay-cd.html" target="_blank" title="Winston non si pretty-print per consolare"> Winston non si pretty-print per consolare </a> </li> <li class="side_article_list_item"> 4. <a href="http://it.voidcc.com/question/p-kcorginm-o.html" target="_blank" title="Pretty-Print JSON in Java"> Pretty-Print JSON in Java </a> </li> <li class="side_article_list_item"> 5. <a href="http://it.voidcc.com/question/p-fsteaayc-cb.html" target="_blank" title="Pretty Print SQL in Ruby"> Pretty Print SQL in Ruby </a> </li> <li class="side_article_list_item"> 6. <a href="http://it.voidcc.com/question/p-dxwunjul-h.html" target="_blank" title="Nome modello C++ pretty print"> Nome modello C++ pretty print </a> </li> <li class="side_article_list_item"> 7. <a href="http://it.voidcc.com/question/p-woyxjuxr-v.html" target="_blank" title="Pretty Print Distances per iOS"> Pretty Print Distances per iOS </a> </li> <li class="side_article_list_item"> 8. <a href="http://it.voidcc.com/question/p-nmocyuqy-by.html" target="_blank" title="PHP HTML Tidy: limite dimensioni al buffer"> PHP HTML Tidy: limite dimensioni al buffer </a> </li> <li class="side_article_list_item"> 9. <a href="http://it.voidcc.com/question/p-vxzqzgfm-br.html" target="_blank" title="JSON pretty-print senza modificare l'ordine"> JSON pretty-print senza modificare l'ordine </a> </li> <li class="side_article_list_item"> 10. <a href="http://it.voidcc.com/question/p-hgfkzliq-s.html" target="_blank" title="Codice sorgente haskell pretty-print con commenti"> Codice sorgente haskell pretty-print con commenti </a> </li> </ul> </div> </div> </div> </div> </div> </div> </div>  <footer id="footer"> <div class="bg-simple lt"> <div class="container"> <div class="row padder-v m-t"> <div class="col-xs-8"> <ul class="list-inline"> <li><a href="http://it.voidcc.com/contact">Contattaci</a></li> <li>© 2020 IT.VOIDCC.COM</li> <li><a rel="nofollow" href="https://beian.miit.gov.cn/" target="_blank">沪ICP备13005482号-13</a></li> <li><script type="text/javascript" src="https://s9.cnzz.com/z_stat.php?id=1280098168&web_id=1280098168"></script></li> <li><a href="http://cn.voidcc.com/" target="_blank" title="程序问答园区">简体中文</a></li> <li><a href="http://hk.voidcc.com/" target="_blank" title="程序問答園區">繁體中文</a></li> <li><a href="http://ru.voidcc.com/" target="_blank" title="поле вопросов и ответов">Русский</a></li> <li><a href="http://de.voidcc.com/" target="_blank" title="Frage - und - antwort - Park">Deutsch</a></li> <li><a href="http://es.voidcc.com/" target="_blank" title="Preguntas y respuestas">Español</a></li> <li><a href="http://hi.voidcc.com/" target="_blank" title="कार्यक्रम प्रश्न और उत्तर पार्क">हिन्दी</a></li> <li><a href="http://it.voidcc.com/" target="_blank" title="IL Programma di chiedere Park">Italiano</a></li> <li><a href="http://ja.voidcc.com/" target="_blank" title="プログラム問答園区">日本語</a></li> <li><a href="http://ko.voidcc.com/" target="_blank" title="프로그램 문답 단지">한국어</a></li> <li><a href="http://pl.voidcc.com/" target="_blank" title="program o park">Polski</a></li> <li><a href="http://tr.voidcc.com/" target="_blank" title="Program soru ve cevap parkı">Türkçe</a></li> <li><a href="http://vi.voidcc.com/" target="_blank" title="Đáp ứng viên">Tiếng Việt</a></li> <li><a href="http://fr.voidcc.com/" target="_blank" title="Programme interrogation Park">Française</a></li> </ul> </div> </div> </div> </div> </div> </footer>  <script async src="https://www.googletagmanager.com/gtag/js?id=UA-77509369-5"></script> <script> window.dataLayer = window.dataLayer || []; function gtag() { dataLayer.push(arguments); } gtag('js', new Date()); gtag('config', 'UA-77509369-5'); </script> <script> var _hmt = _hmt || []; (function () { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?67d4731349f0b00136755b80364ce381"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); </script> </body> </html>