Ho un file HTML e al suo interno potrebbero esserci Javascript, PHP e tutto ciò che le persone possono o non possono inserire nel loro file HTML.Ricerca di commenti in HTML
Voglio estrarre tutti i commenti da questo file html.
posso sottolineare due problemi nel fare questo:
Che è un commento in una lingua non può essere un commento in un altro.
In Javascript, il resto delle righe viene commentato utilizzando il contrassegno
//
. Ma gli URL contengono anche//
all'interno di essi e quindi posso eliminare parti di URL se I si applica solo sostituendo//
e quindi il resto della riga senza niente.
Quindi questo non è un problema banale.
C'è qualche soluzione per questo già disponibile?
Qualcuno ha già fatto questo?
Hai ragione che questo non è banale. Per rimuovere in modo affidabile i commenti, è necessario analizzare completamente il file (PHP, HTML e Javascript). Suggerisco di lavorare in PHP, se possibile; mentre mi piace il Perl, gli strumenti PHP per lavorare su se stessi sono migliori degli strumenti Perl per lavorare su PHP. Ecco qualcosa per iniziare: http://stackoverflow.com/questions/503871/best-way-to-automatically-remove-comments-from-php-code. Quindi devi solo trovare i parser HTML e javascript in PHP per fare altrettanto per quelle parti del file. – dan1111
Perché dovresti avere PHP nel tuo file HTML? Ho solo CSS, JavaScript e HTML, quindi Google "HTML Minifier" per prodotti che possono rimuovere commenti, spazi bianchi e, in generale, "snellire" le pagine. –
@RB. Pre-renderizzato? – Jivings