jQuery analizzare HTML senza immagini di carico

ho caricare html da altre pagine per estrarre e visualizzare i dati da quella pagina:jQuery analizzare HTML senza immagini di carico

$.get('http://domain.net/205.html', function(html){ 
    console.log($(html).find('#c1034')); 
});

che fa il lavoro, ma a causa della $(html) mio browser tenta di caricare le immagini che sono collegate in 205 .html. Quelle immagini non esistono sul mio dominio, quindi ricevo molti errori 404.

C'è un modo per analizzare la pagina come $(html) ma senza caricare l'intera pagina nel mio browser?

fonte

2013-02-27 PiTheNumber

Usa espressione regolare e rimuovere tutti i tag <img>

html = html.replace(/<img[^>]*>/g,"");

fonte

2013-02-27 14:01:37

che ha lavorato per me. Si noti che non funzionerebbe per immagini di sfondo di stile. Perciò si avrebbe bisogno di un [parser XML] (http://stackoverflow.com/questions/11006216/load-an-html-string-into-jquery-without-requesting-images?rq=1) immagino. Grazie! – PiTheNumber

@PiTheNumber & Bhuvan: FWIW, che tale regex è banale per bypassare: http://jsbin.com/wejosoku/1 Mi piacerebbe pensare che avrebbe funzionato con l'applicazione ripetuto, ma non vorrei puntare il mio sito nessuno riuscendo a trovare un modo per aggirarlo. Regex è fondamentalmente inadatto a un significativo parsing HTML. –

@ T.J.Crowder io so che non è salva, ma nel mio caso posso fidarmi l'altro codice HTML domini. Regex è male per lo più tutto e consiglio vivamente di evitarlo dove mai possibile. Sarei felice di vedere un'altra soluzione, ma un parser html completo sarebbe troppo grande per questo. – PiTheNumber

Si potrebbe usare sia jQuerys remove() metodo per selezionare gli elementi di immagine

console.log($(html).find('img').remove().end().find('#c1034'));

o rimuovere poi dalla stringa HTML. Qualcosa di simile

console.log($(html.replace(/<img[^>]*>/g,"")));

Per quanto riguarda le immagini di sfondo, si potrebbe fare qualcosa di simile:

$(html).filter(function() { 
    return $(this).css('background-image') !== ''; 
}).remove();

fonte

2013-02-27 14:02:13 Johan

Il primo non ha funzionato. '$ (html)' carica già la pagina. Il secondo ha funzionato. Grazie! – PiTheNumber

Usando il modo seguente per analizzare HTML caricherà automaticamente immagini.

var wrapper = document.createElement('div'), 
    html = '.....'; 
wrapper.innerHTML = html;

Se l'uso DomParser per analizzare HTML, le immagini non verrà caricato automaticamente. Vedi https://github.com/panzi/jQuery-Parse-HTML/blob/master/jquery.parsehtml.js per i dettagli.

fonte

2015-11-20 11:09:07 fudesign2008

La seguente espressione regolare sostituisce tutte le occorrenze di <head>, <link>, <script>, <style>, incluso l'attributo background e style dalla stringa di dati restituita dal carico Ajax.

html = html.replace(/(<(\b(img|style|script|head|link)\b)(([^>]*\/>)|([^\7]*(<\/\2[^>]*>)))|(<\bimg\b)[^>]*>|(\b(background|style)\b=\s*"[^"]*"))/g,"");

regex di prova: https://regex101.com/r/nB1oP5/1

Vorrei che ci sia un modo migliore per aggirare (tranne usando regex sostituire).

fonte

2016-01-02 08:24:38 Nik

Siamo spiacenti per la rianimazione di una domanda precedente, ma questo è il primo risultato durante la ricerca di come provare a interrompere l'html analizzato dal caricamento di risorse esterne.

Ho preso la risposta di Nik Ahmad Zainalddin, tuttavia c'è un punto debole in quanto qualsiasi elemento tra i tag <script> viene cancellato.

<script> 
</script> 
Inert text 
<script> 
</script>

Nell'esempio di cui sopra Inert text verrebbe eliminato insieme ai tag di script. Ho finito per fare la seguente invece:

html = html.replace(/<\s*(script|iframe)[^>]*>(?:[^<]*<)*?\/\1>/g, "").replace(/(<(\b(img|style|head|link)\b)(([^>]*\/>)|([^\7]*(<\/\2[^>]*>)))|(<\bimg\b)[^>]*>|(\b(background|style)\b=\s*"[^"]*"))/g, "");

Inoltre ho aggiunto la capacità di rimuovere iframe s.

Spero che questo aiuti qualcuno.

fonte

2016-06-17 02:16:03

Invece di rimuovere tutti gli elementi img del tutto, è possibile utilizzare la seguente espressione regolare per cancellare tutti gli attributi src invece:

html = html.replace(/src="[^"]*"/ig, "");

fonte

2017-04-28 00:42:28 Royalgamer06

tale da rompere il html perché l'attributo src è obbligatorio per l'elemento '' . Vedere https://developer.mozilla.org/de/docs/Web/HTML/Element/img – PiTheNumber

Potrebbe essere vero, ma è una buona soluzione alternativa per chiunque usi il tag img nel proprio selettore css o abbia bisogno di dati da uno dei gli attributi dell'immagine. – Royalgamer06

jQuery analizzare HTML senza immagini di carico

risposta

Problemi correlati