2009-09-18 11 views
5

Sto cercando di capire come fare una sostituzione con Javascript. Sto esaminando l'intero corpo della pagina e vorrei sostituire le corrispondenze delle parole chiave NON all'interno di un tag HTML.In JavaScript, come posso sostituire il testo in una pagina HTML senza influenzare i tag?

Ecco un esempio:

<body> 
    <span id="keyword">blah</span> 
    <div> 
    blah blah keyword blah<br /> 
    whatever keyword whatever 
    </div> 
</body> 

<script type="text/javascript"> 
var replace_terms = { 
    'keyword':{'url':'http://en.wikipedia.org/','target':'_blank'} 
} 

jQuery.each(replace_terms, function(i, val) { 
    var re = new RegExp(i, "gi"); 
    $('body').html(
    $('body').html().replace(re, '<a href="'+ val['url'] +'" target="'+val['target']+'">' + i + '</a>') 
); 
}); 

</script> 

Sto cercando di sostituire tutte le istanze della "parola chiave" che non è all'interno di un tag HTML (tra < e >).

Suppongo di dover anche ignorare se "parola chiave" si trova all'interno di un elemento script o style.

+2

non è l'intera pagina, per definizione, all'interno di un tag HTML? –

+0

Sì. L'HTML che avevo nel mio esempio non è venuto attraverso. Fondamentalmente intendo che non voglio sostituire alcun attributo di un tag. – Phil

+1

Sto pensando che intenda tra parentesi (come un attributo nome/valore). – Mayo

risposta

12

Non utilizzare regex per analizzare HTML. [X] [HT] ML non è un linguaggio normale e non può essere elaborato in modo affidabile usando espressioni regolari. Il tuo browser ha un buon parser HTML integrato; lascia che ci si sforzi di capire dove si trovano i tag.

Inoltre non si vuole lavorare sul html()/innerHTML sul corpo. Questo serializzerà e ri-analizzerà l'intera pagina, che sarà lenta e perderà tutte le informazioni che non possono essere serializzate in HTML, come i gestori di eventi, i valori dei moduli e altri riferimenti JavaScript.

Ecco un metodo che utilizza DOM che sembra funzionare per me:

function replaceInElement(element, find, replace) { 
    // iterate over child nodes in reverse, as replacement may increase 
    // length of child node list. 
    for (var i= element.childNodes.length; i-->0;) { 
     var child= element.childNodes[i]; 
     if (child.nodeType==1) { // ELEMENT_NODE 
      var tag= child.nodeName.toLowerCase(); 
      if (tag!='style' && tag!='script') // special case, don't touch CDATA elements 
       replaceInElement(child, find, replace); 
     } else if (child.nodeType==3) { // TEXT_NODE 
      replaceInText(child, find, replace); 
     } 
    } 
} 
function replaceInText(text, find, replace) { 
    var match; 
    var matches= []; 
    while (match= find.exec(text.data)) 
     matches.push(match); 
    for (var i= matches.length; i-->0;) { 
     match= matches[i]; 
     text.splitText(match.index); 
     text.nextSibling.splitText(match[0].length); 
     text.parentNode.replaceChild(replace(match), text.nextSibling); 
    } 
} 

// keywords to match. This *must* be a 'g'lobal regexp or it'll fail bad 
var find= /\b(keyword|whatever)\b/gi; 

// replace matched strings with wiki links 
replaceInElement(document.body, find, function(match) { 
    var link= document.createElement('a'); 
    link.href= 'http://en.wikipedia.org/wiki/'+match[0]; 
    link.appendChild(document.createTextNode(match[0])); 
    return link; 
}); 
+1

'i -> 0' Clever. Non l'ho mai visto prima. –

+2

Non posso rivendicare il merito per questo, è un idioma per l'iterazione inversa nei linguaggi simili a C! :-) – bobince

+0

Di solito uso solo 'i -', come in: 'for (var i = 100; i--;)' – kangax

Problemi correlati