Voglio cercare ©
in un documento HTML e fondamentalmente ottenere l'entità a cui il copyright è attribuito.seleziona l'elemento di testo HTML con regex?
La linea di diritto d'autore si presenta un paio di modi diversi:
<p class="bg-copy">© 2011 The New York Times Company</p>
o
<a href="http://www.nytimes.com/ref/membercenter/help/copyright.html">
© 2011</a>
<a href="http://www.nytco.com/">The New York Times Company</a>
o
<br>Published since 1996<br>Copyright © CounterPunch<br>
All rights reserved.<br>
voglio ignorare le date e tag intermedie e solo ottenere "The New York Times Company" o "Counterpunch".
Non sono stato in grado di trovare molto sull'uso di espressioni regolari con JavaScript o JQuery, anche se ho l'impressione che possa portare a grattacapi importanti. Se c'è un approccio migliore a questo, fammi sapere.
Non usare espressioni regolari, piuttosto utilizzare la struttura DOM per trovare quello che stai cercando. Alcuni link: http://www.howtocreate.co.uk/tutorials/javascript/dombasics – FailedDev
Normalmente la risposta che otterresti è - per favore, non usare espressioni regolari per l'analisi di JS. Usa parser JS. La domanda è - puoi? – ZenMaster
@FailedDev lo ha quasi fatto ... – ZenMaster