Ho una stringa con del codice HTML, per esempio:Come cercare il testo circondato da virgolette con RegEx?
This is <strong id="c1-id-8">some</strong> <em id="c1-id-9">text</em>
ho bisogno per togliere l'attributo id
da ogni tag HTML, ma non ho alcuna esperienza con le espressioni regolari, così ho cercato qua e là da internet e ho scritto questo modello: [\s]+id=\".*\"
Sfortunatamente non funziona come mi aspetterei. Infatti, speravo che l'espressione regolare catturasse lo id="
seguito da qualsiasi carattere ripetuto per un numero qualsiasi di volte e terminato con il più vicino doppio; Praticamente in questo esempio mi aspettavo di prendere id="c1-id-8"
e id="c1-id-9"
. Invece il pattern mi ha restituito la sottostringa id="c1-id-8">some</strong> <em id="c1-id-9"
, trova la prima occorrenza di id="
e l'ultima occorrenza di un carattere di virgoletta doppia.
Potrebbe dirmi cosa c'è di sbagliato nel mio schema e come risolverlo, per favore? Grazie mille
Per i ∞ ° tempo, ** utilizzare un parser ** HTML non è un linguaggio regolare –