voglio ottenere l'elenco di tutti gli URL di immagini provenienti da sorgente HTML di una pagina web (Sia abosulte e URL relativi). Ho usato Jsoup per analizzare l'HTML ma non ha fornito tutte le immagini. Per esempio, quando sto parsing fonte google.com HTML propria che mostra lo zero images..In google.com HTML fonte Link di immagine sono in forma ..estratto di tutte le immagini da HTML utilizzando Java
"background:url(/intl/en_com/images/srpr/logo1w.png)
E in rediff.com le immagini collegamenti sono in forma ..
videoArr[j]=new Array("http://ishare.rediff.com/video/entertainment/bappi-da-the-first-indian-in-grammy-jury/2684982","http://datastore.rediff.com/h86-w116/thumb/5E5669666658606D6A6B6272/v3np2zgbla4vdccf.D.0.bappi.jpg","Bappi Da - the first Indian In Grammy jury","http://mypage.rediff.com/profile/getprofile/LehrenTV/12669275","LehrenTV","(2:33)"); j = 1 videoArr[j]=new Array("http://ishare.rediff.com/video/entertainment/bebo-shahid-jab-they-met-again-/2681664","http://datastore.rediff.com/h86-w116/thumb/5E5669666658606D6A6B6272/ra8p9eeig8zy5qvd.D.0.They-Met-Again.jpg","Bebo-Shahid : Jab they met again!","http://mypage.rediff.com/profile/getprofile/LehrenTV/12669275","LehrenTV","(2:17)");
Tutte le immagini non sono con in "img" tags..I vogliono anche estrarre le immagini che non sono neppure con nei tag "img", come mostrato nella sorgente HTML sopra.
Come posso fare questo ..? Please help me su questo .. Grazie
Perché Java? Hai pensato a sviluppare un plugin per il browser? – fglez
Oppure implementa un proxy che salva qualsiasi immagine? –