sto usando Boilerpipe per estrarre il testo da url, utilizzando questo codice:estratto HTML URL
URL url = new URL("http://www.example.com/some-location/index.html");
String text = ArticleExtractor.INSTANCE.getText(url);
String text
contiene solo il testo della pagina html, ma ho bisogno di estrarre al codice html intero da.
C'è qualcuno che ha utilizzato questa libreria e sa come estrarre il codice HTML?
È possibile controllare lo demo page per ulteriori informazioni sulla libreria.
sun.net.www.protocol.http.HttpURLConnection $ HttpInputStream non può essere gettato a java.lang.String –
@dotNet : Scusa, era fuorviante. Ho corretto la mia risposta. –