Alcune pagine Web elaborate in Jsoup sono pesanti. Con "pesante" intendo che la pagina contiene molto HTML (supponiamo che la pagina sia già stata scaricata) o che richieda diverse iterazioni sullo stesso documento (creato solo una volta tramite Jsoup.parse()).Un modo per stimare o prevedere il tempo di elaborazione Jsoup di un blocco di HTML?
Per questo motivo, vorrei presentare all'utente una barra di avanzamento con un'ipotesi di quanto tempo è rimasto.
Un approccio è solo misurare il volume di HTML (in KB o MB) e trovare un fattore di velocità (purtroppo, totalmente dipendente dalla velocità del sistema su cui gira questo codice).
Un altro approccio è contare lo number of nodes?
A causa dell'ovvia natura deterministica di questo, sto chiedendo un problema?
Idee di modi migliori per gestire questo?
Puoi dare più esempi del tipo di elaborazione? Nella mia esperienza, il Jsoup.parse di solito è il collo di bottiglia delle prestazioni su grandi html. –