2013-12-16 8 views
5

Ho appena iniziato a utilizzare jsoup con questo site e qualcosa di strano sta accadendo.La selezione Jsoup non restituisce tutti i nodi

Tutto quello che voglio è quello di selezionare il testo sotto il titolo della colonna, che potete trovare con il seguente codice HTML:

<div class="Table1_A1 grow clear-fix"> 
    <div class="grd-col grd-col-1a"> … </div> 
    <div class="grd-col grd-col-2b"> 
     <p> 
     <span class="T1"> 
       <a href="...."> TITLE TEXT IS HERE 
       </a> 
      </span> 
     </p> 
    </div> 
    ... 
</div> 

Guardando questa struttura html mi si avvicinò con la seguente per la selezione jsoup:

Ecco la cosa: stampa solo fino al titolo "AL PIÙ PRESTO", ma dopo c'è un sacco, e semplicemente non si presentano. Quindi mi chiedo, jsoup ".select()" ha un limite sui nodi che restituisce? Non ho idea di come aggirare questo, qualsiasi aiuto è abbastanza apprezzato.

+0

quanti elementi ci sono nella tua query? forse alcuni dei componenti html sono caricati da javascript? se questo è il caso non verranno visualizzati in JSOUP poiché prende una pagina statica come input –

+0

Nessuno dei contenuti viene caricato tramite js. – Chayemor

risposta

6

Jsoup non ha limitazioni per la selezione, ma esistono limitazioni predefinite per la dimensione del corpo della richiesta che è 1 MB. Questo dovrebbe risolvere il problema:

Document doc = Jsoup.connect(url).timeout(60000).maxBodySize(10*1024*1024).get(); 
+0

GENIO! Molto apprezzato! – Chayemor

Problemi correlati