2013-06-21 13 views
6

Sto lavorando su qualche progetto in cui ho bisogno di scartare alcune informazioni da diversi siti Web. Sto usando HtmlUnit per questo scopo, ma il problema è che non riesco a attraversare gli elementi su una pagina.Come trovare div in un altro div usando HtmlUnit?

Esempio:

<div id="some_id"> 

     <div> 

     <div> 

      <div> 

       ...... 
         many divs in between 
       ...... 

       <div id="my_target_div"> some information </div> 

       ........ 

       ........ 

       </div> 

Ora come ottenere div con id my_target_div e informazioni privilegiate che div

+0

cosa hai già provato? – acudars

risposta

5

Usa getHtmlElementById.

Verifica documentation.

Un esempio:

@Test 
public void getElements() throws Exception { 
    final WebClient webClient = new WebClient(); 

    final HtmlPage page = webClient.getPage("http://some_url"); 
    final HtmlDivision div = page.getHtmlElementById("my_target_div"); 

    webClient.closeAllWindows(); 
} 

Source.

+0

Grazie per la risposta, ma l'ho già risolto io stesso. In ogni caso, sto votando per aver speso il tuo tempo di qualità nel rispondere a questa domanda, che può aiutare gli altri che hanno problemi simili. –

2
WebClient webClient = new WebClient(); 
     HtmlPage page; 
    HtmlElement div= (HtmlElement) page2.getFirstByXPath("//div[@id='my_target_div']"); 

Questo risolverà il vostro problema.

Problemi correlati