Questo dovrebbe essere facile ma sono bloccato.Scrapy - Seleziona il link specifico in base al testo
<div class="paginationControl">
<a href="/en/overview/0-All_manufactures/0-All_models.html?page=2&powerunit=2">Link Text 2</a> |
<a href="/en/overview/0-All_manufactures/0-All_models.html?page=3&powerunit=2">Link Text 3</a> |
<a href="/en/overview/0-All_manufactures/0-All_models.html?page=4&powerunit=2">Link Text 4</a> |
<a href="/en/overview/0-All_manufactures/0-All_models.html?page=5&powerunit=2">Link Text 5</a> |
<!-- Next page link -->
<a href="/en/overview/0-All_manufactures/0-All_models.html?page=2&powerunit=2">Link Text Next ></a>
</div>
Sto cercando di utilizzare Scrapy (Basespider) per selezionare un collegamento basato su di esso del testo Link mediante:
nextPage = HtmlXPathSelector(response).select("//div[@class='paginationControl']/a/@href").re("(.+)*?Next")
Per esempio, voglio selezionare il link alla pagina successiva sulla base del fatto che il testo è "Link Text Next". Qualche idea?
Grazie ragazzi. Ho usato il suggerimento di @unutbu e ha funzionato perfettamente. –
Quindi non esiste un modo di selezione CSS per farlo? – deostroll