2012-11-06 15 views
5

Sto cercando (in R) per raschiare alcuni dati da:Raschiare il web richiedendo un clic del mouse?

http://www.soccerbase.com/matches/results.sd?date=2012-11-04

cioè, voglio ottenere i dettagli sulle partite che appaiono sulla pagina quando si preme il pulsante i. Tuttavia, le informazioni visualizzate dopo aver fatto clic sul pulsante non sono contenute nel codice html originale. Tutto quello che posso vedere è una linea (dove mi aspettavo i dati che devono essere contenuti) ...

<span class="infoField"><a href="#" class="info finished" title="Show full match details"></a></span> 

... che praticamente mi lascia in un vicolo cieco ... tutte le idee?

+1

dovresti iniziare a usare firebug in Firefox o gli strumenti di chrome dev. sito web fa richiesta javascript a http://www.soccerbase.com/matches/additional_information.sd?id_game=652536 –

+2

si dovrebbe anche leggere i termini e le condizioni. – Spacedman

+0

@Spacedman Negli Stati Uniti, almeno, questi termini e condizioni non sono legalmente vincolanti. Vedi per es. http://www.forbes.com/sites/ericgoldman/2012/10/10/how-zappos-user-agreement-failed-in-court-and-left-zappos-legally-naked/ – hadley

risposta

4
require(XML) 
require(RCurl) 
dataurl<-'http://www.soccerbase.com/matches/results.sd?date=2012-11-04' 
sdata<-htmlParse(dataurl) 
sid<-xpathSApply(sdata,'//*/tr/@id') 
sid<-gsub('^tgc','',sid) 
mUrl<-paste0('http://www.soccerbase.com/matches/additional_information.sd?id_game=',sid) 

Il codice sopra riportato otterrà gli URL richiesti per i dati aggiuntivi. Tuttavia vorrei verificare con il sito per quanto riguarda la raccolta dei dati.

Problemi correlati