Voglio ottenere il contenuto da questa * pagina. Tutto ciò che ho cercato dà la soluzione dell'analisi degli elementi CSS; ma quella pagina non ne ha.Come ottenere contenuto di pagine Web con Ruby - Sto avendo problemi
Ecco l'unico codice che ho trovato che sembrava dovrebbe funzionare:
file = File.open('http://hiscore.runescape.com/index_lite.ws?player=zezima', "r")
contents = file.read
puts contents
Errore:
tracker.rb:1:in 'initialize': Invalid argument - http://hiscore.runescape.com/index_lite.ws?player=zezima (Errno::EINVAL)
from tracker.rb:1:in 'open'
from tracker.rb:1
* http://hiscore.runescape.com/index_lite.ws?player=zezima
Se si tenta di formattare questo come un collegamento in il post non riconosce il carattere di sottolineatura (_) nell'URL per qualche motivo.
Vedo - non lo sapevo. Tuttavia, a seconda di cosa vorrebbe fare con quel contenuto, potrebbe stare meglio con net/http. – halfdan
Oo, è ancora meglio. Grazie. – Andrew
@halfdan: totalmente d'accordo sul fatto che net/http sia migliore in generale. Non mi affido a questo metodo per qualcosa di non banale/di produzione. net/http ha i suoi difetti e io generalmente preferisco i collegamenti curl (lib curb). Questo post ha buone informazioni sulle prestazioni del client http - http://bit.ly/lvriR è fantastico perché hai un controllo più dettagliato sui timeout, che è estremamente critico nell'utilizzo di volumi elevati di produzione. –