2014-09-29 22 views
6

Ho un file sul mio desktop che è un file HTML. (In Chrome, ho fatto clic con il pulsante destro sulla pagina Web, ho scelto "salva-come" e quindi "Pagina Web, HTML"). Come posso leggere questo file locale in R? Una volta in R dovrò scrivere alcune espressioni regolari per analizzare le stringhe ed estrarre determinati valori.Leggi il file HTML locale in R

Molte grazie

+0

controllare questo post su [parsing con RegEx] (http://stackoverflow.com/questions/1732348/regex-match-open-tags -tranne-xhtml-auto-contenuti-tags)! –

risposta

10

uso readLines come segue

rawHTML <- paste(readLines("path/to/file.html"), collapse="\n")