Vorrei raggruppare gli elenchi estratti da tabelle HTML. Di seguito viene presentato un esempio di lavoro minimo. L'esempio dipende dal pacchetto stringr
in R. Il primo esempio mostra il comportamento desiderato.Estrarre l'ultimo numero a 4 cifre da una serie in R utilizzando stringr
years <- c("2005-", "2003-")
unlist(str_extract_all(years,"[[:digit:]]{4}"))
[1] "2005" "2003"
L'esempio seguente produce un risultato indesiderabile quando si tenta di abbinare l'ultimo numero di 4 cifre in una serie di altri numeri.
years1 <- c("2005-", "2003-", "1984-1992, 1996-")
unlist(str_extract_all(years1,"[[:digit:]]{4}$"))
character(0)
quanto ho capito la documentazione, devo includere $
alla fine del modello al fine di richiedere la partita alla fine della stringa. Preferirei abbinare dal secondo esempio i numeri "2005", "2003" e "1996".
'substr (years1,1,4)' fornisce un elenco di "2005" "2003" "1984" dove vorrei ottenere "2005", "2003" e "1996" Che ne dici di – Daniel
'sub ('. * (\\ d {4}). *', '\\ 1', years1)'? – jbaums
@jbaums, che funziona sicuramente, potresti fornire una risorsa/spiegazione per la tua soluzione? – Daniel