in R, ho una colonna in una data.frame come questo:Come per la ricerca di stringhe multiple e sostituirli con nulla all'interno di una lista di stringhe
NPT2 $ nome
[1] "Andreas Groll, MD"
[2] ""
[3] "Pan-Chyr Yang, PHD"
[4] "Suh-Fang Jeng, Sc.D"
[5] "Mostafa Mohamed K Fontanet Arnaud"
[ 6] "Thomas Jozefiak, MD"
[7] "Monitor Medical"
[8] "Qi Zhu, MD"
[9] "Holly Posner"
[10] "Peter S Sebel, MB BS, PhD Chantal Kerssens, PhD"
[11] "Lance A Mynderse, MD"
[12] "Lawrence Currie, MD"
ho provato gsub ma senza fortuna. dopo aver eseguito toupper (x) Ho bisogno di sostituire tutte le istanze di 'MD' o 'M.D.' o 'PHD' con niente ''.
C'è un bel trucco breve in R per farlo?
In realtà sarei interessato a vederlo fatto su una singola stringa e come diversamente si fa in un solo comando su tutta la lista (io non sono molto bravo a programmazione funzionale ancora)
Che dire di "Sc.D"? –
Speravo di evitare le espressioni regolari dal momento che posso semplicemente enumerare tutte le stringhe errate da rimuovere. Oh my .... ancora un'altra tecnologia (REgEx) per tornare a (re-master) :-( – userJT
Il campo dovrebbe essere solo il cognome, ma i dati non sono coerenti. L'obiettivo è finire con solo i dati che sono o il cognome o il nome e rimuovere tutti i titoli accademici o di altro tipo – userJT