È necessario impostare un df per includere determinate stringhe. Alcuni di questi sono i nomi delle colonne piene, e la seguente funziona bene:Dati di sottoinsieme basati sulla corrispondenza parziale dei nomi di colonna
testData[,c("FullColName1","FullColName2","FullColName3")]
Il mio problema è che ho bisogno di espandere questa per includere anche i nomi delle colonne che contengono stringhe specifiche che possono parzialmente corrispondere ad alcuni altri nomi di colonna. Queste stringhe includono lettere e simboli:
"PartString1()","PartString2()"
Ho provato a mettere dei caratteri jolly intorno a questi. (Ho indicato questo qui sotto con il prefisso "stella", perché il simbolo "*" non rendeva correttamente.)
testData[ ,c("FullColName1","FullColName2","FullColName3",
"starPartString1()star","starPartString2()star")]
Ma io sto ottenendo un messaggio di errore: colonne indefiniti selezionati. Non riesco a capire se e come ho bisogno di grep per fare questo lavoro.
Che cos'è "PartString1()"? Le parentesi accoppiate mi fanno pensare che stai usando una funzione. NON è un nome R valido. Prova a inserire un codice che costruisca ciò con cui stai lavorando. –
"PartString1()" è un nome di variabile. Stavo cercando di usare grep per corrispondere su nomi di colonne parziali che includevano stringhe di caratteri specifici e una serie di parentesi. Problema risolto con df2 <-df1 [, grepl ("FullColName1 | FullColName2 | FullColName3 | PartSting1 [[: punct:]] | PartString2 [[: punct:]]", nomi (df1))] – user3614783