Voglio contare il numero di occorrenze di determinate parole in un frame di dati. So che l'utilizzo di "str.contains"Conteggio occorrenze di determinate parole in dataframe panda
a = df2[df2['col1'].str.contains("sample")].groupby('col2').size()
n = a.apply(lambda x: 1).sum()
Attualmente sto usando il codice di cui sopra. Esiste un metodo per abbinare le espressioni regolari e ottenere il conteggio delle occorrenze? Nel mio caso ho un grande dataframe e voglio abbinare circa 100 stringhe.
Questo è molto più ordinato e probabilmente più veloce, ovviando alla necessità di "get''. –
@Ady Hayden: Diciamo che voglio "ciao" conteggio e "parola" conteggio e stampa "" ciao "conteggio = 1", "" parola "conteggio = 1"? Posso farlo in una riga di codice? –
Che dire di 'word_regexs = [r'he ', r'wo']' e quindi creare una serie con 'pd.Series ((df.words.str.contains (r) .sum() per r in word_regexs), word_regexs, name = 'count') '? –