ho un df, e voglio eseguire qualcosa di simile:Selezione righe di una dataframe sulla base di due condizioni di Pandas pitone
subsetdf= df.loc[(df['Item_Desc'].str.contains('X')==True) or \
(df['Item_Desc'].str.contains('Y')==True),:]
che seleziona tutte le righe che hanno la colonna Desc Item una stringa di "X "o" Y ".
The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
Ottengo l'errore quando lo eseguo. Qualsiasi aiuto?
Ti dispiacerebbe indicarmi i documenti per questo? Questa è una cosa dei panda o di un pitone? Non ho trovato nulla su "|" – robertevansanders
@joris, bella risposta. C'è un modo più generale? per esempio. se hai un elenco di nomi di colonne, ad es. '['d1', 'd2', 'd3' ...]' c'è un modo per specificare una condizione comune da applicare a tutti e includere la riga se qualcuno di essi corrisponde. Nel mio caso i cols d1 ecc hanno 1 o 0 e vogliono solo le righe con 1 in una delle colonne d1 ecc. Ci sono altri cols, con altri dati, ad es. testo, che non sto considerando per questa selezione –
Non una soluzione generale, ma in tal caso si potrebbe fare qualcosa come '(df [cols] == 1) .any (axis = 1)' da usare come condizione. – joris