Sto lavorando con i dati del sondaggio caricati da un file h5 come hdf = pandas.HDFStore('Survey.h5')
tramite il pacchetto pandas. All'interno di questo DataFrame
, tutte le righe sono i risultati di un singolo sondaggio, mentre le colonne sono le risposte per tutte le domande all'interno di un singolo sondaggio.Slice Pandas DataFrame per riga
Sto cercando di ridurre questo set di dati a un DataFrame
minore, includendo solo le righe con una determinata risposta su una determinata domanda, cioè con lo stesso valore in questa colonna. Sono in grado di determinare i valori dell'indice di tutte le righe con questa condizione, ma non riesco a trovare come eliminare queste righe o creare un nuovo df solo con queste righe.
è possibile tagliare il dataframe e dire (c = 5 c = 6) in questo modo: ---> df [((df.A == 0) & (df.B == 2) & (df.C == 5 o 6) & (df.D == 0))] – yoshiserry
df [((df.A = = 0) & (df.B == 2) & df.C.isin ([5, 6]) & (df.D == 0))] o df [((df.A == 0) & (df.B == 2) & ((df.C == 5) | (df.C == 6)) & (df.D == 0))] –