Sto cercando un modo per fare l'equivalente a SQLCome "selezionare distinto" tra più colonne del frame di dati nei panda?
"SELECT col1 DISTINTO, col2 FROM dataframe_table"
Il panda confronto SQL non ha nulla di "distinta"
.unique() funziona solo per una singola colonna, quindi suppongo di poter concatenare le colonne, o metterle in una lista/tupla e confrontare in questo modo, ma questo sembra che qualcosa di panda debba fare in un modo più nativo .
Mi manca qualcosa di ovvio, o non c'è modo di farlo?
dovreste fare qualcosa di simile 'df.apply (pd.Series.unique)', ma questo non funzionerà se il numero di valori univoci varia tra le colonne, quindi dovresti costruire un ditt dei nomi delle colonne come chiavi e i valori univoci come i valori – EdChum
[SO Documentation] (http://stackoverflow.com)/documentation/pandas/1751/indexing and select-data/26077/select-distinct-rows-across-dataframe) – user2314737