Come posso rimuovere i valori da una colonna in pandas.DataFrame
, che si verifica raramente, cioè con una bassa frequenza? Esempio:Rimuovere i valori di bassa frequenza da pandas.dataframe
In [4]: df[col_1].value_counts()
Out[4]: 0 189096
1 110500
2 77218
3 61372
...
2065 1
2067 1
1569 1
dtype: int64
Quindi, la mia domanda è: come rimuovere valori come 2065, 2067, 1569
e gli altri? E come posso fare questo per TUTTE le colonne, che contengono .value_counts()
in questo modo?
UPDATE: A proposito di valori 'bassa' intendo come 2065
. Questo valore si verifica in col_1
1 (uno) volte e voglio rimuovere valori come questo.
Cosa intendi per "incontrarsi raramente"? Può essere più preciso? Potrebbe essere utile aggiungere del codice già provato. – guaka
Non riesco a capire come può essere "più specifico"? Nel valore '' 'col_1''' come' '' 0''' incontriamo '' '189096''' volte. E valore come '' '1569''' si incontra UNO volte. Voglio rimuovere '' '1569''' e altri valori come questo in' '' col_1'''. –
Aha! Intendi "si verifica", non "incontra". – guaka