Nella seguente frammento data
è un pandas.DataFrame
e indices
è un insieme di colonne della data
. Dopo aver raggruppato i dati con groupby
, sono interessato agli ID dei gruppi, ma solo a quelli con una dimensione maggiore di una soglia (ad esempio: 3).Pandas groupby: le dimensioni di un gruppo conoscendo la sua identificazione (da .grouper.group_info [0])
group_ids=data.groupby(list(data.columns[list(indices)])).grouper.group_info[0]
Ora, come posso trovare quale gruppo ha una dimensione maggiore o uguale a 3 conoscendo l'id del gruppo? Voglio solo id di gruppi con una certa dimensione.
#TODO: filter out ids from group_ids which correspond to groups with sizes < 3
questa è la sfida di accesso dei dipendenti Amazon di Kaggle, right =)) – herrfz
Sì, è vero. È un piccolo mondo, Eriza, non è vero? ;) – piokuc