Se voglio calcolare la media di due categorie in Pandas, posso fare in questo modo:T-test in Pandas
data = {'Category': ['cat2','cat1','cat2','cat1','cat2','cat1','cat2','cat1','cat1','cat1','cat2'],
'values': [1,2,3,1,2,3,1,2,3,5,1]}
my_data = DataFrame(data)
my_data.groupby('Category').mean()
Category: values:
cat1 2.666667
cat2 1.600000
Ho un sacco di dati formattati in questo modo, e ora ho bisogno di fare un T -test per vedere se la media di cat1 e cat2 sono statisticamente differenti. Come lo posso fare?