Ho ottenuto due codice snippet come segue.Panda: perché pandas.Series.std() è molto diverso da numpy.std()
import numpy
numpy.std([766897346, 766897346, 766897346, 766897346, 766897346, 766897346, 766897346, 766897346, 766897346, 766897346])
0
e
import pandas as pd
pd.Series([766897346, 766897346, 766897346, 766897346, 766897346, 766897346, 766897346, 766897346, 766897346, 766897346]).std(ddof=0)
10.119288512538814
Questa è una differenza enorme.
Posso chiedere perché?
Questo appare come un bug in panda mi puoi pubblicare un [problema] (https://github.com/pydata/panda/problemi)? – EdChum
Già segnalato e risposto qui: https://github.com/pydata/pandas/issues/10489 – joris
Dalla discussione nel problema: una soluzione possibile fino a quando non viene risolta è assicurarsi di avere il collo di bottiglia installato. – joris