Mi chiedo se qualcuno abbia mai visto questo problema con Pandas. Fondamentalmente, sto cercando di aggiungere, moltiplicare e dividere DataFrames elemento per elemento (tutti i frame hanno indici e colonne identici), ma Panda sta sputando risultati diversi per lo stesso calcolo eseguito successivamente.Instabilità dei calcoli del dataframe panda
Un'immagine di un esempio di output è mostrata di seguito. Ho usato .values
nel codice qui sotto perché per scopi di visualizzazione, ma l'instabilità può accadere quando si utilizza .add()
, .mul()
o .div()
. Ad esempio, se inserisco ripetutamente N11.add(N00)
, di solito ottengo la risposta corretta, ma occasionalmente (ogni 4 o 5 volte), ottengo un DataFrame pieno di 0 s.
Se è importante, io sono su Windows 10 utilizzando una distribuzione Anaconda di Panda 0.17.0 (con Python 2.7.10 su Spyder 2.3.7). I frame con cui sto lavorando sono grandi (6856 per 12511). Qualcun altro ha riscontrato questo problema? Si tratta di un problema noto o sto facendo qualcosa di sbagliato?
Interessante: c'è qualche possibilità di riprodurre il comportamento con DataFrame più piccoli e pubblicarli come parte della domanda qui? –
(Anche se stai solo moltiplicando gli array NumPy, potrebbe trattarsi di un problema di NumPy.) –
Ok, l'ho provato con un frame 10x10 più piccolo e non sono riuscito a riprodurlo dopo quasi 100 tentativi. Quindi forse le dimensioni contano qui. – user3111891