Entrambi sembrano eccessivamente simili e sono curioso di sapere quale pacchetto sarebbe più vantaggioso per l'analisi dei dati finanziari.Quali sono le differenze tra Pandas e NumPy + SciPy in Python?
risposta
Infatti, pandas fornisce strumenti di manipolazione dei dati di alto livello costruiti su NumPy. NumPy di per sé è uno strumento di basso livello e sarà molto simile all'utilizzo di MATLAB. D'altro canto, i panda offrono funzionalità complete di serie temporali, allineamento dei dati, statistiche NA-friendly, groupby, metodi di unione e unione e molte altre comodità. Negli ultimi anni è diventato molto popolare nelle applicazioni finanziarie. Avrò un capitolo dedicato all'analisi dei dati finanziari usando i panda nel mio prossimo libro.
Avresti dovuto dire che sei l'autore principale dei panda. :) Il libro in questione: http://shop.oreilly.com/product/0636920023784.do – Yktula
Sarebbe corretto dire che numpy fornisce principalmente array efficienti, mentre i panda forniscono dizionari efficienti (In entrambi i casi, limitato al tipo di dati consistente piuttosto che alla forma libera.) Per me (sto solo iniziando a esaminarlo ora), questo mi colpisce come la differenza di fondo: gestione dei dati associati alle etichette (in 1d aka dicts e Tabelle 2d aka). Allineamento dei dati, join, etc diventano tutti * possibili * a causa di questo, ma per le persone che non riescono a tralasciare quella differenza sottostante non è nemmeno chiaro cosa significano questi (ad es. Cos'è "allineamento dei dati" di due array numpy?). – Brandyn
Wes è da uomo. Basta dire. –
Numpy è richiesto da panda (e praticamente da tutti gli strumenti numerici per Python). Scipy non è strettamente richiesto per i panda ma è elencato come "dipendenza opzionale". Non direi che i panda sono un'alternativa a Numpy e/o Scipy. Piuttosto, è uno strumento extra che fornisce un modo più semplice di lavorare con dati numerici e tabulari in Python. Puoi usare le strutture dati dei panda ma liberamente attingere alle funzioni di Numpy e Scipy per manipolarle.
I panda offrono un ottimo modo per manipolare le tabelle, poiché è possibile semplificare il binning (binning a dataframe in pandas in Python) e calcolare le statistiche. Un'altra cosa che è fantastica nei panda è la classe Panel che è possibile unire serie di layer con proprietà diverse e combinarli usando la funzione groupby.
- 1. Quali sono le differenze tra $ {} e # {}?
- 2. Quali sono le differenze tra & e &&, | e || in R?
- 3. Python - Quali sono i principali miglioramenti di Pandas su Numpy/Scipy
- 4. Quali sono/sono le principali differenze tra Flink e Storm?
- 5. Quali sono/sono le differenze tra MSBuild e TFSBuild
- 6. Quali sono le differenze tra RedrawWindow e UpdateWindow in Win32?
- 7. Quali sono le differenze tra evento e segnale in Qt
- 8. Quali sono le differenze tra Int e Integer in Scala?
- 9. Quali sono le differenze tra HasOne e References in Nhibernate?
- 10. quali sono le differenze tra r e rb in fopen
- 11. Quali sono le differenze in JIT tra Java e .Net
- 12. Quali sono le differenze tra hostAttributes e proprietà in polimero?
- 13. Quali sono le differenze tra osservabili e promesse in JavaScript?
- 14. Quali sono le differenze tra ConcurrentQueue e BlockingCollection in .Net?
- 15. Quali sono le differenze tra funzioni e metodi in Swift?
- 16. Quali sono le differenze tra INSERT e UPDATE in MySQL?
- 17. Quali sono le differenze tra "=" e "<-" in R?
- 18. Quali sono le differenze tra ADOdb e PDO in PHP?
- 19. Quali sono le differenze tra cElementtree e ElementTree?
- 20. Quali sono le differenze tra le classi Helper e Utility?
- 21. Quali sono le differenze tra Notifica e pynotify?
- 22. Quali sono le differenze tra slice e partizioni di RDD?
- 23. quali sono le principali differenze tra fwrite e write?
- 24. Quali sono le differenze tra JSP e Facelets?
- 25. Quali sono le differenze tra struct_time e datetime?
- 26. Quali sono le differenze tra OllyDbg e WinDbg?
- 27. Quali sono le principali differenze tra AngularJS e ReactJS
- 28. Quali sono le differenze tra un compilatore e un linker?
- 29. Quali sono le differenze tra MPI e OpenMP?
- 30. Quali sono le differenze pratiche tra forme speciali e macro?
A rischio di essere chiacchierone, ho scoperto che la base di NumPy è fantastica e Pandas lo prende alla grande e lo porta a 11. –
è un peccato che questa domanda sia stata chiusa non è basata su opinon e io penso che meriti risposte molto migliori –
https://www.quora.com/What-are-the-advantages-of-using-Pandas-over-Numpy-for-ML-and-Data-Analysis l'ha trovato interessante. –