2013-06-08 16 views
128

Quindi ho completamente capito come usare resample, ma la documentazione non fa un buon lavoro spiegando le opzioni.panda ricampionamento documentazione

Così maggior parte delle opzioni nella funzione resample sono piuttosto semplice eccezione di questi due:

  • regola: la stringa di offset o oggetto che rappresenta la conversione di destinazione
  • come: corde, metodo per la down-o ri- campionamento, di default a 'significare'

Così dal guardare il numero di esemplari che ho trovato on-line che posso vedere di regola si può fare 'D' per il giorno, per 'xMin' minuti, 'xL' per millisecondi, ma è tutto ciò che ho potuto trovare.

per come ho visto il seguente: 'first', np.max, 'last', 'mean' e 'n1n2n3n4...nx' dove nx è la prima lettera di ciascun indice di colonna.

Quindi c'è da qualche parte nella documentazione che mi manca che visualizza tutte le opzioni per la regola pandas.resample e come input? Se sì, dove perché non ho potuto trovarlo. Se no, quali sono tutte le opzioni per loro?

+6

Per vagabondi di Google, per il ricampionamento usando 'come last'' = 'e' how = 'first'': non dimenticare di aggiungere 'closed =' left ', label =' left''. [link] (https://github.com/pydata/pandas/issues/1998) –

+0

@ NasserAl-Wohaibi Sono abbastanza fiducioso che il tuo commento sopra è un'indicazione che queste opzioni possono aiutare a rispondere pienamente alla seguente domanda. Hai già riscontrato questo problema? http://stackoverflow.com/questions/26247301/causal-resampling-values-within-time-window-until-now –

+0

how = 'last' è deprecato ora in favore di 'resample (...). last() ' – shadi

risposta

200
B  business day frequency 
C  custom business day frequency (experimental) 
D  calendar day frequency 
W  weekly frequency 
M  month end frequency 
SM  semi-month end frequency (15th and end of month) 
BM  business month end frequency 
CBM  custom business month end frequency 
MS  month start frequency 
SMS  semi-month start frequency (1st and 15th) 
BMS  business month start frequency 
CBMS custom business month start frequency 
Q  quarter end frequency 
BQ  business quarter endfrequency 
QS  quarter start frequency 
BQS  business quarter start frequency 
A  year end frequency 
BA  business year end frequency 
AS  year start frequency 
BAS  business year start frequency 
BH  business hour frequency 
H  hourly frequency 
T  minutely frequency 
S  secondly frequency 
L  milliseonds 
U  microseconds 
N  nanoseconds 

Vedere le timeseries documentation. Include un elenco di offsets (e 'anchored' offsets) e una sezione su resampling.

Nota che non c'è un elenco di tutte le diverse opzioni how, perché può essere qualsiasi funzione di matrice NumPy e qualsiasi funzione che è disponibile tramite groupby dispatching può essere passato a how per nome.

+1

" ... perché può essere una qualsiasi funzione di array NumPy e ... "- sì, l'ho letto nei documenti, ma c'è qualche documentazione ovunque che spieghi che cosa esattamente questa funzione dovrebbe fare e che cosa deve fare con il ricampionamento ...? Mi sento abbastanza perso qui. – jhin

+0

Questo dovrebbe essere collegato a tutte le aree rilevanti della documentazione, come ad esempio il ricampionamento. Ecco il link alle abbreviazioni: http://pandas.pydata.org/pandas-docs/stable/timeseries.html#offset-aliases – wordsforthewise

63

C'è qualcosa di più, ma probabilmente stai per questo elenco:

B business day frequency 
C custom business day frequency (experimental) 
D calendar day frequency 
W weekly frequency 
M month end frequency 
BM business month end frequency 
MS month start frequency 
BMS business month start frequency 
Q quarter end frequency 
BQ business quarter endfrequency 
QS quarter start frequency 
BQS business quarter start frequency 
A year end frequency 
BA business year end frequency 
AS year start frequency 
BAS business year start frequency 
H hourly frequency 
T minutely frequency 
S secondly frequency 
L milliseconds 
U microseconds 

Fonte: http://pandas.pydata.org/pandas-docs/stable/timeseries.html#offset-aliases

+4

Perché non c'è il 'Min' (come il '5Min' usato nel documentazione)? – ziyuang