2015-07-24 32 views
5

Sto usando l'algoritmo di Clustream e ho capito che ho bisogno di normalizzare i miei dati. Ho deciso di utilizzare l'algoritmo min-max per farlo, ma penso che in questo modo i valori dei nuovi oggetti dati in arrivo saranno calcolati in modo diverso in quanto i valori di min e max potrebbero cambiare. Pensi che io sia corretto? In tal caso, quale algoritmo dovrò usare?metodi di normalizzazione per i dati di streaming

risposta

0

Durante la normalizzazione dei dati di flusso è necessario utilizzare le proprietà statistiche del set di treni. Durante lo streaming è sufficiente tagliare valori troppo grandi/bassi su un valore minimo/massimo. Non c'è altro modo, è un flusso, lo sai.

Ma come compromesso, è possibile raccogliere continuamente le proprietà statistiche di tutti i dati e riqualificare il modello di volta in volta per adattarsi ai dati in evoluzione. Non conosco Clustream ma dopo breve googling: sembra essere un algoritmo per aiutare a fare tali compromessi.

2

Invece di calcolare il min-max globale basato sull'intero dato, è possibile utilizzare una nomadizzazione locale basata su una finestra scorrevole (ad esempio utilizzando solo gli ultimi 15 secondi di dati). Questo approccio è molto importante per calcolare il filtro locale sul segnale e l'elaborazione delle immagini.

Spero possa aiutarti.

Problemi correlati