Sto facendo qualche lettura, e mi sono imbattuto evitando un internalStore se la mia applicazione non ha bisogno di massaggiare i dati prima di essere inviati a SQL. Cos'è un massaggio di dati?Che cosa significa "Data Massage"?
risposta
Manipolare, elaborare, modificare, ricalcolare. In breve, se si stanno semplicemente spostando i dati in raw, non è necessario utilizzare internalStore, ma se si sta facendo qualcosa prima dell'archiviazione, è possibile che si desideri un internalStore.
-Adam
La purezza dei dati non dovrebbe mai essere presa naturalmente. :) – EBGreen
No, non si dovrebbe mai fidarsi implicitamente dell'input del programma di alcun tipo. Semplici controlli, tuttavia, potrebbero non essere considerati massaggianti in quanto non si stanno toccando i dati - semplicemente sbirciando. –
Questo è vero. La mia esperienza con il massaggio è quasi sempre stata quella di ripulire i dati già in un archivio dati immesso da un altro sistema su cui non ho alcun controllo. – EBGreen
Clean up, la normalizzazione, il filtraggio, ... Basta modificare i dati in qualche modo dalla input originale in una forma che è più adatto a vostro uso.
A volte l'intero processo di spostamento dei dati viene definito "ETL" che significa "Estrai, Trasforma, Carica". Massaggiare i dati è il passaggio "trasforma", ma implica correzioni ad-hoc che devi fare per appianare i problemi che hai riscontrato (come un massaggio ai tuoi muscoli) piuttosto che le trasformazioni tra formati noti.
Pensa che si potrebbe fare per i dati "massaggio" includono:
- Cambia formati da ciò che il sistema sorgente emette a quello che si aspetta che il sistema di destinazione, per esempio cambia il formato della data da d/m/y a m/g/a.
- sostituire i valori mancanti con i valori predefiniti, ad es. Fornire "0" quando non viene fornita una quantità.
- Filtra i record non necessari nel sistema di destinazione.
- Verificare la validità dei record e ignorare o segnalare sulle righe che potrebbero causare un errore se si è tentato di inserirli.
- Normalizza i dati per rimuovere le variazioni che dovrebbero essere uguali, ad es. sostituire la maiuscola con la minuscola, sostituire "01" con "1".
E infine c'è la pratica meno salutare di massaggiare i dati buttando fuori i dati (o regolando i numeri) quando non ti danno la risposta che vuoi. Unfortunatley peole facendo analisi statistiche spesso massaggia i dati per sbarazzarsi di quei fastidiosi valori anomali che confutano la loro teoria. A causa di questa pratica, fare riferimento alla pulizia dei dati come ammassare i dati è inappropriato. Pulire i dati per renderlo qualcosa che può andare nel tuo sistema (eliminando date insignificanti come il 30 giugno 2009 perché qualcun altro li ha memorizzati in varchar anziché come date, separando il nome e il cognome in campi separati, correggendo tutti i dati maiuscoli , aggiungere valori predefiniti per i campi che richiedono dati quando i dati forniti non sono forniti, ecc.) è una cosa: massaggiare i dati implica una pratica di aggiustamento inadeguato dei dati.
- 1. Che cosa significa formato data CCYYMMDD?
- 2. Cosa significa data ... dove significa in Haskell?
- 3. Che cosa significa "sys.argv"?
- 4. Che cosa significa questo socket.gaierror?
- 5. Che cosa significa __utma?
- 6. Che cosa significa hibernate.default_schema?
- 7. Che cosa significa "log *"?
- 8. Che cosa significa scalabilità?
- 9. Che cosa significa costruire?
- 10. Che cosa significa CultureInfo.InvariantCulture?
- 11. Che cosa significa Material.alphaTest?
- 12. Che cosa significa Opt.out?
- 13. Che cosa significa compilationOptions.emitEntryPoint?
- 14. Che cosa significa "String ..."?
- 15. Che cosa significa 8badf00d?
- 16. Che cosa significa \ u003C?
- 17. Che cosa significa new()?
- 18. Che cosa significa "arricciatura"?
- 19. Che cosa significa "deprecato"?
- 20. Che cosa significa _branch_match_id?
- 21. Che cosa significa MEDIA_ERROR_SERVER_DIED?
- 22. cout - che cosa significa?
- 23. Che cosa significa __FILE__?
- 24. Che cosa significa nibNameOrNil?
- 25. Che cosa significa SKU?
- 26. Che cosa significa "javascript: //"?
- 27. Che cosa significa `_time_independent_equals`?
- 28. Che cosa significa EAGAIN?
- 29. Che cosa significa document.all?
- 30. Che cosa significa "=>"?
A volte i dati si sovraccaricano di lavoro e famiglia e devono rilassarsi. A volte i dati pagano di più per un "lieto fine" e sono ordinati davvero bene. = oD – Echostorm