Recentemente ho parlato con qualcuno che lavora per Amazon e mi ha chiesto: come farei per smistare i terabyte di dati usando un linguaggio di programmazione?Qualcuno veramente ordina terabyte di dati?
Sono un ragazzo C++ e, naturalmente, abbiamo parlato di merge sort e una delle possibili tecniche è quella di dividere i dati in dimensioni più piccole e ordinare ciascuno di essi e unirli infine.
Ma in realtà, aziende come Amazon o eBay ordinano terabyte di dati? Lo so, memorizzano un'infinità di informazioni, ma le ordinano?
In poche parole, la mia domanda è: perché non dovrebbero tenerli ordinati in primo luogo, invece di ordinare terabyte di dati?
Per molte organizzazioni, un terabyte non è un sacco di dati. Non andare a una riunione di Oracle User Group e parlare del tuo grande database di terabyte. Questo è sicuramente un cambiamento rispetto a dieci anni fa, quando le persone generalmente pensavano che un terabyte fosse grande. –
Grazie a straordinarie risposte per questo da parte di tutti nel mondo. Davvero stupito dalla comunità Stackoverflow. – user373215
Ho eseguito un web crawler che, al suo apice, stava regolarmente ordinando due terabyte di dati. E questa è stata un'operazione piuttosto piccola rispetto a un'azienda come Amazon o Google. –