Alla domanda originale viene fornito il file contenente l'URL da 5 GB visitato lo scorso giorno, trovare il primo k URL frequente. Il problema può essere risolto utilizzando la mappa hash per contare le occorrenze dell'URL distinto e trovare il top k con l'aiuto di heap minimo, prendendo un tempo O (n log k).Trova l'URL in alto k per l'ultimo giorno, o l'ultima ora o l'ultimo minuto?
Ora sto pensando a cosa succederebbe se l'input fosse un flusso di dati online illimitato (invece di file statici), quindi come posso conoscere l'URL in alto k dell'ultimo giorno?
Oppure c'è qualche miglioramento che posso apportare al sistema che mi consente di ottenere l'URL k principale per ultimo minuto e l'ultimo giorno e le ultime ore in modo dinamico?
Qualsiasi suggerimento sarà apprezzato !!
checkout http://stackoverflow.com/a/10190836/404145 – DiveInto