Utilizzo di alberi neri rossi per l'ordinamento

Il tempo di esecuzione nel caso peggiore di un red-black tree è O(lg n) e se eseguo un in-order walk nell'albero, in sostanza visita ogni nodo, quindi il runtime totale nel caso peggiore per stampare la raccolta ordinata sarebbe O (n lg n)Utilizzo di alberi neri rossi per l'ordinamento

sono curioso, perché sono red-black trees non preferire per l'ordinamento sopra quick sort (il cui caso medio tempo di esecuzione è O(n lg n).

vedo che forse perché red-black trees non sono ordinate in- posto, ma non sono sicuro, quindi forse qualcuno potrebbe aiutare.

fonte

2010-07-17 Vaibhav Bajpai

Generalmente, gli alberi sono preferiti per la ricerca. Ordina: Ordina una volta. Alberi: cerca più volte. –

Una passeggiata in ordine su un albero richiede O (1) tempo per nodo visitato, quindi dovrebbe essere eseguito in O (n) non O (n lg n). – momeara

In ordine walk necessita di stack space oppure non O (1) get_first e successore. –

Sapendo che algoritmo di ordinamento comporta meglio realmente dipendono i dati e situazione.

Se si sta parlando in termini generali/pratici,

Quicksort (quella in cui si seleziona il perno in modo casuale/Basta scegliere uno fisso, rendendo peggiore caso Omega (n^2)) potrebbe essere migliore di Red- Black Trees perché (non necessariamente in ordine di importanza)

Quicksort è sul posto. Tiene basso l'ingombro della memoria. Diciamo che questa routine quicksort faceva parte di un programma che si occupa di molti dati. Se continuassi a utilizzare grandi quantità di memoria, il tuo sistema operativo potrebbe iniziare a scambiare la memoria del processo e distruggere il tuo perf.
Gli accessi alla memoria di Quicksort sono localizzati. Questo funziona bene con il caching/swapping.
Quicksort può essere facilmente parallelizzato (probabilmente più rilevante in questi giorni).
Se si tentasse di ottimizzare l'ordinamento di alberi binari (utilizzando un albero binario senza bilanciamento) utilizzando invece una matrice, si finirà per fare qualcosa come Quicksort!
Gli alberi di colore rosso-nero hanno overhead di memoria. Devi allocare i nodi possibilmente più volte, i tuoi requisiti di memoria con gli alberi sono doppi/tripli rispetto agli array.
Dopo aver ordinato, diciamo che volevi il 1045 (ad esempio) elemento, dovrai mantenere le statistiche degli ordini nell'albero (costo extra di memoria a causa di questo) e avrai tempo di accesso O (logn)!
rosso-nero ha overheads solo per accedere all'elemento successivo (ricerche puntatore)
rosso-nero non giocare bene con la cache e gli accessi puntatore potrebbero indurre più swapping.
La rotazione in alberi rosso-neri aumenta il fattore costante in O (nlogn).
Forse il motivo più importante (ma non valido se si dispone di lib etc disponibile), Quicksort è molto semplice da comprendere e implementare. Anche un bambino delle scuole può capirlo!

Direi che provi a misurare entrambe le implementazioni e vedere cosa succede!

Inoltre, Bob Sedgewick ha fatto una tesi su quicksort! Potrebbe valere la pena leggerlo.

fonte

2010-07-17 14:25:05

Anche Sedgewick ebbe una mano nell'invenzione degli alberi rosso-neri e degli alberi rosso-neri a sinistra. –

È possibile implementare alberi rosso-neri in cui i nodi vengono assegnati una sola volta, la rotazione può essere eseguita mediante puro movimento del puntatore. Ma ovviamente un nodo ha bisogno di un fattore costante più spazio rispetto a una cella matrice. –

Ci sono molti algoritmi di ordinamento che sono il caso peggiore O(n log n) - per esempio, unisci l'ordinamento. La ragione per cui quicksort è preferito è perché è più veloce nella pratica, anche se algoritmicamente potrebbe non essere buono come altri algoritmi.

Spesso gli ordinamenti incorporati utilizzano una combinazione di vari metodi in base ai valori di n.

fonte

2010-07-17 06:53:11 user11977

ma merge-sort non ordina sul posto, e in che modo è più veloce l'ordinamento in pratica? (Non l'ho mai capito, anche se trovo che mi venga lanciato ogni volta che pongo questa domanda) –

Tutti gli algoritmi di ordinamento hanno i loro fattori di costanti nascosti, e mentre forse potresti trovare dei documenti sul perché questo è il caso con un po 'di ricerca , cercare di decidere quale effettivamente esegue più velocemente in teoria non è così facile. In pratica significa esattamente che - se si confrontano gli algoritmi di ordinamento su dati reali, si scoprirà che quicksort ha inevitabilmente un runtime più veloce. – user11977

Quicksort non è sempre più veloce. Se si continua ad aumentare il numero di elementi, un algoritmo O (n log n) inevitabilmente batterà un algoritmo O (n^2) in un dato momento. Tuttavia per la piccola n, i fattori costanti hanno un impatto molto più forte e l'algoritmo O (n^2) potrebbe essere in realtà la soluzione più rapida. Si consideri ad esempio 10000 * n e 100 * n^2. Inizialmente, 100 * n^2 produrrà valori più piccoli, ma a n = 100 la funzione lineare raggiunge e produce valori più piccoli per tutti gli altri n. L'effetto è lo stesso per quicksort e per la maggior parte "pratico" è più veloce. – ollb

Le misure di complessità del tempo Big-O generalmente non prendono in considerazione i fattori scalari, ad esempio O (2n) e O (4n) vengono generalmente ridotti a O (n). L'analisi della complessità del tempo si basa su fasi operative a livello algoritmico, non a un livello di programmazione rigoroso, cioè senza codice sorgente o considerazioni di istruzione macchina nativa.

Quicksort è generalmente più veloce dell'ordinamento basato su albero poiché (1) i metodi hanno la stessa complessità media temporale algoritmica e (2) le operazioni di ricerca e scambio richiedono meno comandi di programma e accessi ai dati quando si lavora con array semplici rispetto a quelli rossi - Alberi neri, anche se l'albero utilizza un'implementazione basata su array sottostante. La manutenzione dei vincoli dell'albero rosso-nero richiede passaggi operativi aggiuntivi, memorizzazione/accesso del valore del campo dati (colori dei nodi), ecc. Rispetto alle semplici fasi di scambio delle partizioni dell'array di un quicksort.

Il risultato netto è che gli alberi rosso-neri hanno coefficienti scalari superiori rispetto Quicksort non che vengono oscurata dal O standard (n log n) tempo medio risultato dell'analisi della complessità.

Alcune altre considerazioni pratiche sono collegati architetture di macchina sono brevemente discusse nel Quicksort article on Wikipedia

fonte

2010-07-17 12:51:39

In genere, le rappresentazioni degli algoritmi di O (nlgn) possono essere espanse in A * nlgn + B dove A e B sono costanti. Esistono molte prove algoritmiche che mostrano che i coefficienti per quicksort sono inferiori a quelli di altri algoritmi. Questo è nel migliore dei casi (l'ordinamento rapido si comporta in modo orribile sui dati ordinati).

fonte

2010-07-17 14:29:04 Anon

Ciao, il modo migliore per spiegare la differenza tra tutte le routine di smistamento secondo me è. (La mia risposta è per le persone che sono confuse su come l'ordinamento rapido è più veloce nella pratica di un altro algoritmo di ordinamento).

"Penso che stiate correndo su un computer molto lento".

Per prima cosa un'operazione di confronto richiede 1 ora.
Un'operazione di cambio richiede 2 ore.

"Sto usando l'ora solo per far capire alla gente quanto sia importante il tempo".

Ora da tutte le operazioni di smistamento, l'ordinamento rapido ha molto meno confronti e molto meno scambio di elementi.

L'ordinamento rapido è più veloce per questo motivo principale.

fonte

2013-01-06 19:49:01 user1926129

Ci sono molti casi in cui gli alberi rossi non sono male per l'ordinamento. Il mio test ha mostrato, rispetto a merge naturali sorta, che gli alberi rosso-neri Excel in cui:

Gli alberi sono migliori per Dups: Tutti i test in cui hanno bisogno di essere eleminated dups, algoritmo di albero è meglio.Questo non è sorprendente, dal momento che l'albero può essere mantenuto molto piccolo fin dall'inizio, per cui gli algoritmi progettati per l'ordinamento di array in linea potrebbero passare intorno a segmenti più grandi per un tempo più lungo.

Gli alberi sono migliori per Casuale: Tutti i test con algoritmo ad albero casuale sono migliori. Anche questo non è sorprendente, poiché in una distanza tra gli alberi gli elementi sono più corti e lo spostamento non è necessario. Quindi l'inserimento ripetuto in un albero potrebbe richiedere meno sforzo rispetto all'ordinamento di un array.

Quindi abbiamo l'impressione che l'ordinamento di unione naturale eccelle solo in casi speciali ascendenti e discendenti. Che non si può nemmeno dire per un ordinamento rapido.

Sintesi con i casi di test here.

P.S .: si noti che l'uso di alberi per l'ordinamento non è banale. Uno non deve solo fornire una routine di inserimento ma anche una routine che può linearizzare l'albero in un array. Attualmente stiamo usando una routine get_last e una predecessore, che non ha bisogno di uno stack. Ma queste routine non sono O (1) poiché contengono loop.

fonte

2015-10-28 00:12:37

Utilizzo di alberi neri rossi per l'ordinamento

risposta

Problemi correlati