Desidero classificare o ordinare una raccolta di elementi (con dimensioni potenzialmente maggiori di 100.000) in cui gli articoli nella raccolta non hanno valore intrinseco (comparabile), invece tutto ciò che ho è il confronto tra qualsiasi due articoli forniti dagli utenti in modo soggettivo.Algoritmo di classificazione basato su confronto
Esempio: considerare una raccolta con elementi [a, b, c, d]
e confronti degli utenti b > a
, a > d
, d > c
. L'ordine corretto di questa raccolta sarebbe [b, a, d, c]
.
Questo esempio è semplice, ma ci potrebbero essere casi più complicati:
- Dal momento che i confronti sono soggettivi, un utente potrebbe anche dire che
c > b
. In tal caso ciò causerebbe un conflitto con l'ordine di cui sopra. - Inoltre potresti non avere confronti che "connette" tutti gli elementi, ad esempio
b > a
,d > c
. In tal caso l'ordine è ambiguo. Potrebbe essere[b, a, d, c]
o[d, c, b, a]
. In questo caso, l'ordine è accettabile.
Se possibile sarebbe bello in qualche modo prendere in considerazione più istanze dello stesso confronto e dare più peso a quelle con occorrenze più elevate. Ma una soluzione senza questa condizione sarebbe comunque accettabile.
Un'applicazione simile di questo algoritmo è stata utilizzata dall'applicazione FaceMash di Zuckerberg in cui ha classificato le persone in base ai confronti (se l'avessi capito correttamente), ma non sono stato in grado di trovare cosa fosse effettivamente quell'algoritmo.
Esiste un algoritmo già esistente in grado di risolvere il problema sopra riportato? Non vorrei spendere sforzi cercando di inventarne uno, se è il caso. Se non esiste un algoritmo specifico, esistono forse determinati tipi di algoritmi o tecniche a cui puoi indirizzarmi?
Se sei interessato all'utilizzo (più che allo sviluppo), dovresti provare a classificare, il nostro sistema di classificazione. È diverso dal sistema di classificazione Elo e Glicko (ecco un [confronto] (https://rankade.com/ree#ranking-system-comparison)) perché può gestire le partite con 2+ fazioni (ad esempio, nel tuo scenario). A differenza di TrueSkill, la classifica è gratuita e facile da usare. –