Ho n vettori, ciascuno con m elementi (numero reale). Voglio trovare la coppia in cui la similarità cosine è massima tra tutte le coppie.Trovare la migliore somiglianza del coseno in un set di vettori
La soluzione semplice richiede O (n m).
Esiste una soluzione migliore?
aggiornamento
Cosine similarity/distance and triangle equation mi ispira che avrei potuto sostituire "coseno di similitudine" con "lunghezza della corda", che perde precisione ma aumenta la velocità di un sacco. (Ci sono molte soluzioni esistenti risolvendo vicino nello spazio metrico, come ANN)
@ hs3180 Ci sono delle restrizioni sugli elementi dei tuoi vettori? Per esempio. sono sempre binari (0 o 1)? –
@robmayoff No, gli elementi sono reali (float) – hs3180
@robmayoff Se gli elementi sono binari, questo problema equivale a trovare una coppia di 01 stringhe con gli stessi bit. – hs3180