Come posso misurare la percentuale di somiglianza tra due sequenze di stringhe?Algoritmo per misurare la somiglianza tra due sequenze di stringhe
Ho due file di testo e Nei file ci sequenze vengono scritti come
primo file:
AAA BBB DDD CCC GGG MMM AAA MMM
secondo file:
BBB DDD CCC MMM AAA MMM
Come misurare la somiglianza tra questi due file in termini di ordine di stringhe?
Ad esempio nell'esempio precedente entrambi i file hanno somiglianza a causa dell'ordine delle stringhe è uguale tuttavia alcune stringhe mancano nel file-2. Quale algoritmo è più adatto a risolvere questo problema in modo che possa misurare quanto sia simile l'ordine delle stringhe non la frequenza delle stringhe in due?