Ho un indice con più voci duplicate. Hanno id differenti ma gli altri campi hanno contenuti identici.Elasticsearch: rimuovere i duplicati dall'indice
Ad esempio:
{id: 1, content: 'content1'}
{id: 2, content: 'content1'}
{id: 3, content: 'content2'}
{id: 4, content: 'content2'}
Dopo aver rimosso i duplicati:
{id: 1, content: 'content1'}
{id: 3, content: 'content2'}
Esiste un modo per eliminare tutti i duplicati e mantenere soltanto una voce distinta senza confrontare manualmente tutte le voci?
utilizzando i propri ID che garantiscono l'idempotence. Questo significa che con il contenuto: "content1", dovresti sempre avere lo stesso id –
Ma non è il mio caso. Sto lavorando con un dato indice. In questo indice ci sono più voci separate che hanno lo stesso contenuto. Pertanto voglio rimuovere questi duplicati. – fwind
Come viene mappato il campo 'content'? È una 'stringa',' analizzata' o 'non_analizzata '? – Val