Ho una lista che rappresenta prodotti che sono più o meno uguali. Ad esempio, nell'elenco di seguito, sono tutti dischi rigidi di Seagate.Algoritmo per classificare un elenco di prodotti?
- Seagate Hard Drive 500Go
- Seagate Hard Drive 120Go laptop
- Seagate Barracuda 7200.12 ST3500418AS 500GB 7200 RPM SATA 3.0Gb/s disco rigido
- nuovo e shinny disco rigido Seagate da 500Go
- Seagate Barracuda 7200.12
- Seagate FreeAgent Desk Disco rigido esterno da 500 GB Argento 7200 RPM USB2.0 Vendita al dettaglio
Per un essere umano, i dischi rigidi 3 e 5 sono uguali. Potremmo andare un po 'oltre e supporre che i prodotti 1, 3, 4 e 5 siano uguali e inserire in altre categorie i prodotti 2 e 6.
Abbiamo una lista enorme di prodotti che vorrei classificare . Qualcuno ha un'idea di quale sarebbe il miglior algoritmo per fare una cosa del genere. Qualche suggerimento?
Mi sembra di un classificatore bayesiano ma non sono sicuro che sia la scelta migliore. Qualsiasi aiuto sarebbe apprezzato!
Grazie.
Grazie! Approccio molto interessante! – Martin