Ho bisogno di un modo per ottenere contenuti correlati senza usare tag perché nel mio caso ci sono troppi tag e questi tag sono inseriti dagli utenti (quindi nella maggior parte dei casi si sono dimenticati di usarli).Come ottenere contenuti correlati SENZA usare i tag?
Youtube fa la stessa cosa: se, ad esempio, stai guardando un video divertente, allora YouTube ti mostra altri video divertenti nel contenuto correlato.
Per esempio, se il titolo dell'articolo è "Barack Obama, presidente degli Stati Uniti, vai a Miami", ho bisogno di ottenere altri articoli che contengano il titolo e, se possibile, altri articoli dello stesso argomento.
QUESTO PU BE ESSERE MOLTO COMPLESSO DA FARE, quindi ti ho chiesto un consiglio.
Questo sarà seriamente difficile avere ragione, a meno che non facciate qualcosa di discutibile qualità, come cercare solo termini ad eccezione di articoli/parole comuni (ad es. video relativi a '[" Barack "," Obama "," presidente "," USA "," Miami "]'). È interessante notare che questo finisce semplicemente per darti dei tag. Penso che se permetti agli utenti di specificare i tag, finirai con una qualità superiore. –
La prima cosa che posso suggerire è di fare un cron job che calcoli questi (e questo può essere molto inefficiente dato che ne eseguirà uno al giorno o qualcosa del genere) - e tu inserirai le tue relazioni in una tabella. Penserò alla parte di ricerca effettiva :) –
Al primo passaggio puoi preparare un elenco di parolacce (il, a, un, at e così via), conoscere la versione non pluralizzata di ogni parola (forse potresti trovare un web servizio), e generare un sistema di tagging da questo graffio. Prestare attenzione all'esecuzione di tale approccio. –