Ho visto this question, che si concentra sul problema "Brittney Spears". Ma ho una domanda diversa. In che modo l'algoritmo determina quali parole o frasi devono essere classificate? Per esempio, se mando un tweet che dice "Michael Jackson è morto", come fa a tirare fuori "Michael Jackson" ma non "muore"?In che modo l'algoritmo degli argomenti di tendenza di Twitter decide quali parole estrarre dai tweet?
O supponiamo che Alec Baldwin e Steven Baldwin fossero nelle notizie quel giorno e quindi sono stati entrambi citati in molti tweet. Come saprebbe trattare entrambi i nomi in modo diverso invece di tirare fuori "Baldwin"?
Fatto ingenuamente, ho potuto vedere questo problema come NP-completo (dovresti confrontare tutte le potenziali frasi nel tweet con tutte le potenziali frasi nei tweet di tutti gli altri).