2013-03-23 12 views
8

Sto compilando un corpus di tweet per l'analisi dei sentimenti e sto cercando di afferrare i tweet con i personaggi di Emoji di Apple.Ricerca di tweet con Unicode Character/Apple Emoji?

ho trovato il carattere unicode per una delle facce come: U + 1F604 (U + U D83D + DE04), UTF-8: F0 9F 98 84

Finora, non ho potuto per ottenere risultati significativi Se cerco \ud83d\ude04, ricevo indietro alcuni tweet, ma niente di utile. \U0001f604 non restituisce nulla sulla ricerca.

C'è qualche modo per me di interrogare Twitter per questi personaggi?

Sto utilizzando il wrapper python-twitter per l'API, ma sarei disposto a utilizzare qualcos'altro se esiste un'alternativa migliore.

+0

So che questo è possibile perché http://www.iemoji.com/ ha un flusso di tweet che contengono emoji, aumentando una taglia. –

risposta

3

Questo è possibile - ma è un po 'difficile ....

Non è possibile utilizzare la ricerca standard Twitter - ma è possibile utilizzare la ricerca in streaming.

Ci sono librerie open source disponibili a https://github.com/mroth/emojitrack-feeder in Ruby e Node.

5

Come @Terence Eden sottolinea, twitters L'API di ricerca REST non funziona con i caratteri emoji, ma l'API di streaming (a partire da gennaio 2016).

Ci sono alcuni strumenti disponibili per accedere alle API di twitters in python. Quello che ho usato per lo più è tweepy. Può essere installato con pip.

Il tweepy docs on setting up the streaming api è abbastanza facile da seguire. Le stringhe filtrate devono contenere i veri emoji (ad es. '').

Nota che questo cerca gli emoji come "parole": cioè, circondato da uno spazio bianco. Qualcosa come "gratis" non sarà trovato!

+0

Molto strano. L'ho notato anch'io. Qualche idea sul perché lo streaming può farlo ma non cercare? Ad ogni modo, questa risposta avrebbe dovuto essere accettata dall'OP. – sudo

Problemi correlati