2011-12-27 13 views
7

Anche se tengo lo sfondo EE, non ho avuto la possibilità di frequentare le lezioni di elaborazione del linguaggio naturale.Come iniziare a creare wordnet per la lingua turca da utilizzare nell'analisi del sentimento

Vorrei creare uno strumento di analisi del sentimento per la lingua turca. Penso che sia meglio creare un database di wordnet turco piuttosto che tradurre il testo in inglese e analizzarlo con testo tradotto buggato con gli strumenti forniti. (è)

Quindi cosa mi consigliate di fare? Prima di tutto prendere lezioni di PNL da un sito web di classi aperte? Non so davvero da dove cominciare. Potresti aiutarmi e magari fornirmi una guida passo passo? So che questo è un progetto accademico, ma sono interessato a costruire competenze come hobby in quell'area.

Grazie in anticipo.

+0

Potresti essere interessato a seguire le proposte di potentia l nuovi siti SE tra cui [Turkish Language & Usage] (http://area51.stackexchange.com/proposals/30873/turkish-language-usage?referrer=wKPqNxBBY-xKcrw-ScJbLA2) e [StackOverflow in turco] (http://area51.stackexchange.com/proposals/34945/stack-overflow-in-turkish?referrer=6DTBHmak2NY7uyvjVsZajA2). – Caleb

+0

Penso che tu abbia ragione riguardo alla necessità di costruire un database di parole e frasi turco per questo piuttosto che tradurre. Tuttavia non sono sicuro che questo sia il posto migliore per questa domanda. Questa potrebbe essere una domanda appropriata per migrare al sito [Programmers.SE] (http://programmers.stackexchange.com/) come un problema concettuale piuttosto che un problema di codifica. Pensieri? – Caleb

+1

Potrebbe avere ragione. Guarda come migrare in quella sezione. –

risposta

3

Qui è il processo che ho usato prima (facendo giapponese, cinese, tedesco e reti semantiche arabi):

  1. Raccogliere almeno due inglesi/dizionari turchi. Devono essere indipendenti, non derivati ​​l'uno dall'altro. Puoi usare Wikipedia per generare automaticamente uno dei tuoi dizionari. Se hai bisogno di pubblicare la tua rete, potresti aver bisogno di dizionari open source, o costi di licenza, o di un avvocato.
  2. Utilizzare questi dizionari per tradurre Wordnet inglese, producendo una valutazione di confidenza per ogni synset.
  3. Mantieni quelli con una forte sicurezza, approvando o fissando manualmente quelli con confidenza medio o bassa.
  4. finirlo manualmente

ho ampliato tale nella sezione "Traduzione automatica di WordNet" della mia carta 2008: http://dcook.org/mlsn/about/papers/nlp2008.MLSN_A_Multilingual_Semantic_Network.pdf

(Per il vostro obiettivo dichiarato di un dizionario sentimento turco, ci sono altri approcci, che non coinvolgono una rete semantica, ad esempio "Semantic Analysis and Opinion Mining", di Bing Liu, è un bel giro di ricerche, ma un approccio di rete semantica, IMHO, darà sempre risultati migliori a lungo termine e tanti altri usi)

Problemi correlati