Sono uno studente laureato in letteratura, e ho letto il libro O'Reilly in Natural Language Processing (nltk.org/book). Sembra incredibilmente utile. Ho giocato con tutti i testi di esempio e le attività di esempio nel Capitolo 1, come le concordanze. Ora so quante volte Moby Dick usa la parola "balena". Il problema è che non riesco a capire come eseguire questi calcoli su uno dei miei testi. Ho trovato informazioni su come creare i miei corpora personali (capitolo 2 del libro di O'Reilly), ma non penso che sia esattamente quello che voglio fare. In altre parole, io voglio essere in grado di fareCome posso creare il mio testo NLTK da un file di testo?
import nltk
text1.concordance('yellow')
e ottenere i luoghi dove la parola 'giallo' è usato nel mio testo. Al momento posso farlo con i testi di esempio, ma non i miei.
Sono molto nuovo a Python e alla programmazione, quindi questa roba è molto eccitante, ma molto confusa.
eccellente. Stavo solo cercando di rispondere a questa domanda me stesso; molto contento di aver inciampato nella tua (auto) risposta. - Un altro studioso di letteratura – cforster
Per far funzionare tutto questo, ho dovuto prima scaricare "punkt": nltk.download ('punkt') –
Cosa fa la RU? Trovato: f = open ('myfile.txt', 'rU') # rU significa "leggi" e gestisce le terminazioni di linea – ProfVersaggi