Come utilizzare le funzioni di NLTK per persiano?NLTK per persiano
Ad esempio: "concordanza". Quando uso 'concordance', la risposta è 'not match', tuttavia c'è il parametro di concordanza nel mio testo.
l'input è molto semplice .it contiene "ciao سلام". Quando parametro di 'concordanza' è 'ciao' la risposta è corretta, ma, se è 'سلام' la risposta è 'non corrisponde'.il previsto l'output per me è "Visualizzazione di 1 di 1 corrispondenze".
import nltk
from urllib import urlopen
url = "file:///home/.../1.html"
raw = urlopen(url).read()
raw = nltk.clean_html(raw)
tokens = nltk.word_tokenize(raw)
tokens = tokens[:12]
text = nltk.Text(tokens)
print text.concordance('سلام')
Puoi fornire un esempio di codice minimo e un esempio di input minimo di ciò che hai provato, e che ti aspettavi che succedesse? – jogojapan