6
Come posso eseguire il tokenize di una stringa nella classe java utilizzando parser stanford?tokenizer stanford nlp
Sono solo in grado di trovare esempi di documentProcessor e PTBTokenizer che prelevano il testo da un file esterno.
DocumentPreprocessor dp = new DocumentPreprocessor("hello.txt");
for (List sentence : dp) {
System.out.println(sentence);
}
// option #2: By token
PTBTokenizer ptbt = new PTBTokenizer(new FileReader("hello.txt"),
new CoreLabelTokenFactory(), "");
for (CoreLabel label; ptbt.hasNext();) {
label = (CoreLabel) ptbt.next();
System.out.println(label);
}
Grazie.
si può scrivere il codice per costruttore e come posso usare il lettore con questo. Grazie – Naveen
, non importa, questo mi sta dando dei token: Lista rawWords = tokenizerFactory.getTokenizer (new StringReader (frase)). Tokenize(); System.out.println (rawWords.get (0) .value()); –
Naveen
Ho impiegato del tempo per aprire NetBeans, creare un nuovo progetto, ecc ... quindi oscurarlo ... dannazione ... – CapelliC