2012-10-11 12 views
6

Come posso eseguire il tokenize di una stringa nella classe java utilizzando parser stanford?tokenizer stanford nlp

Sono solo in grado di trovare esempi di documentProcessor e PTBTokenizer che prelevano il testo da un file esterno.

DocumentPreprocessor dp = new DocumentPreprocessor("hello.txt"); 
    for (List sentence : dp) { 
    System.out.println(sentence); 
    } 
    // option #2: By token 

    PTBTokenizer ptbt = new PTBTokenizer(new FileReader("hello.txt"), 
      new CoreLabelTokenFactory(), ""); 
    for (CoreLabel label; ptbt.hasNext();) { 
    label = (CoreLabel) ptbt.next(); 
    System.out.println(label); 
    } 

Grazie.

risposta

6

PTBTokenizer costruttore accetta un java.io.Reader, quindi è possibile utilizzare uno StringReader per analizzare il testo

+0

si può scrivere il codice per costruttore e come posso usare il lettore con questo. Grazie – Naveen

+4

, non importa, questo mi sta dando dei token: Lista rawWords = tokenizerFactory.getTokenizer (new StringReader (frase)). Tokenize(); System.out.println (rawWords.get (0) .value()); – Naveen

+1

Ho impiegato del tempo per aprire NetBeans, creare un nuovo progetto, ecc ... quindi oscurarlo ... dannazione ... – CapelliC