sto usando il nucleo NLP Stanford e utilizzare questa linea per caricare alcuni moduli per elaborare il mio testo:Chunking un testo con la Stanford-PNL
props.put("annotators", "tokenize, ssplit, pos, lemma, ner, parse, dcoref");
È ther un modulo che posso caricare spezzato il testo?
O qualche suggerimento con un modo alterante di usare il nucleo di Stanford per tagliare del testo?
Grazie
Con "chunking" stai che significa individuando le cose come base di pezzi NP e gruppi verbali? O intendi la divisione di un testo di grandi dimensioni in segmenti, come i raggruppamenti di testo correlati come i singoli commenti del blog? –
Sto facendo la stessa identica domanda; nel mio caso intendo l'estrazione di frasi di nome per esempio – humanzz