Sto tentando di estrarre le entità denominate dal mio testo utilizzando NLTK. Trovo che NLTK NER non sia molto preciso per il mio scopo e voglio aggiungere anche altri tag. Ho cercato di trovare un modo per allenare il mio NER, ma non riesco a trovare le risorse giuste. Ho un paio di domande per quanto riguarda NLTK-Riconoscimento entità con nome NLTK con dati personalizzati
- È possibile utilizzare i propri dati per addestrare un nome Entity Recognizer in NLTK?
- Se riesco ad allenare utilizzando i miei dati, il file name_entity.py è stato modificato?
- Il formato del file di input deve essere in IOB ad es. Eric NNP B-PERSON?
- Ci sono risorse - a parte il libro di ricette nltk e nlp con python che posso usare?
Vorrei davvero apprezzare aiuto in questo senso
Navigando attraverso il sito SNER, ho visto che c'è anche un'interfaccia python [qui] (https://github.com/dat/pyner). Non sei sicuro di quanto sia maturo, ma potrebbe essere utile. – senderle
Questa domanda si presenta molto nelle ricerche per migliorare il riconoscimento dell'entità con nome nltk, ma dire "lol usa qualcos'altro" non è così informativo. – blueblank
Ho avuto lo stesso problema e ho condiviso ciò che ha funzionato per me. Scusa se questo ti ha sconvolto :( – jjdubs