Il mio lavoro prevede di utilizzare un cluster UIMA per eseguire documenti attraverso per estrarre le entità denominate e quali no. A quanto ho capito, UIMA ha pochissime componenti della PNL confezionate con essa. Ho provato GATE per un po 'di tempo e ne sono abbastanza tranquillo. Funziona bene con il testo normale, ma quando lo eseguiamo attraverso alcuni dati di test rappresentativi, la precisione diminuisce. I dati di testo che abbiamo internamente a volte sono tutti maiuscoli, a volte tutti minuscoli o un mix dei due nello stesso documento. Anche usando le regole di tutte le maiuscole di ANNIE, la precisione lascia ancora molto a desiderare. Di recente ho sentito parlare di Stanford NLP e OpenNLP, ma non ho avuto il tempo di allenarmi e testarli in modo estensivo. Come si confrontano questi due in termini di accuratezza con ANNIE? Funzionano con UIMA come fa GATE?Precisione: ANNIE vs Stanford NLP vs OpenNLP con UIMA
Grazie in anticipo.
ANNIE è basato su regole. La mia ipotesi è che Stanford NLP e OpenNLP dovrebbero funzionare meglio dal momento che sono basati su ML. –