Le soluzioni NER tendono ad essere specifiche del dominio, utilizzando elenchi di parole codificati come segnali (caratteristiche) e/o struttura di lettere interne delle entità denominate.
I nomi di Regno Unito/Stati Uniti sono simili tra loro e anche con altri nomi europei, in quanto molti nomi e cognomi americani popolari provengono da immigrati europei non inglesi. I nomi indiani sono significativamente differenti e gli elenchi di nomi/cognomi e di dati di addestramento comunemente utilizzati in genere non includono molti o specifici dati specifici dell'India.
Per risolvere il problema, è necessario formare un modello NER specializzato sulla base di dati adatti per il proprio dominio particolare.
c'è qualche altra opzione per l'entità dei nomi indiani riconosciuti? Mi piacciono altri strumenti opensource ecc. @peteris –