Mi rendo conto che questo è un argomento ampio, ma sto cercando un buon primer sull'analisi del significato del testo, idealmente in Python. Per fare un esempio di quello che sto cercando di fare, se un utente fa un blog post come:Analisi del significato dal testo
"Manny Ramirez fa il suo ritorno per il Dodgers oggi contro la Houston Astros",
che cosa è un leggero/modo semplice per ottenere i nomi da una frase? Per iniziare, penso che lo limiterei ai nomi propri, ma non vorrei limitarmi a questo (e non voglio fare affidamento su una semplice regex che presuppone che Title Capped sia un nome proprio).
Per rendere questa domanda ancora peggiore, quali sono le cose che non sto chiedendo che dovrei essere? Ho bisogno di un corpus di parole esistenti per iniziare? Che materiale di analisi lessicale devo sapere per fare in modo che funzioni? Mi sono imbattuto in one other question sull'argomento e sto scavando attraverso quelle risorse ora.
Ha, l'ho appena aggiunto al mio carrello su Amazon prima di tornare qui. Va bene? Mi stavo chiedendo la mancanza di recensioni. – Tom
Sembra che abbia una descrizione abbastanza decente di NTLK - toolkit menzionato in una delle risposte – zakovyrya