Ho un corpus di alcuni 100mila documenti legali (principalmente dall'Unione Europea) - leggi, commenti, documenti giudiziari, ecc. Sto provando ad algoritmicamente a dare un senso a loro.PNL di testi legali?
Ho modellato le relazioni conosciute (temporali, questo-cambia-questo, ecc.). Ma a livello di singolo documento, vorrei avere strumenti migliori per consentire una comprensione veloce. Sono aperto alle idee, ma ecco una domanda più specifica:
Ad esempio: esistono metodi NLP per determinare le parti rilevanti/controverse dei documenti rispetto al boilerplate? I documenti del TTIP recentemente trapelati sono migliaia di pagine con tabelle di dati, ma una frase da qualche parte potrebbe distruggere un settore.
Ho giocato in giro con il nuovo Parsey McParface
di google e altre soluzioni NLP in passato, ma mentre funzionano in modo impressionante, non sono sicuro di quanto siano bravi a isolare il significato.