Sto cercando di fare dell'analisi del testo in un programma che sto scrivendo. Sto cercando fonti di testo alternative nella sua forma grezza simile a ciò che è fornito nelle discariche di Wikipedia (download.wikimedia.com).Dove posso trovare un dump di testo non elaborato sul web?
preferirei non dover passare attraverso la briga di strisciare siti web, cercando di analizzare l'html, l'estrazione di testo ecc ..
+1 Sono venuto qui per pubblicare PG. – Joe