piuttosto tardi, ma questo scaricherà un elenco compressa di tutte le parole del Wikizionario inglese, senza la necessità di analizzare XML (anche se sarà necessario un minimo di parsing):
curl http://dumps.wikimedia.org/enwiktionary/latest/enwiktionary-latest-all-titles.gz ~/Downloads/titles.gz
Da lì, tutto quello che dovete fare è decomprimere il file e renderlo un file di testo:
gunzip ~/Downloads/titles.gz
mv ~/Downloads/titles ~/Downloads/titles.txt
per analizzare l'elenco, utilizzare qualcosa di simile, che sarà recuperare un elenco di tutte le parole che consistono interamente di lettere inglesi minuscole:
grep "^[a-z]\{1,\}$" ~/Downloads/titles.txt | sort | uniq >> ~/Downloads/words.txt
fonte
2014-05-01 14:57:34
È possibile eseguire il polling di un dizionario online che offre un'apologia e creare il proprio elenco di parole. – LanguagesNamedAfterCofee
@LanguagesNamedAfterCofee Questo è il commento più vago che abbia mai visto :-) –