Come configurare la directory dei dati di nltk dal codice?Come configurare la directory dei dati di nltk dal codice?
risposta
Basta cambiare gli articoli di nltk.data.path
, è un elenco semplice.
o impostare la variabile di ambiente NLTK_DATA. – schemacs
Il mio nltk.data.path ha ''/ home/aankney/nltk_data'' come il primo elemento della lista MA io sono su un server e voglio' nltk_data' essere condiviso da altre persone che usano il server. Come posso impedire a nltk di usarlo come uno dei percorsi di download? –
uso aggiungere, esempio
nltk.data.path.append('/libs/nltk_data/')
Dal codice, http://www.nltk.org/_modules/nltk/data.html:
``nltk:path``: Specifies the file stored in the NLTK data package at *path*. NLTK will search for these files in the directories specified by ``nltk.data.path``.
Poi nel codice:
######################################################################
# Search Path
######################################################################
path = []
"""A list of directories where the NLTK data package might reside.
These directories will be checked in order when looking for a
resource in the data package. Note that this allows users to
substitute in their own versions of resources, if they have them
(e.g., in their home directory under ~/nltk_data)."""
# User-specified locations:
path += [d for d in os.environ.get('NLTK_DATA', str('')).split(os.pathsep) if d]
if os.path.expanduser('~/') != '~/':
path.append(os.path.expanduser(str('~/nltk_data')))
if sys.platform.startswith('win'):
# Common locations on Windows:
path += [
str(r'C:\nltk_data'), str(r'D:\nltk_data'), str(r'E:\nltk_data'),
os.path.join(sys.prefix, str('nltk_data')),
os.path.join(sys.prefix, str('lib'), str('nltk_data')),
os.path.join(os.environ.get(str('APPDATA'), str('C:\\')), str('nltk_data'))
]
else:
# Common locations on UNIX & OS X:
path += [
str('/usr/share/nltk_data'),
str('/usr/local/share/nltk_data'),
str('/usr/lib/nltk_data'),
str('/usr/local/lib/nltk_data')
]
Per modificare il percorso, semplicemente appen d per l'elenco dei possibili percorsi:
import nltk
nltk.data.path.append("/home/yourusername/whateverpath/")
o in Windows:
import nltk
nltk.data.path.append("C:\somewhere\farfar\away\path")
Quale directory dovrebbe contenere questo file? – hlin117
è nel codice sorgente originale di NLTK. Vai alla directory in cui salverai il codice sorgente, quindi vai a 'nltk/nltk/data' – alvas
dai un'occhiata a' magically_find_nltk_data() 'da http://stackoverflow.com/questions/36382937/nltk-doesnt-add-nltk -data-to-search-path/36383314 # 36383314 – alvas
Per coloro che utilizzano uwsgi:
avevo problemi perché volevo un'applicazione uwsgi (in esecuzione come un diverso utente di me) per avere accesso ai dati nltk che avevo precedentemente scaricato. Che cosa ha funzionato per me era aggiunta la seguente riga al myapp_uwsgi.ini
:
env = NLTK_DATA=/home/myuser/nltk_data/
Questo imposta la variabile d'ambiente NLTK_DATA
, come suggerito da @schemacs.
Potrebbe essere necessario riavviare il processo uwsgi dopo aver apportato questa modifica.
- 1. cancellare la directory dei dati Zookeeper
- 2. Come configurare la directory di output dei file dei font da font-awesome-webpack nel webpack?
- 3. con dati dal codice
- 4. Configurare la directory di lavoro del foglio di lavoro Scala
- 5. Dove si trova la directory dei dati in Redis?
- 6. Come accedere alla directory dei dati JBoss dall'interno di un'applicazione?
- 7. Come specificare la directory include per configurare lo script
- 8. Cambia la directory di output del codice generato nel gradle
- 9. Come ottenere la directory dei video utente?
- 10. Restituisce l'elenco dei file nella directory dal plugin di Jekyll?
- 11. Orange vs NLTK per la classificazione dei contenuti in Python
- 12. NLTK - Scarica tutti i dati NLTK eccezione corpara dalla riga di comando senza Downloader UI
- 13. Eliminazione automatica dei dati dal tavolo DynamoDb
- 14. NLTK Chunking e cammino dell'albero dei risultati
- 15. Dati NLTK non aggiornati - Python 3.4
- 16. CMake manca la directory dei moduli
- 17. nltk: Come impedire l'insorgenza di nomi propri
- 18. Modifica la directory di output dei file .css
- 19. Come interrompere UITableView dal caricamento fino al caricamento dei dati?
- 20. Come funziona la protezione dei dati iOS
- 21. Come installare la directory host scrivibile dal contenitore?
- 22. Come abilitare la registrazione dei messaggi WCF dal codice invece del file di configurazione dell'applicazione
- 23. Come ottenere la directory dei file attualmente eseguita in CasperJS
- 24. Come passare i dati dal codice JavaScript all'elemento personalizzato Polymer?
- 25. Come impostare la dimensione della chiave per RSAProtectedConfigurationProvider dal codice
- 26. Eclipse - Escludere la directory root dal repository git?
- 27. Lettura dei dati dal file binario tick di Dukascopy
- 28. Come configurare grugnito-babele di transpile un'intera directory
- 29. Esclusione directory dal reindirizzamento regex
- 30. Funzione efficiente per la creazione di dati JSON dalla struttura della directory dei file?
Correlato: [Modificare la directory del percorso nltk.download() da default ~/ntlk_data] (https://stackoverflow.com/questions/44857382/change-nltk-download-path-directory-from-default-ntlk-data) – smci