Come posso spedire i moduli compilati C (ad esempio, python-Levenshtein) a ciascun nodo in un cluster di scintille?spedizione di moduli python in pyspark ad altri nodi?
so che posso spedire i file python in scintilla utilizzando uno script python standalone (esempio di codice sottostante):
from pyspark import SparkContext
sc = SparkContext("local", "App Name", pyFiles=['MyFile.py', 'MyOtherFile.py'])
ma in situazioni in cui non c'è '.py' come faccio a spedire il modulo?
Ha funzionato! Sono stato in grado di creare il file egg per il modulo usando il comando precedente, e quindi il processo è stato semplice come aggiungere il file egg nel parametro pyFiles. Roba forte! – mgoldwasser
Qualche suggerimento per far installare a PySpark le dipendenze di .egg? Simile a http://stackoverflow.com/questions/32119225/databricks-spark-egg-dependencies-non-installato-automaticamente – ramhiser
se il mio file * .egg dipende da altre librerie di terze parti, funzionerà anche questo? – guilhermecgs