Sto cercando di salvare migliaia di modelli prodotti da ML Pipeline. Come indicato nella risposta here, i modelli possono essere salvati come segue:Come salvare i modelli da ML Pipeline a S3 o HDFS?
import java.io._
def saveModel(name: String, model: PipelineModel) = {
val oos = new ObjectOutputStream(new FileOutputStream(s"/some/path/$name"))
oos.writeObject(model)
oos.close
}
schools.zip(bySchoolArrayModels).foreach{
case (name, model) => saveModel(name, Model)
}
Ho provato con s3://some/path/$name
e /user/hadoop/some/path/$name
come vorrei i modelli per essere salvati su Amazon S3 alla fine ma entrambi falliscono con i messaggi che indica la percorso non può essere trovato.
Come salvare i modelli su Amazon S3?
funziona, ma quando il modello ricarica da HDFS, alcune informazioni sarà perso, come genitore, ecc ... –