Ho visto una soluzione qui ma quando l'ho provata non funziona per me.Sostituisci valori null in Spark DataFrame
Per prima cosa ho importare un file cars.csv:
val df = sqlContext.read
.format("com.databricks.spark.csv")
.option("header", "true")
.load("/usr/local/spark/cars.csv")
che si presenta come il seguente:
+----+-----+-----+--------------------+-----+
|year| make|model| comment|blank|
+----+-----+-----+--------------------+-----+
|2012|Tesla| S| No comment| |
|1997| Ford| E350|Go get one now th...| |
|2015|Chevy| Volt| null| null|
Poi faccio questo:
df.na.fill("e",Seq("blank"))
ma i valori nulli didn cambiare.
Qualcuno può aiutarmi?
La dichiarazione 'df.na.fill ("E", Seq ("bianco"))' restituisce un nuovo '' DataFrame' così df' sarà non essere modificato. Lo stai assegnando a un nuovo 'DataFrame'? –
Grazie! Capito! –