Vorrei modificare i valori della cella di una colonna di dataframe (Age) dove attualmente è vuota e lo farei solo se un'altra colonna (Sopravvissuto) ha il valore 0 per la riga corrispondente dove è vuoto per Age. Se è 1 nella colonna Sopravvissuto ma vuoto nella colonna Età, lo manterrò come null.Pyspark: condizioni multiple in quando clausola
Ho provato a utilizzare l'operatore &&
ma non ha funzionato. Ecco il mio codice:
tdata.withColumn("Age", when((tdata.Age == "" && tdata.Survived == "0"), mean_age_0).otherwise(tdata.Age)).show()
Qualche suggerimento su come gestirlo? Grazie.
messaggio di errore:
SyntaxError: invalid syntax
File "<ipython-input-33-3e691784411c>", line 1
tdata.withColumn("Age", when((tdata.Age == "" && tdata.Survived == "0"), mean_age_0).otherwise(tdata.Age)).show()
^