Qual è la sintassi corretta per il filtro su più colonne nell'API Scala? Se voglio fare qualcosa di simile:Spark SQL campi multipli
dataFrame.filter($"col01" === "something" && $"col02" === "something else")
o
dataFrame.filter($"col01" === "something" || $"col02" === "something else")
EDIT:
Questo è ciò che il mio codice originale assomiglia. Tutto arriva come una stringa.
df.select($"userID" as "user", $"itemID" as "item", $"quantity" cast("int"), $"price" cast("float"), $"discount" cast ("float"), sqlf.substring($"datetime", 0, 10) as "date", $"group")
.filter($"item" !== "" && $"group" !== "-1")
Sembra OK. Hai problemi? – zero323
Se non funziona, potresti semplicemente perdere 'import sqlContext.implicits._', dove' sqlContext' è un'istanza di 'SQLContext' o' HiveContext'. –
Stavo ottenendo "value && non è un membro di String". La soluzione è racchiudere ciascuna affermazione in una parentesi. – gstvolvr