Ho bisogno del frame di dati risultante nella riga sottostante, per avere un nome alias "maxDiff" per la colonna massima ('diff') dopo groupBy. Tuttavia, la riga sottostante non cambia ma non genera errori.Alias di colonne dopo il groupby in pyspark
grpdf = joined_df.groupBy(temp1.datestamp).max('diff').alias("maxDiff")
si .. funziona ... tranne che func. non è richiesto – mhn
non lo è se hai già importato 'pyspark.sql.functions' nello script – Nhor