6
Avere due colonne:matrice pyspark con variabili dummy
ID Text
1 a
2 b
3 c
Come posso in grado di creare matrici con variabili dummy come questo:
ID a b c
1 1 0 0
2 0 1 0
3 0 0 1
utilizzando la libreria pyspark e le sue caratteristiche?
Traceback (chiamata più recente scorso): file "", linea 2, in NameError: nome di 'F' non è definito –
Qual è F qui? –
dall'importazione di pyspark.sql funziona come F –