Sono nuovo a scintillare e giocavo con Pyspark.sql. Secondo la documentazione pyspark.sql here, si può andare su come impostare il dataframe Spark e lo schema come questo:Sintassi durante l'impostazione dello schema per Pyspark.sql utilizzando StructType
rdd = sc.textFile('./some csv_to_play_around.csv'
schema = StructType([StructField('Name', StringType(), True),
StructField('DateTime', TimestampType(), True)
StructField('Age', IntegerType(), True)])
# create dataframe
df3 = sqlContext.createDataFrame(rdd, schema)
La mia domanda è, che cosa fa il True
riposare per nella lista schema
di cui sopra? Non riesco a trovarlo nella documentazione. Grazie in anticipo