So che è etichettato Scala, ma solo per aggiungere dalla parte di Python nel caso in cui qualcuno è curioso. Creare la RDD e salvare come è
rdd_of_tuples = sc.parallelize([('one',1),('two',2)])
rdd_of_tuples.saveAsTextFile('/user/cloudera/rdd_of_tuples')
Ciò farà risparmiare le righe come questo come si parla
('one', 1)
Ma se lo fate il seguente dovrebbe funzionare
rdd_of_text = rdd_of_tuples.map(lambda (x,y): x + ',' + str(y)).saveAsTextFile('/user/cloudera/rdd_of_text')
e si dovrebbe ottenere
one,1
Si noti che in questo caso particolare è necessario essere consapevoli dei tipi per concatenare (controllare la str (y)), altrimenti si otterrebbe la seguente eccezione
TypeError: cannot concatenate 'str' and 'int' objects
@Ashish se si dispone di un commento, si prega di utilizzare la casella di commento e non modificare la risposta! Anche il codice che hai suggerito nella modifica non è correlato alla domanda qui. Il tuo codice funziona con un RDD [Row] che non è il caso qui. – eliasah