Sto utilizzando Spark versione 1.3.0 e utilizzo di dataframes con SparkSQL in Scala. Nella versione 1.2.0 c'era un metodo chiamato "saveAsText". Nella versione 1.3.0 usando i dataframes c'è solo un metodo "salva". L'uscita predefinita è parquet.
Come posso specificare che l'output debba essere TESTO usando il metodo di salvataggio?Salvataggio come testo in Spark 1.30 utilizzando Dataframes in Scala
// sc is an existing SparkContext.
val sqlContext = new org.apache.spark.sql.SQLContext(sc)
// this is used to implicitly convert an RDD to a DataFrame.
import sqlContext.implicits._
// Define the schema using a case class.
// Note: Case classes in Scala 2.10 can support only up to 22 fields. To work around this limit,
// you can use custom classes that implement the Product interface.
case class Person(name: String, age: Int)
// Create an RDD of Person objects and register it as a table.
val people = sc.textFile("examples/src/main/resources/people.txt").map(_.split(",")).map(p => Person(p(0), p(1).trim.toInt)).toDF()
people.registerTempTable("people")
// SQL statements can be run by using the sql methods provided by sqlContext.
val teenagers = sqlContext.sql("SELECT name FROM people WHERE age >= 13 AND age <= 19")
teenagers.save("/user/me/out")
TVM, ma c'è qualche possibilità di salvare come testo utilizzando il metodo save. Non sono stato in grado di trovare molta documentazione. L'impostazione predefinita è di salvare come parquet. –