Sto usando la scintilla e il mongo. Sono in grado di connettermi a mongo usando il seguente codice:Come eseguire una query su mongo usando la scintilla?
val sc = new SparkContext("local", "Hello from scala")
val config = new Configuration()
config.set("mongo.input.uri", "mongodb://127.0.0.1:27017/dbName.collectionName")
val mongoRDD = sc.newAPIHadoopRDD(config, classOf[com.mongodb.hadoop.MongoInputFormat], classOf[Object], classOf[BSONObject])
sopra il codice mi dà tutti i documenti dalla collezione.
Ora voglio applicare alcune condizioni sulla query.
Per questo ho usato
config.set("mongo.input.query","{customerId: 'some mongo id'}")
Questo ha avuto una sola condizione alla volta. Voglio aggiungere una condizione se 'uso'> 30
1) Come posso aggiungere più condizioni alla query mongo (incluso maggiore di e minore di) usando spark e mongo ??
Anche io voglio scorrere su ogni documento di risultato di query usando scala ??
2) Come faccio a scorrere il risultato usando scala ??
qualche lato-bandiera qui: il formato di Hadoop per Mongo ha problema di gestione delle risorse che mantiene le connessioni aperte. È stata una combinazione esplosiva quando l'abbiamo mescolata con Spark. * Evita * – maasg
@maasg C'è qualche altra opzione per la connessione di mongo con scintilla ?? – Vishwas