Sto provando il flume per qualcosa di molto semplice, in cui vorrei spingere il contenuto dei miei file di registro su S3. Sono stato in grado di creare un agente flume che avrebbe letto il contenuto da un file di log di accesso Apache e utilizzato un sink di logger. Ora sto cercando di trovare una soluzione in cui posso sostituire il sink del logger con un "sink S3". (So che questo non esiste per impostazione predefinita)Usa flume per lo streaming di dati su S3
Stavo cercando alcune indicazioni per indirizzarmi nel percorso corretto. Di seguito è riportato il file delle proprietà di test che sto utilizzando al momento.
a1.sources=src1
a1.sinks=sink1
a1.channels=ch1
#source configuration
a1.sources.src1.type=exec
a1.sources.src1.command=tail -f /var/log/apache2/access.log
#sink configuration
a1.sinks.sink1.type=logger
#channel configuration
a1.channels.ch1.type=memory
a1.channels.ch1.capacity=1000
a1.channels.ch1.transactionCapacity=100
#links
a1.sources.src1.channels=ch1
a1.sinks.sink1.channel=ch1
cosa se non avete accesso ai HDFS? – user99999991