In uno dei nostri progetti utilizziamo Kafka con AVRO per trasferire i dati tra le applicazioni. I dati vengono aggiunti a un oggetto AVRO e l'oggetto è codificato in binario per scrivere su Kafka. Usiamo la codifica binaria in quanto viene generalmente indicata come una rappresentazione minima rispetto ad altri formati.La codifica binaria di AVRO comprime i dati?
I dati sono in genere una stringa JSON e quando viene salvata in un file, utilizza fino a 10 Mb di disco. Tuttavia, quando il file è compresso (.zip), utilizza solo pochi KB. Siamo preoccupati di memorizzare tali dati in Kafka, quindi proviamo a comprimerli prima di scrivere su un argomento di Kafka.
Quando viene misurata la lunghezza del messaggio codificato in binario (vale a dire la lunghezza della matrice di byte), è proporzionale alla lunghezza della stringa di dati. Quindi presumo che la codifica binaria non stia riducendo alcuna dimensione.
Qualcuno potrebbe dirmi se la codifica binaria comprime i dati? In caso contrario, come posso applicare la compressione?
Grazie!