Sto lottando per capire cosa fanno esattamente Arvo, Kryo e Parquet nel contesto di Spark. Sono tutti legati alla serializzazione, ma li ho visti usati insieme in modo che non possano fare la stessa cosa.Spark con Arvo, Kryo e Parquet
Parquet descrive se stesso come un formato di archiviazione colonnare e io lo ottengo, ma quando sto salvando un file parquet, Arvo o Kryo possono avere qualcosa a che fare con esso? Oppure sono rilevanti solo durante il lavoro spark, vale a dire. per l'invio di oggetti sulla rete durante uno shuffle o lo spargimento sul disco? Come differiscono Arvo e Kryo e cosa succede quando li usi insieme?
Quindi se Parquet è per l'archiviazione permanente efficiente e Kryo è per la memorizzazione non permanente veloce, allora cosa fa Arvo? E quando lo userei? –