8

Desidero che qualcuno di Google fornisca alcune linee guida sulle garanzie di durata e disponibilità fornite dal servizio Cloud Bigtable.Google Cloud Bigtable Durata/Disponibilità Garanzie

Qui è la mia comprensione finora:

  • Il fatto che il cluster minimo richiede 3 nodi suggerisce che, almeno all'interno di una zona, i dati sono altamente durevole e replicato a 3 nodi.

  • Tuttavia, this answer da un Googler afferma che "Cloud BigTable non replica dei dati" - contraddicendo direttamente la citazione sul Cloud Bigtable homepage quale afferma che "è costruito con una strategia di storage replicato". Quindi qual è? È replicato o no? E se sì, quante copie vengono conservate?

  • Il fatto che i cluster possano essere impostati solo all'interno di una particolare zona suggerisce che la disponibilità di un cluster è legata direttamente alla disponibilità di tale zona. Quindi, se voglio disporre di uno storage di dati basato su Bigtable ad alta disponibilità, sarebbe la migliore procedura per impostare cluster indipendenti su più zone e gestire da solo la sincronizzazione delle scritture tra i cluster?

Non ci sono informazioni sul fatto che i cluster Bigtable attraverso le zone siano indipendenti o meno. Se dovessi creare cluster in più zone e una zona non funzionasse, potremmo aspettarci che i cluster in altre zone continuino a funzionare? O c'è qualche singolo punto di errore sottostante che potrebbe avere un impatto sui cluster anche attraverso le zone?

Rispetto all'archivio dati di App Engine che è molto specifico su questi dettagli, la documentazione di Cloud Bigtable è piuttosto carente - o, almeno, non sono riuscito a trovare una pagina che entra nel dettaglio su questi aspetti.

I documenti Cloud Bigtable sono altrettanto vaghi su altri aspetti, ad es. in merito ai limiti di dimensione per i valori, the documentation afferma che i singoli valori devono rimanere al di sotto di "~ 10 MB per cella". Cosa diavolo significa "~ 10 MB" ?! Posso eseguire un hardcode con un limite di esattamente 10 MB e aspettarci che funzioni sempre o cambierà di giorno in giorno in base a fattori sconosciuti?

In ogni caso, mi scuso se mi sembro agitato. Vorrei sinceramente usare il servizio Bigtable. Ma io, come presumibilmente molti altri, ho bisogno di capire gli aspetti di durabilità/disponibilità prima di poterlo investire. Grazie.

risposta

9

Sulla replica: La risposta si fa riferimento si riferisce alla replica dei dati tra Bigtable cluster, che non è supportato in questo momento. (Ad esempio, un Bigtable Cluster negli Stati Uniti che replica le sue scritture in un secondo Cluster in Europa)

Questo concetto è separato dalla replica dei dati all'interno di un cluster Bigtable, che è analogo alla replica in HDFS, che è qualcosa che il prodotto lo fa assolutamente oggi.

Disponibilità: Sì, la disponibilità di un Bigtable Cluster è legata alla disponibilità di una Google Cloud Zone.

Indipendenza: Sì, i cluster Cloudtable sono indipendenti tra le zone. Un'interruzione in una zona non dovrebbe influire sulla disponibilità di altre zone.

In base ai dati per cella: Non rifiutiamo scrive> 10Mb per cella, abbiamo questa serie come linea guida per ottenere prestazioni ottimali.