Stiamo facendo funzionare BigQuery per circa 4 mesi e abbiamo alcune interessanti osservazioni e domande riguardanti pricings:Variazioni dei prezzi di Bigquery?
- modello dei prezzi è abbastanza inspiegabile ha bisogno di spiegazioni per unisce, sindacati e così via
- Se corro unirsi sul tavolino i miei dati elaborati aumenteranno per ogni copia di tavolino che è stata moltiplicata all'interno di un motore bigquery?
- Se riutilizza la stessa sottoquery all'interno di una query, questa è una nuova elaborazione dati indipendentemente dal fatto che si tratti della stessa sottoquery? Questo può essere ottimizzato in qualche modo? La cache di bigquery non è data?
- È presente una dimensione minima arrotondata per l'elaborazione dei dati? Le nostre osservazioni pensano che sia 4 MB, è corretto?
- In Google Console c'è un problema con le posizioni geografiche, si dice che la maggior parte delle query proviene da CA, che non è corretto poiché la mia azienda è in Europa e tutto lo sviluppo è fatto lì. Ho controllato tutti gli indirizzi IP e non c'è l'IP di CA. È possibile ottenere report più dettagliati?
- Riguardo a 5, vorremmo ottenere una cronologia delle query e dei prezzi per ognuno. Come possiamo farlo? Il nostro software deve fare questo o?
- Riguardo a 3) Ho questo enorme problema con l'elaborazione dei dati (questo è il motivo per cui ho fatto tutte le domande). Il mio intero set di dati è grande circa 150mb e tuttavia la mia dimensione DP per query è 3 volte più grande? Se bigquery legge tutti i miei dati, non raggiungerebbe le dimensioni mostrate sui dati elaborati. Quando sono tutti i casi in cui i dati saranno riletti e quindi si verificherà una nuova DP? E come lo conti?
Grazie.
saluti, Tomislav
C'è qualche ragione particolare per cui questo è stato downvoted? –
Ho upvoted quindi è su 0 –