So che si sta lavorando per migliorare la funzione di Join su Bigquery, non per irritare qui, ma sarà difficile analizzare set di dati 'Terabyte' come 'pubblicizzati' se Joins non può essere usato correttamente .Join su Google Bigquery
OK, torna al problema, ho due tavoli uno è di 600 Meg e l'altro è di 50Meg, ho provato a fare un join e ho ricevuto un errore sulla tabella più piccola deve essere lasciato. Ho fatto qualche ricerca e ho scoperto che Bigquery
considera entrambe le tabelle grandi se sono superiori a 7 MB?
Quindi, in base a qualche consiglio che ho trovato online, ho selezionato il set di dati in questione della tabella più piccola e l'ho salvato in una nuova tabella, il nuovo set di dati è 12MB e 600K righe su due colonne. Poi ho provato di nuovo la mia domanda, ma ancora sto ottenendo lo stesso errore:
Query Failed : Error: Large table cdrs_test.geoIP_Left must appear as the leftmost table in a join query
geoIP_Left è di 12 mega, l'altra tabella è 600Megs ..
questo può essere risolto in un modo o sto sballato? Se è così, qualcuno sa di qualsiasi altro servizio che posso utilizzare per analizzare grandi serie di dati che supportano i join?
MODIFICA: Questa è la query effettiva;
SELECT COUNT(results.cc_card) AS count,
sum(results.sessiontime) AS time,
geoIP_Left.place AS place
FROM cdrs_test.cdrs_2010_5 AS results
JOIN cdrs_test.geoIP_Left AS geoIP_table
ON results.cc_card = geoIP_table.vcard
WHERE results.sessiontime > 0 AND results.countryName Contains 'India'
GROUP BY place;
Potresti mostrare la tua domanda reale? –
Sicuro ..qui vai – user1838066
SELECT COUNT (results.cc_card) AS count, sum (results.sessiontime) AS time, geoIP_Left.place AS place FROM cdrs_test.cdrs_2010_5 AS risultati JOIN cdrs_test.geoIP_Left AS geoIP_table ON results.cc_card = geoIP_table .vcard WHERE results.sessiontime> 0 AND results.countryName Contiene il luogo GROUP BY "India"; – user1838066