2013-10-10 11 views
7

Sono confuso dai diversi prodotti offerti da Talend.Differenza tra Talend Open Studio per Data Integration e Talend Open Studio per Big Data

Sembra che Talend Open Studio for Data Integration e Talend Open Studio for Big Data siano lo stesso prodotto ma solo con diversi componenti installati di default. È giusto? Se utilizzo Talend Open Studio per l'integrazione dei dati e scarica i componenti necessari da Talend Exchange (ad esempio per Google BigQuery), si tratta effettivamente dello stesso prodotto?

risposta

8

A parte i diversi connettori, si differenziano per un punto chiave, la base di codice che generano.

Talend Open Studio per l'integrazione dei dati genera codice Java mentre Talend Open Studio per Big Data può generare codice di riduzione della mappa e codice Java.

Vedere here per un esempio dell'offerta Big Data di Talend che mostra come generare lavori di riduzione del codice per la mappa.

+1

+1; un'altra grande differenza, tuttavia, è la mancanza di repository di metadati in TOS-BD. Questo perché quest'ultimo è rilasciato con Apache Common License, mentre Talend Open Studio per Data Integration è rilasciato sotto licenza LGPL. Il repository di metadati trovato in TOS per DI era incompatibile con Apache License e quindi è stato rimosso a partire dalla versione 4.1 –

1

Non è solo sui componenti:

Da: http://www.talend.com/products/data-integration

Caratteristiche: Job Designer, progettista di lavoro, 450 + Connettori, versioning

Da: http://www.talend.com/products/big-data

Caratteristiche: Job Designer, Componenti per HDFS, HBa SE, HCatalog, Hive, Maiale, Sqoop, Hadoop Job Scheduler, Supporto NoSQL

Non sono sicuro, ma non credo che i componenti ufficiali sono disponibili sul sito web di scambio di Talend. Lì troverai solo componenti forniti dalla community.

+0

No, generano il codice in un modo diverso. TOS non può generare codice M/R, mentre BD potrebbe. –

0

In Talend Open Studio per l'integrazione dei dati è possibile creare un lavoro standard (significa che è possibile utilizzare direttamente il componente DI e nella parte posteriore verrà generato il codice java).

Ma Talend Open Studio per Big dati da Lei opzione per creare la mappa/ridurre lavoro (mezzi nella mappa retro/ridurre il codice [mappa realtà java/ridurre] il codice verrà generato). Nella mappa/riduci lavoro, tutti i componenti eseguono entrambe le mappe e riducono l'attività nel server Talend. Come nel componente tmap, è possibile visualizzare la mappa e ridurre la barra delle attività sotto il componente quando viene eseguita.

0

Talend non fa differenza fra connectors.Spark è la differentator tra la TOS e la versione con licenza.

Open Studio non supporta la scintilla sia batch che in tempo reale.

Problemi correlati