2009-07-27 13 views
7

Sto costruendo alcune AMI da una delle basi su EC2. Uno dei tipi di istanza sta eseguendo Tomcat e contiene molti indici Lucene; un'altra istanza eseguirà MySQL e con essa corrisponderanno requisiti di dati di grandi dimensioni.Qual è il punto di archiviazione dell'istanza su EC2?

Sto provando a definire il modo migliore per includere quelli nelle AMI che sto creando. Se monto /mnt/lucene e /mnt/mysql, quelli non vengono inclusi nell'AMI generato. Quindi mi sembra che il modo migliore per gestirli sia avere un EBS per ognuno, scattare istantanee e creare istanze con EBS basato sulle istantanee più recenti. È il modo migliore di procedere?

Qual è il punto di memoria dell'istanza? Sembra che funzionerà solo come deposito temporaneo - cosa mi manca? Presumibilmente c'è un motivo per cui Amazon offre fino a 800 GB di spazio di archiviazione su grandi istanze standard ...

risposta

4

L'archiviazione di istanze è più veloce di EBS. Non parli di cosa farai con le tue istanze, ma per alcune applicazioni la velocità potrebbe essere più importante della durata. Per un'applicazione che esegue principalmente il data mining su un database di grandi dimensioni, potrebbe essere utile disporre di alcune centinaia di gigabyte di memoria locale veloce per ospitare il DB. I nodi di lavoro in un cluster MapReduce potrebbero anche essere ottimi candidati per la memorizzazione dell'istanza, a seconda del tipo di lavoro.

+0

Questo è quello che pensavo. Potrei fare con la ricerca di alcuni numeri per quanto la memoria dell'istanza varia rispetto all'EBS però. Ho eseguito bonnie ++ su storage di istanza e non mi ha fatto saltare le calze. – jabley

+0

Suppongo che la domanda sia: quanto ha fatto (non) a spaccare le calze rispetto allo stesso punto di riferimento sulle ebs :) Ho la sensazione che questa sia una di quelle situazioni in cui la scelta giusta differirà per tutti, e tu Dovrò capire quale mix di opzioni disponibili funzioni meglio per il tuo particolare problema. La bellezza della situazione è che se un nodo impiega due ore per sfogliare i tuoi dati, puoi sempre affittare due nodi e farlo in 1 ora! (supponendo che tu sia benedetto con attività parallelizzabili) –

+0

Mi chiedo come si regge lo storage istanza rispetto a un RAID di piccoli volumi EBS. Forse, una volta che si utilizzano i RAID, non c'è più motivo di utilizzare la memoria di istanza più (almeno per l'accesso ai DB di ricerca). –

2

Un altro punto di archiviazione dell'istanza è che è indipendente. Ci sono state molte interruzioni di EBS (google ad esempio "sito: aws.amazon.com interruzione di ebs"). Se l'istanza viene eseguita, ha la memoria di istanza disponibile. Ovviamente se si fa affidamento sull'archiviazione di istanze, è necessario eseguire più istanze (su più zone di disponibilità) e tollerare le singole istanze di errore.

0

So che questo è in ritardo al gioco, ma un altro po 'factoid a ...

stoccaggio EBS rende estremamente facile creare AMI di da, mentre, archiviazione a istanza-store based richiede che la creazione di AMI di essere fatto localmente sulla macchina stessa con un sacco di lavoro per preparare, archiviare e registrare l'AMI.