Ho alcuni problemi che potrebbero applicarsi bene al modello di ridimensionamento della mappa. Mi piacerebbe sperimentare con la loro implementazione, ma in questa fase non voglio correre il problema di installare un sistema pesante come Hadoop o Disco.Esiste un semplice framework per la riduzione delle mappe Python che utilizza il normale filesystem?
Esiste un framework Python leggero per map-reduce che utilizza il normale file system per l'input, i file temporanei e l'output?
Ok, sto trovando grandi cose googling "python map-reduce", quindi un punto per l'ovvietà. Dai un'occhiata a [Parallel MapReduce in Python] (http://mikecvet.wordpress.com/2010/07/02/parallel-mapreduce-in-python/) che usa le funzioni integrate 'map' e' reduce' con il multiprocessing piscine. Suppongo che, dal momento che la mappa e la riduzione sono già presenti, è un altro punto per ovvietà! – tdelaney
potresti trovare utile pydoop. http://pydoop.sourceforge.net/docs/index.html – Tariq
@tdelaney, so che ci sono molti risultati. La ragione per cui ho chiesto qui è di vedere quali persone reali hanno usato con risultati decenti. SO non è solo per cose che non sono googleable. – Reid