2010-04-29 16 views
5

Sto cercando di utilizzare Mahout in un'applicazione in esecuzione su Windows. Voglio costruire cluster da un indice di lucene usando k-means.Come usare Mahout in un ambiente Windows?

Non appena devo creare file di sequenza (creando vettori da un indice di lucene), ottengo un'eccezione Hadoop, poiché Hadoop effettua chiamate da linea di comando a programmi sconosciuti in un ambiente Windows (ad esempio chmod). L'esecuzione in Cygwin non è un'opzione, dal momento che voglio essere in grado di eseguire l'app da Eclipse.

Quindi la mia domanda è

  • c'è un modo per evitare di dover creare file di sequenza per recuperare i miei vettori da un indice lucene?
  • oppure esiste un modo per creare file di sequenza in un ambiente Windows?
  • risposta

    4

    L'unico modo per eseguire Hadoop su un ambiente Windows è installare Cygwin. Per ulteriori informazioni, si veda questo post del blog:

    http://hayesdavis.net/2008/06/14/running-hadoop-on-windows/

    Cygwin fornirà tutte le utilità della riga di comando (come chmod), che si basa su Hadoop. Puoi comunque eseguire i tuoi lavori Hadoop da Eclipse, se lo desideri.

    +0

    In secondo piano, questa è più una domanda su Hadoop e non è possibile eseguire Hadoop su Windows. –

    +0

    HDInsight è un'implementazione Hadoop per Windows Azure. Se si desidera utilizzarlo sul computer locale e non nel cloud, provare a utilizzare l'emulatore HDInsight, che è possibile installare con Web Platform Installer. – user888734

    +0

    Si consiglia di aggiornare la risposta, poiché è ora possibile utilizzare Hadop con Windows (https://wiki.apache.org/hadoop/Hadoop2OnWindows). Risponderei volentieri, ma sto ancora cercando un modo per usare Mahout :) – fxm

    0

    È possibile utilizzare una macchina virtuale per eseguire l'ambiente Hadoop. Per quanto mi riguarda, la soluzione migliore è usare il progetto http://hortonworks.com/. Tutto funziona bene.

    Problemi correlati