2011-10-31 19 views

risposta

4

MALLET è molto più facile da usare e fa la maggior parte del suo lavoro nvisibly. Non è necessario convertire il formato di alcunché, basta dargli dei file di testo e ti restituisce i risultati.

Weka richiede la conversione del testo in un formato particolare (lo script di Weka per farlo è così lento e inefficiente che consiglio di scriverne uno tuo).

Il problema con MALLET è che l'allenamento utilizza GB di memoria e può richiedere ore, se si dispone di set di allenamento di grandi dimensioni.

Weka ha più documentazione, ma la maggior parte non ha senso. MALLET ha pochissima documentazione ma è molto semplice da usare.

A dire il vero, dopo aver provato entrambi, ho optato per la scrittura del mio classificatore.

+1

Ack - Ho scritto le mie classificazioni prima (a scuola), e ora che sono fuori in libertà usando gli strumenti di altre persone (basati su GUI !!), non tornerò mai più indietro. La tua esperienza deve essere stata abbastanza terribile con questi strumenti per tornare indietro e tirare il tuo. –

3

Mi sto davvero godendo Weka vs Mallet. Forse non ne so ancora abbastanza, ma fare l'apprendimento automatico con una GUI è fantastico. Puoi modificare i parametri ed eseguire diversi esperimenti (mantenendo anche i risultati degli esperimenti passati davanti a te) molto facilmente. Sono nuovo di Weka, quindi questo è FWIW.

Per quanto è più semplice da addestrare, trovo Weka più semplice. Non so che tipo di controllo si possa avere sul proprio spazio feature semplicemente indicando Mallet su un testo (forse è abbastanza buono), ma la mia esperienza con Mallet è stata paragonabile a Weka ... scrivere script per ottenere l'input nel formato corretto, con l'avvertenza che ho dovuto fare più passaggi per utilizzare una sorta di versione serializzata dei dati in Mallet.

Per quanto riguarda le altre domande, non posso davvero rispondere loro in questo momento, ma spero che questa risposta non venga downvoted perché le informazioni sono buone là fuori, comunque.

Problemi correlati