2009-04-02 13 views
11

Una rapida ricerca su Google rivela che esiste un buon numero di classificatori bayesiani implementati come moduli Python. Se voglio una funzionalità di alto livello, avvolta, simile a dbacl, quale di questi moduli è giusto per me?Quali moduli di classificazione del testo bayesiano Python sono simili a dbacl?

Formazione

% dbacl -l one sample1.txt 
% dbacl -l two sample2.txt 

Classificazione

% dbacl -c one -c two sample3.txt -v 
one 

risposta

9

penso troverete il utile nltk. Nello specifico, lo classify module.

+0

Non credo che NLTK includa un algoritmo di selezione delle caratteristiche, ma ha strumenti di frequenza dist ecc. In modo da poter scrivere il proprio e alimentarlo al classificatore di propria scelta. – apexdodge

0

Se si sta tentando di rilevare la lingua this funziona bene anche con testi piuttosto brevi.

L'api è molto vicino al tuo ma Non so se si chiama classificatore bayesiano.

1

Notando questa domanda. Ho messo la mia implementazione di un classificatore bayesiano naive su gitHub.

Here it is - beiyesi

ha ancora bisogno di un sacco di miglioramento. Qualsiasi aiuto è apprezzato.

-1

Prova Mallet e LingPipe. forniscono più modelli per il classificatore.

+0

Queste sono librerie Java, non Python. – tripleee

Problemi correlati