Domanda principale: Come combinare diversi randomPerest in python e scikit-learn?generazione parallela di foreste casuali utilizzando scikit-learn
Attualmente sto usando il pacchetto randomForest in R per generare oggetti randomforest utilizzando la riduzione della mappa elastica. Questo è per affrontare un problema di classificazione.
Poiché i dati di input sono troppo grandi per adattarsi alla memoria su una macchina, campionamento dei dati in serie di dati più piccoli e generazione di oggetti foresta casuali contenenti un insieme più piccolo di alberi. Quindi combinare insieme i diversi alberi utilizzando una funzione combinata modificata per creare un nuovo oggetto foresta casuale. Questo oggetto foresta casuale contiene l'importanza della funzione e il set finale di alberi. Questo non include gli errori oob o voti degli alberi.
Mentre questo funziona bene in R, voglio fare la stessa cosa in Python usando scikit-learn. Posso creare diversi oggetti foresta casuali, ma non ho modo di combinarli insieme per formare un nuovo oggetto. Qualcuno può indicarmi una funzione in grado di combinare le foreste? È possibile usare scikit-learn?
Ecco il collegamento a una domanda su come questo processo in R: Combining random forests built with different training sets in R.
Modifica: l'oggetto foresta casuale risultante deve contenere gli alberi che possono essere utilizzati per la previsione e anche l'importanza della funzione.
Qualsiasi aiuto sarebbe apprezzato.
Se l'obiettivo è la previsione, allora non v'è alcuna necessità combinare diversi modelli. È possibile effettuare prediсtion da modelli separati e quindi combinare solo i risultati. – DrDom
D'accordo con @DrDom, ci sono molti modi per creare modelli. I dettagli su come vuoi farlo sono piuttosto importanti. – David
@DrDom Sono d'accordo che se si trattasse solo di previsioni, posso combinare i risultati. Ma mi interessano non solo le previsioni ma anche l'importanza variabile delle caratteristiche. – reddy