2014-06-05 11 views
5

Sto cercando di eseguire gridsearch con regressione logistica, e ottenereGridSearchCV e regressione logistica sollevare ValueError: Non può gestire mix di continuo e binario

ValueError: Can't handle mix of continuous and binary 

ho rintracciato questo errore metrics.accuracy_score. Apparentemente la previsione non va così bene, e mentre y_true è continua (come il resto dei dati), y_pred è tutti zeri ed è quindi classificato come binario.

  • C'è un modo per evitare questo errore?
  • La natura di y_pred significa che non ho alcuna attività commerciale con la regressione logistica o potrebbe essere un risultato dei parametri utilizzati?

Grazie

risposta

3

Un po 'confusamente di regressione logistica è in realtà un algoritmo di classificazione (vedi http://scikit-learn.org/stable/modules/linear_model.html#logistic-regression). Di conseguenza, i dati di destinazione ("y_true") che si alimentano dovrebbero essere binari. Se stai effettivamente cercando di risolvere un problema di regressione dovresti scegliere un algoritmo diverso, ad es. LinearRegression, SVR, RandomForestRegressor, ecc.

+0

LogisticRegression può essere utilizzato se c'è un numero fisso di etichette –

+0

Nonostante il commento sopra, questa è ovviamente la risposta giusta. Sensazione stupida, grazie. – Korem

+0

@AbishekThakur, si, questo è un buon punto, ma si noti che per gli scikit LR multi-classe usa un wrapper uno-contro-tutto attorno all'algoritmo di LR binario. – DavidS

Problemi correlati