Sono nuovo di Python e sto cercando di eseguire la regressione lineare utilizzando sklearn su un dataframe panda. Questo è quello che ho fatto:Regressione lineare su Pandas DataFrame con Sci-kit Learn
data = pd.read_csv('xxxx.csv')
Dopo che ho ottenuto un dataframe di due colonne, chiamiamoli 'c1', 'c2'. Ora voglio fare regressione lineare sul set di (c1, c2), così ho entrato
X=data['c1'].values
Y=data['c2'].values
linear_model.LinearRegression().fit(X,Y)
che ha provocato il seguente errore
IndexError: tuple index out of range
Cosa c'è che non va qui? Inoltre, mi piacerebbe sapere
- visualizzare il risultato
- fare previsioni in base al risultato?
Ho cercato e navigato un gran numero di siti ma nessuno di loro sembrava dare istruzioni ai principianti sulla sintassi corretta. Forse ciò che è ovvio per gli esperti non è così ovvio per un principiante come me.
Potete per favore aiutare? La ringrazio molto per il vostro tempo.
PS: Ho notato che un gran numero di domande per principianti è stato sottovalutato nello stackoverflow. Si prega di tenere conto del fatto che le cose che sembrano ovvie per un utente esperto possono richiedere un giorno da principiante per capire. Si prega di usare discrezione quando si preme la freccia giù per non danneggiare la vivacità di questa comunità di discussione.
Potrebbe trattarsi di un problema di dati. Potrebbe essere utile fornire un campione rappresentativo del tuo csv. Separatamente, guardando http://scikit-learn.org/stable/auto_examples/linear_model/plot_ols.html, in basso creano il loro oggetto regression (regr = linear_model.LinearRegression()), quindi chiama rers.fit (X, Y). – Scott
Per quanto riguarda il tuo PS: noto che molte domande dei principianti vengono eliminate perché non formattano le loro domande in base alle pratiche SO: http://stackoverflow.com/help/how-to-ask – Scott