2015-12-11 15 views
6

Sto provando a prevedere una serie temporale: dati 50 valori precedenti, voglio predire i 5 valori successivi.regressione skflow prevedere più valori

Per fare ciò, sto utilizzando il pacchetto skflow (basato su TensorFlow) e questo problema è relativamente vicino allo Boston example provided in the Github repo.

Il mio codice è il seguente:

%matplotlib inline 
import pandas as pd 

import skflow 
from sklearn import cross_validation, metrics 
from sklearn import preprocessing 

filepath = 'CSV/FILE.csv' 
ts = pd.Series.from_csv(filepath) 

nprev = 50 
deltasuiv = 5 

def load_data(data, n_prev = nprev, delta_suiv=deltasuiv): 

    docX, docY = [], [] 
    for i in range(len(data)-n_prev-delta_suiv): 
     docX.append(np.array(data[i:i+n_prev])) 
     docY.append(np.array(data[i+n_prev:i+n_prev+delta_suiv])) 
    alsX = np.array(docX) 
    alsY = np.array(docY) 

    return alsX, alsY 

X, y = load_data(ts.values) 
# Scale data to 0 mean and unit std dev. 
scaler = preprocessing.StandardScaler() 
X = scaler.fit_transform(X) 
X_train, X_test, y_train, y_test = cross_validation.train_test_split(X, y, 
    test_size=0.2, random_state=42) 
regressor = skflow.TensorFlowDNNRegressor(hidden_units=[30, 50], 
    steps=5000, learning_rate=0.1, batch_size=1) 
regressor.fit(X_train, y_train) 
score = metrics.mean_squared_error(regressor.predict(X_test), y_test) 
print('MSE: {0:f}'.format(score)) 

Questo porta a:

ValueError: y_true and y_pred have different number of output (1!=5)

al termine della formazione.

E quando provo a prevedere, ho lo stesso tipo di problema

ypred = regressor.predict(X_test) 
print ypred.shape, y_test.shape 

(200, 1) (200, 5)

Possiamo quindi vedere che il modello è in qualche modo la previsione solo 1 valore invece del 5 volevano/sperato.

Come è possibile utilizzare lo stesso modello per prevedere valori per più valori?

risposta

6

Ho appena aggiunto il supporto per la regressione multi-output in skflow poiché questo #e443c734, quindi per favore reinstallare il pacchetto riprovare. Se non funziona, ti preghiamo di seguire Github.

Ho anche aggiunto un esempio di regressione multiuscita a examples folder:

# Create random dataset. 
rng = np.random.RandomState(1) 
X = np.sort(200 * rng.rand(100, 1) - 100, axis=0) 
y = np.array([np.pi * np.sin(X).ravel(), np.pi * np.cos(X).ravel()]).T 

# Fit regression DNN model. 
regressor = skflow.TensorFlowDNNRegressor(hidden_units=[5, 5]) 
regressor.fit(X, y) 
score = mean_squared_error(regressor.predict(X), y) 
print("Mean Squared Error: {0:f}".format(score)) 
+0

Grazie per l'aggiunta di questo! Funziona :) – Julian

+1

Non penso che questo codice funzioni più. Quando viene chiamato 'fit()', viene generato il seguente errore: 'Forme (?, 1) e (?, 2) sono incompatibili'. (Sto usando la versione '0.10.0rc0') Ho anche creato una nuova domanda su questo problema: http://stackoverflow.com/questions/39192107/multiple-target-columns-with-skflow-tensorflowdnnregressor – twiz

+1

Qualsiasi risposta a questo domanda????!!!! – user40780

Problemi correlati