Sto cercando di imparare la rappresentazione della parola del dataset imdb "da zero" tramite la funzione TensorFlow tf.nn.embedding_lookup()
. Se ho capito bene, devo impostare un livello di incorporamento prima dell'altro livello nascosto, e poi quando eseguo la discesa del gradiente, il livello "apprenderà" una rappresentazione di parole nei pesi di questo livello. Tuttavia, quando provo a farlo, ottengo un errore di forma tra il mio livello di incorporamento e il primo livello completamente connesso della mia rete.Tensorflow embedding_lookup
def multilayer_perceptron(_X, _weights, _biases):
with tf.device('/cpu:0'), tf.name_scope("embedding"):
W = tf.Variable(tf.random_uniform([vocab_size, embedding_size], -1.0, 1.0),name="W")
embedding_layer = tf.nn.embedding_lookup(W, _X)
layer_1 = tf.nn.sigmoid(tf.add(tf.matmul(embedding_layer, _weights['h1']), _biases['b1']))
layer_2 = tf.nn.sigmoid(tf.add(tf.matmul(layer_1, _weights['h2']), _biases['b2']))
return tf.matmul(layer_2, weights['out']) + biases['out']
x = tf.placeholder(tf.int32, [None, n_input])
y = tf.placeholder(tf.float32, [None, n_classes])
pred = multilayer_perceptron(x, weights, biases)
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(pred,y))
train_step = tf.train.GradientDescentOptimizer(0.3).minimize(cost)
init = tf.initialize_all_variables()
L'errore che ottengo è:
ValueError: Shapes TensorShape([Dimension(None), Dimension(300), Dimension(128)])
and TensorShape([Dimension(None), Dimension(None)]) must have the same rank
Grazie! Penso che tf.nn.reduce_sum dovrebbe essere tf.reduce_sum? Quando scegli di ridurre la dimensione del livello di incorporamento, come hai scelto quello da ridurre tra "n_input = 300" e "embedding_size = 128"? – nicolasdavid
Hai ragione riguardo al refuso - corretto in alto, grazie! Ho scelto di ridurre la dimensione 'n_input' perché sembrava più probabile che ciò corrispondesse al tuo problema e ho assunto che (ad esempio) l'ordine degli input non fosse importante. È abbastanza tipico farlo per problemi di tipo bag-of-words. Potresti * ridurre * con 'embedding_size', ma penso che perderebbe molte informazioni dall'incorporazione, quindi probabilmente non funzionerebbe altrettanto bene. – mrry