Je veux former un réseau de neurones en utilisant la descente de gradient de lot, mais je voudrais paralléliser le processus. Je souhaite séparer le lot en mini-lots, répartir le calcul du gradient entre les processus, puis les ramener au processus maître pour les établir en moyenne et les appliquer à la formation.TensorFlow moyennage des gradients de minibatch en parallèle
Comme un exemple simple, prenez ce script qui forme un réseau de neurones sur N points de données pour la parabole y = x^2:
import tensorflow as tf
import numpy as np
def add_layer(inputs, in_size, out_size, activation_function=None):
Weights = tf.Variable(tf.random_normal([in_size, out_size]))
biases = tf.Variable(tf.random_normal([1, out_size]))
Wx_plus_b = tf.matmul(inputs, Weights) + biases
if activation_function is None:
outputs = Wx_plus_b
else:
outputs = activation_function(Wx_plus_b)
return outputs
# Make up some real data
N = 50
x_data = np.linspace(-2, 2, N)[:, np.newaxis]
noise = np.random.normal(0, 0.05, x_data.shape)
y_data = np.square(x_data) # - 0.5 + noise
# Define placeholder for x_data and y_data
xs = tf.placeholder(tf.float32, [None, 1])
ys = tf.placeholder(tf.float32, [None, 1])
""" Build the network"""
# Add hidden layer
l1 = add_layer(xs, 1, 5, activation_function=tf.tanh)
# Add output layer
prediction = add_layer(l1, 5, 1, activation_function=None)
# Define loss
loss = tf.reduce_mean(tf.reduce_sum(tf.square(ys-prediction), reduction_indices=[1]))
# Define optimizer
opt = tf.train.GradientDescentOptimizer(learning_rate=1e-2)
# Compute the gradients for a list of variables.
grads_and_vars = opt.compute_gradients(loss)
# Ask the optimizer to apply the gradients
train_opt = opt.apply_gradients(grads_and_vars)
# Initialize global variables
sess = tf.Session()
init = tf.global_variables_initializer()
sess.run(init)
for i in range(2000):
# training
sess.run(train_opt, feed_dict={xs: x_data, ys: y_data})
if i % 50 == 0:
prediction_value = sess.run(prediction, feed_dict={xs: x_data})
print(sess.run(loss, feed_dict={xs: x_data, ys: y_data}))
La section Je veux paralléliser le calcul des gradients, puis je veux ramener ces gradients au processus maître pour faire la moyenne et ensuite appliquer à l'étape de formation. Je veux diviser les N points de données en x_data
sur P processus. Je pense que c'est ce que l'on appelle "l'entraînement synchrone", pour lequel j'ai vu des ressources mais personne ne l'explique jamais.
Comment puis-je paralléliser cet exemple simple de manière synchrone?
pourquoi voulez-vous faire cela? Ne dis pas que c'est une mauvaise idée, je suis juste curieux – user3684792
Dans ma vraie application, j'ai environ 30 000 exemples à adapter, en utilisant un réseau neuronal profond avec de nombreuses couches dans les nœuds. Je me suis dit que si je pouvais paralléliser la formation en mini-lot, je pourrais rendre ce parallèle embarrassant. Par exemple, en cours d'exécution sur 30 processus, je peux atteindre la vitesse de montage à 1000 exemples. – Drew
Quels avantages cela donne-t-il à juste laisser tensorflow gérer la parallélisation? – user3684792