Tensorflow Charger le modèle dans l'API C++ et obtenir l'erreur "from device: CUDA_ERROR_OUT_OF_MEMORY"

Mon modèle fait environ 2,4 Go. Dans mon étape d'inférence, je veux charger le modèle par la méthode de multi-traitement dans chaque GPU. Cela signifie que j'essaie de faire deux process dans un GPU et de charger un modèle: Après avoir fait la configuration de chaque session, chaque session reçoit environ 5 Go de mémoire, mais je rencontre toujours le "from device: CUDA_ERROR_OUT_OF_MEMORY" .Je me demande. .. Demander de l'aideTensorflow Charger le modèle dans l'API C++ et obtenir l'erreur "from device: CUDA_ERROR_OUT_OF_MEMORY"

informations GPU:

[recherche @ qrwt01/home/s/apps/qtfserverd/bin] $ nvidia-smi 14 septembre Jeu 21:42:48 2017

+-----------------------------------------------------------------------------+ 
| NVIDIA-SMI 375.26 Driver Version: 375.26 | 
|-------------------------------+----------------------+----------------------+ 
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC | 
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. | 
|===============================+======================+======================| 
| 0 Tesla K80 Off | 0000:08:00.0 Off | 0 | 
| N/A 48C P0 61W/149W | 11366MiB/11439MiB | 0% Default | 
+-------------------------------+----------------------+----------------------+ 
| 1 Tesla K80 Off | 0000:09:00.0 Off | 0 | 
| N/A 32C P0 72W/149W | 11359MiB/11439MiB | 0% Default | 
+-------------------------------+----------------------+----------------------+ 

+-----------------------------------------------------------------------------+ 
| Processes: GPU Memory | 
| GPU PID Type Process name Usage | 
|=============================================================================| 
| 0 33056 C ...ome/s/apps/qtfserverd/etc/qtfserverd.conf 5823MiB | 
| 0 33057 C ...ome/s/apps/qtfserverd/etc/qtfserverd.conf 5515MiB | 
| 1 33058 C ...ome/s/apps/qtfserverd/etc/qtfserverd.conf 5823MiB | 
| 1 33059 C ...ome/s/apps/qtfserverd/etc/qtfserverd.conf 5516MiB | 
+-----------------------------------------------------------------------------+

Configuration de la session:

void* create_session(void* graph, std::string& checkpoint_path, 
    int intra_op_threads, int inter_op_threads, std::string& device_list) { 
Session* session = NULL; 
SessionOptions sess_opts; 
//int NUM_THREADS = 8; 
if (intra_op_threads > 0) { 
    sess_opts.config.set_intra_op_parallelism_threads(intra_op_threads); 
} 
if (inter_op_threads > 0) { 
    sess_opts.config.set_inter_op_parallelism_threads(inter_op_threads); 
} 

sess_opts.config.set_allow_soft_placement(true); 
sess_opts.config.mutable_gpu_options()->set_visible_device_list(device_list); 
sess_opts.config.mutable_gpu_options()->set_allocator_type("BFC"); 
sess_opts.config.mutable_gpu_options()->set_per_process_gpu_memory_fraction(0.5); 
sess_opts.config.mutable_gpu_options()->set_allow_growth(true); 
Status status = NewSession(sess_opts, &session); 
if (!status.ok()) { 
    fprintf(stderr, "Create Session Failed %s\n", status.ToString().c_str()); 
    return NULL; 
}

informations d'erreur

charge graphique de /home/search/tensorflow/deploy_combine.model.meta à/GPU: 1 succès 14/09/2017 21: 42: 31,188212: I tensorflow /core/common_runtime/gpu/gpu_device.cc:965] Périphérique trouvé 0 avec les propriétés: nom: Tesla K80 majeur: 3 mineur: 7 memoryClockRate (GHz): 0.8235 pciBusID: 0000: 09: 00.0 mémoire totale: 11.17GiB freeMemory : 11.05GiB 2017-09-14 21: 42: 31.188260: Je tensorflow/core/common_runtime/gpu/gpu_device.cc: 1055] Création d'un périphérique TensorFlow (/ périphérique: GPU: 0) -> (périphérique: 1, nom: Tesla K80, ID du bus PCI: 0000: 09: 00.0, capacité de calcul: 3.7) qss_switch: 1, lstm_switch: 1 qss_switch: 1 , lstm_switch: 1 2017-09-14 21: 42: 33.826598: E tensorflow/stream_executor/cuda/cuda_driver.cc: 936] Impossible d'allouer 1.58G (1701773312 bytes) à partir du périphérique: CUDA_ERROR_OUT_OF_MEMORY 2017-09-14 21: 42: 33.838694: E tensorflow/stream_executor/cuda/cuda_driver.cc: 936] Impossible d'allouer 1.43G (1531596032 bytes) à partir du périphérique: CUDA_ERROR_OUT_OF_MEMORY 2017-09-14 21: 42: 33.893832: E tensorflow/stream_executor/cuda/cuda_driver .cc: 936] n'a pas pu allouer 439.82M (461180672 octets) à partir du périphérique: CUDA_ERROR_OUT_OF_MEMORY 2017-09-14 21: 42: 33.903917: E tensorflow/stream_executor/cuda/cuda_driver.cc: 936] Impossible d'allouer 439.82M (461180672 octets) de périphérique: CUDA_ERROR_OUT_OF_MEMORY 2017-09-14 21: 42: 33.913843: E tensorflow/stream_executor/cuda/cuda_driver.cc: 936] Impossible d'allouer 439.82M (461180672 bytes) à partir du périphérique: CUDA_ERROR_OUT_OF_MEMORY 2017-09-14 21:42 : 33.924008: E tensorflow/stream_executor/cuda/cuda_driver.cc: 936] Impossible d'allouer 439.82M (461180672 octets) à partir du périphérique: CUDA_ERROR_OUT_OF_MEMORY 2017-09-14 21: 42: 33.935385: E tensorflow/stream_executor/cuda/cuda_driver. cc: 936] n'a pas pu allouer 439.82M (461180672 octets) à partir du périphérique: CUDA_ERROR_OUT_OF_MEMORY 2017-09-14 21: 42: 33.946556: E tensorflow/stream_executor/cuda/cuda_driver.cc: 936] Impossible d'allouer 439.82M (461180672 octets) à partir du périphérique: CUDA_ERROR_OUT_OF_MEMORY 2017-09-14 21: 42: 33.956340: E tensorflow/stream_executor/cuda/cuda_driver.

Source

2017-09-15 suzhaolong

Essayez de réduire les paramètres de votre opération ou de faire le calcul par lots car l'erreur indique que toutes les ressources du GPU ont été épuisées.

Source

2018-03-06 10:58:56

Tensorflow Charger le modèle dans l'API C++ et obtenir l'erreur "from device: CUDA_ERROR_OUT_OF_MEMORY"

Répondre

Questions connexes