Je suis le Tensorflow Object Detection API tutorial pour former un modèle F-RNCN sur mon propre ensemble de données sur Google Cloud. Mais l'erreur "manque de mémoire" suivante a continué à se produire.Erreur «mémoire insuffisante» du moteur Google Cloud ML lorsque l'utilisation de la mémoire est presque nulle
The replica master 0 ran out-of-memory and exited with a non-zero status of 247.
Et selon les journaux, un état de sortie non nul a été retourné. Comme décrit dans the official documentation, un code de peut signifier que la formation utilise plus de mémoire que allouée.
Cependant, l'utilisation de la mémoire est inférieure à 0,2. Alors pourquoi j'ai le problème de mémoire? Si cela aide, the memory utilization graph is here.
J'ai utilisé le type de machine large_model après avoir obtenu la même erreur, mais il a échoué après le même nombre d'étapes d'apprentissage que le niveau de la gamme STANDARD_1. Savez-vous ce qui pourrait être la solution à ce problème? – tzharg
@ rhaertel80, Est-ce que de plus en plus de travailleurs résolvent ce problème, ou devons-nous utiliser le type de machine plus grand comme vous l'avez dit? – LittleZero