J'ai une application Nginx + Gunicorn + Flask qui fournit des API en utilisant un modèle d'apprentissage automatique. Le modèle est stocké dans un fichier volumineux et prend beaucoup de temps (environ une minute) pour être chargé en mémoire. Maintenant, je veux mettre à jour le fichier modèle et redémarrer le travailleur sans temps d'arrêt. Comment est-ce que je peux configurer gunicorn (ou quelque chose) pour attendre que de nouveaux processus se chargent? Il suffit d'envoyer kill -HUP
semble insuffisant pour cela.Rechargement d'un applicateur gunicorn qui prend beaucoup de temps à charger
Les demandes qui viennent avant les nouvelles charges de processus semblent être abandonnées.