J'ai appris la somme de texte pendant 5 jours avec les paramètres recommandés dans la page du projet. J'utilise un ensemble de formation avec plus de 3 millions de paires article-résumé. Au début running_average_loss
diminuer lentement d'environ 9 à environ 4, mais après cela, running_average_loss
change de valeur dans une large gamme, il peut être aussi élevé que plus de 5, mais parfois peut être aussi bas que 1. Et je teste le modèle avec un article dans le jeu d'apprentissage, mais la sortie est loin du résumé référencé, je suis confus. Quelqu'un peut-il partager son expérience?textsum ne converge pas
Je suis confondu avec les questions suivantes
running_average_loss
est inférieure à 10 chaque fois que je cours, est-il normal?- Est-il trop ajusté puisque
running_average_los
s varie dans une large gamme et n'a aucun signe de convergence? - Combien de temps faudra-t-il pour former un bon modèle ou quand arrêter la formation? Y a-t-il un signe à indiquer pour arrêter la formation?