Je travaille sur la mise en place d'une implémentation de textum et j'ai récemment reçu mes propres données récupérées. J'ai commencé la formation hier soir contre 38000 articles. Ce matin, quand j'ai regardé la perte moyenne, j'étais autour de 5.2000000. Quand je jouais avec le jeu de jouets textum, je pouvais rapidement descendre à environ 0.0000054 par exemple, mais ce n'était que contre 20 articles. J'espérais que quelqu'un qui a eu un peu plus d'expérience pourrait être capable de me donner des attentes quant à la durée de la formation. Je suis actuellement en cours d'exécution sur un Nvidia 980M. La semaine dernière, j'ai voulu essayer l'instance AWS g2.2xlarge mais j'ai trouvé que, ironiquement, il semblait que ma machine locale traitait les choses plus rapidement que la Grid 520's. Je veux encore tester les instances P2 et aussi Google Cloud, mais pour l'instant je pense que je vais juste travailler avec ma machine locale.Combien de temps devrait durer la formation sur les textes pour faire tomber la perte moyenne à une valeur décente?
Toute information que quelqu'un pourrait être en mesure de fournir ici, concernant ce que je devrais attendre? Merci!
Actuellement ayant le même problème. Qu'est-ce qui s'est finalement passé avec votre modèle? –
Est-ce que vous avez obtenu de meilleurs résultats? –