J'ai 7 classes d'images que je dois classer. Chaque classe a un nombre différent d'échantillon.Classer les images avec un nombre différent de données pour chaque classe
- 75 Images
- 70 Images
- 98 Images
- 182 Images
- 146 Images
- 197 Images
- 150 Images
Je fini par enlever toutes les images dans toutes les classes jusqu'à 70 images (50 formation et 20 validation). En utilisant Keras et le générateur et la méthode flow_from_directory, je peux les classer tous, mais il est évident que je n'aurai pas une bonne précision. J'ai un plan pour augmenter les données trop tard.
Ma question est, puis-je utiliser un nombre différent de données d'apprentissage pour chaque classe en utilisant la méthode flow_from_directory? Et y a-t-il un inconvénient potentiel avec cette méthode?
Par exemple:
- 55 Formation - 20 Validation
- 50 Formation - 20 Validation
- 78 Formation - 20 Validation
- ......
Merci
Je crois qu'un nombre différent d'échantillons fonctionnera, mais votre modèle sera orienté vers des classes plus fréquentes. Aux ratios que vous avez, cela ne devrait pas poser de problème. –