J'essaye de construire une application pour détecter les images qui sont des publicités à partir des pages Web. Une fois que je les détecterai, je ne permettrai pas que ceux-ci soient affichés côté client. De l'aide que j'ai eu sur this Stackoverflow question, je pensais que SVM est la meilleure approche de mon objectif. J'ai donc codé SVM et SMO moi-même. L'ensemble de données que j'ai reçu du référentiel de données UCI a 3280 instances (Link to Dataset) où environ 400 d'entre elles sont de classe représentant des images de publicité et le reste d'entre elles représentant des images non-publicitaires.SVM Classification - nombre minimum d'ensembles d'entrée pour chaque classe
En ce moment, je prends les premiers 2800 jeux d'entrée et la formation du SVM. Mais après avoir regardé le taux de précision, j'ai réalisé que la plupart de ces 2800 ensembles d'entrée proviennent d'une classe d'image non-publicitaire. Donc, je reçois une très bonne précision pour cette classe.
Alors, que puis-je faire ici? À propos du nombre d'entrées que je dois donner à SVM pour m'entraîner et combien d'entre elles pour chaque classe?
Merci. À votre santé. (Au fond fait une nouvelle question parce que le contexte était différent de ma question précédente. Optimization of Neural Network input data)
Merci pour la réponse. Je veux vérifier si je dérive correctement ou non les valeurs C de la classe ad et non-ad. S'il vous plaît donnez-moi vos commentaires à ce sujet.
Ou vous u pouvez voir la version doc here.
Vous pouvez voir le graphique de y1 eqaul à y2 ici
et y1 pas égal à y2 ici
Je n'ai pas compris ce que vous vouliez dire par la rareté de l'espace caractéristique et par la façon dont il décidera de la taille de mon ensemble d'entraînement. Laissez-moi me rendre un peu clair ici. 1. Oui, je ne fais que de l'analyse de texte pour prédire l'image comme image publicitaire/non publicitaire. 2. Je suis obligé de ne pas utiliser ces librairies sur Internet et de mettre en œuvre SVM par nos propres moyens. J'ai déjà codé la plupart des SVM et je peux tester la précision de sa sortie. Merci. - –
Laissez-moi essayer d'être plus clair. Comment obtenez-vous d'une image au vecteur de nombre que vous entrez dans votre SVM pour cette image? Sûrement vous ne lui donnez pas juste la couleur rouge, verte et bleue de chaque pixel dans l'image? –
Je suis en train de faire une analyse de texte pour obtenir différents attributs de cette image. En utilisant cela comme un ensemble d'entraînement (qui est déjà là dans le référentiel UCI), j'entraîne mon svm. Maintenant, le problème est que le nombre d'ensembles de formation à la publicité n'est que de 400 par rapport au nombre d'ensembles de formation non publicitaire qui est d'environ 2800. Alors maintenant, que puis-je faire ici? À propos du nombre d'entrées que je dois donner à SVM pour m'entraîner et combien d'entre elles pour chaque classe? Merci. –