2011-03-16 1 views
6

J'ai un ensemble de vecteurs de contexte de forme 60D. Ceux-ci ont été construits en utilisant un échantillon de 400 points de bord à partir d'une silhouette en utilisant 5 cases radiales et 12 cases angulaires (ainsi, j'ai 400 vecteurs de contexte de forme de 60D).Projection de l'espace 60D (contexte de forme) vers 2D pour l'analyse visuelle

Je voudrais analyser à quel point ces vecteurs sont représentatifs de la forme générale de la silhouette sous-jacente. Pour ce faire, je voudrais projeter les vecteurs de contexte de forme 60D dans l'espace 2D et inspecter visuellement le résultat - ce que j'espère voir est un ensemble de points qui ressemblent grossièrement à la forme de la silhouette originale.

Une approche pour ce faire consiste à projeter sur les deux premiers composants principaux (PCA). Basé sur ma mise en œuvre, les points projetés ne ressemblaient pas à la forme de la silhouette. Je peux voir deux raisons principales pour cela (en supposant pour le moment que ma mise en œuvre est correcte): (1) le contexte de forme n'est pas approprié comme descripteur étant donné les silhouettes, ou ses paramètres doivent être mieux ajustés (2) La méthode est erronée/non valide.

Ma question est de savoir si c'est la bonne approche pour analyser le caractère descriptif des contextes de forme par rapport à la forme de ma silhouette? Si non, quelqu'un peut-il expliquer pourquoi et proposer une méthode alternative?

Merci,

Josh

Répondre

2

La bonne façon de vérifier si les fonctions sont descriptives est ou ne pas essayer de former certains classificateur (SVM/Bayes/arbre/whatever) sur eux et vérifier la précision d'une validation croisée/rappel etc. Vous pouvez également filtrer votre vecteur de fonctionnalité par un sélecteur de fonctions tel que Chi/infogain.

Outre PCA, vous pouvez visualiser vos données avec SOM ou en cluster.

+1

Merci pour votre réponse; Comme suggéré, je vais former un classificateur en utilisant les descripteurs de contexte de forme et voir quelle performance je reçois dans un premier temps. Vous avez mentionné le regroupement des données, mais comment puis-je visualiser cela étant donné que c'est 60D? – Josh

+0

Le cluster peut visualiser des données sous la forme d'un arbre (cluster hiérarchique) en utilisant par exemple une visualisation Treemap populaire et en tant que groupes associés. Aussi la classification vous donne de nouvelles dimensions - les possibilités des catégories, vous pouvez les utiliser pour voir comment les instances se ferment dans l'opinion du classificateur. – yura

1

Je pense que cette méthode d'analyse est erronée/non valide. Je pense que ce serait un raisonnement similaire: je peux reconstruire la vue d'en haut sur un terrain de football en faisant PCA sur ce que voit chaque joueur de football. Ce n'est tout simplement pas raisonnable de s'attendre à cela. Je pense que la manière la plus simple d'analyser le caractère descriptif du contexte de forme est de télécharger MNIST ou d'autres bases de données de chiffres, et de calculer la matrice 10x10 des similarités de forme de 5 un et 5 twos, puis dessiner ce graphique (disons) graphviz.

+0

Merci pour l'analogie du terrain de football; cela permet de mieux comprendre ce qui se passe sur le plan conceptuel. Cependant, je crois que cette analogie n'implique pas qu'une vue aérienne du champ ne peut pas être approchée par ce que voit chaque joueur. Si vous pouvez élaborer sur ce point pour expliquer pourquoi la combinaison de chaque vue de joueur ne peut pas former une vue aérienne grossière du champ, alors ceci serait très utile pour comprendre les défauts de cette approche. En outre, je pense qu'il est préférable d'utiliser mes données plutôt que MNIST (j'ai examiné l'ensemble de données MNIST avec des contextes de forme), car le problème pourrait être spécifique aux données. – Josh

Questions connexes