1

Je cherche des suggestions sur un problème auquel je suis actuellement confronté.Réduction de la dimension pour SVM dans le réseau de capteurs

J'ai un ensemble de capteurs dit S1-S100 qui est déclenché lorsqu'un événement E1-E20 est effectué. Supposons que normalement E1 déclenche S1-S20, E2 déclenche S15-S30, E3 déclenche S20-s50 etc et E1-E20 sont des événements complètement indépendants. Parfois, un événement E peut déclencher n'importe quel autre capteur indépendant. J'utilise un ensemble de 20 svm pour analyser chaque événement séparément. Mes caractéristiques sont la fréquence du capteur F1-F100, le nombre de fois que chaque capteur est déclenché et quelques autres caractéristiques connexes.

Je cherche une technique qui peut réduire la dimensionnalité de la fonction de capteur (F1-F100)/ou certaines techniques qui englobe l'ensemble du capteur et réduit la dimension aussi (je cherchais un concept de théorie de l'information pour la dernière quelques jours) . Je ne pense pas à la moyenne, la maximisation est une bonne idée car je risque de perdre des informations (ça ne m'a pas donné de bon résultat).

Quelqu'un peut-il suggérer ce qui me manque ici? Un papier ou une idée de départ ...

Merci d'avance.

Répondre

2

Peut-être que vous aimeriez commencer avec Linear Discriminant Analysis, c'est un algorithme assez simple et fait plus ou moins ce que vous cherchez: réduction de la dimensionnalité et/ou la classification. Il suppose que chaque classe est gaussienne distribuée avec des moyens différents mais la même covariance. C'est probablement une bonne idée de tracer certaines données à l'avance pour s'assurer que cette hypothèse est raisonnable. J'ai déjà utilisé l'implémentation LDA dans R avant. C'était avec environ une douzaine de fonctionnalités, cependant. Je ne suis pas sûr de savoir comment il serait à l'échelle de 100 dimensions.

Il peut également être utile de savoir pourquoi vous souhaitez réduire la dimension des données. Les SVM sont couramment utilisés avec des centaines de milliers de fonctionnalités (clairsemées), alors quelle est la difficulté que vous avez?

+0

merci pour la réponse .. Je vais essayer LDA .. je veux réduire la dimension parce que dans la plupart des cas, si E1 déclenche S1-S15, la valeur pour le repos de la fréquence du capteur F16-F100 sera être zéro, parfois autre capteur dire S45, S50 peut également être déclenché quelques fois ... principalement je veux exclure tous ces zéros du vecteur de fonctionnalité – iinception

+0

Mot d'avertissement, LDA est également allocation de Dirichlet latent, un algorithme connexe mais très différent. – Stompchicken

0

Ceci est un article lié à votre question: http://en.wikipedia.org/wiki/Nonlinear_dimensionality_reduction

En outre, comme @StompChicken mentionne que vous ne devriez pas avoir de la difficulté à faire un travail de SVM avec quelques centaines de caractéristiques. Vous devriez commencer à voir les problèmes (opérationnels) à des dizaines de milliers de fonctionnalités.

Carlos

Questions connexes