2017-04-03 2 views
0

Disons que j'ai calculé les principales composantes d'un ensemble de données de référence, y compris le blanchiment. La matrice de transformation créée à partir des vecteurs composants principaux est ensuite appliquée à un ensemble de données de test, en le projetant sur le sous-espace des PC. Maintenant, je devrais être capable de mesurer la distance de chacun des vecteurs de données de test du centre de l'hypersphère PC en additionnant simplement les coefficients de chaque colonne. Est-ce correct? L'application de cette transformation à mes données de référence donne une longueur de zéro pour toutes les colonnes, et la longueur des vecteurs semble diminuer à mesure que les données de test ressemblent aux données de référence et croît au fur et à mesure que les deux ensembles se distinguent. Ai-je raison de dire que je peux juger de cette façon la "distance" dans un espace multidimensionnel? Est-ce juste la somme des coefficients de la matrice projetée?Comment calculer la distance du centre d'une hypersphère (PCA blanchie)

Merci beaucoup pour votre avis.

Répondre

0

La distance n'est pas une somme linéaire et elle n'est jamais nulle (en dehors de l'origine). Il est calculé comme suit:

distance(x) = square_root(sum (x(i)^2)) 

Si ce n'était pas ce que vous cherchiez pour, s'il vous plaît élargir votre question et inclure un code et des exemples.