2015-10-03 1 views
0

Dans le package R - ClustOfVar, il existe des méthodes pour regrouper les variables les unes avec les autres. Il donne l'erreur comme ci-dessous -Colonnes dans lesquelles toutes les valeurs sont identiques Erreur

train2 = train[!duplicated(lapply(train, summary))] 
> tree <- hclustvar(train2[, 2:10]) 
Error in recodquant(X.quanti) : 
    There are columns in X.quanti where all the values are identical 

D'après ce que je comprends, pour faire en sorte que mes variables ne sont pas identiques, j'ai appliqué la logique dupliquée pour supprimer des variables en double.

J'ai vérifié le code du colis sur https://github.com/cran/PCAmixdata/blob/master/R/recodquant.R mais je n'ai pas pu identifier l'erreur.

Des idées?

Merci, Manish

Répondre

0

Le code ci-dessous n'est pas correct d'identifier correctement les doublons -

train2 = train[!duplicated(lapply(train, summary))] 

Pls utiliser le ci-dessous -

library(digest) 
train2 = train[!duplicated(lapply(train, digest))] 

Merci, Manish