lapply ignore NA

Salut je veux normaliser sur la colonne de mon ensemble de données-trainingData [1]. le type de cette colonne est num. Mais quand je cours le code ci-dessous, il m'a donné tout NA, est-ce parce qu'il y a NA dans mon ensemble de données, et comment puis-je dire lapply de l'ignorer.lapply ignore NA

normalize <- function(x) { 
    return ((x - min(x))/(max(x) - min(x))) 
} 

trainingData[1] <- as.data.frame(lapply(trainingData[1], normalize))

Merci!

Source

2017-08-29 Pumpkin C

vous pourriez appeler le 'min()' et 'max()' fonctions réglage de la argument 'na.rm = TRUE'. Exemple: 'min (c (NA, 2: 4), na.rm = TRUE)' –

Essayez cette

normalize <- function(x) { 
        return ((x - min(x,na.rm=T))/(max(x,na.rm=T) - min(x,na.rm=T))) 
       }

Source

2017-08-29 23:53:58

Cela fonctionne! Je vous remercie! –

Votre bienvenue, si vous aimez la réponse l'accepter –

Vous pouvez construire dans un filtre is.na() dans dans votre normalize() fonction:

normalize <- function(x) { 
    #first option 
    x <- x[!is.na(x)] 
    #second option 
    #x <- na.omit(x) 
    return ((x - min(x))/(max(x) - min(x))) 
}

Source

2017-08-29 23:55:50

Y at-il une différence entre ces deux? –

Pour votre cas d'utilisation, non. Mais il peut y avoir des problèmes d'alignement avec les sous-ensembles de données. Voici une bonne explication: https://stackoverflow.com/questions/21493447/what-is-the-difference-between-na-omit-and-is-na –

Merci. Btw, la précision de mon modèle a chuté après la mise à l'échelle des fonctionnalités, est-ce possible? –

lapply ignore NA

Répondre

Questions connexes