Comme vous attendez d'un DSL visant à l'analyse des données, R poignées données manquantes/incomplètes très bien, par exemple:Traitement des données manquantes/incomplètes dans R - Y a-t-il une fonction pour masquer mais pas pour supprimer les NA?
De nombreuses fonctions de R ont un na.rm drapeau lorsqu'il est réglé sur TRUE , retirez le NAs:
>>> v = mean(c(5, NA, 6, 12, NA, 87, 9, NA, 43, 67), na.rm=T)
>>> v
(5, 6, 12, 87, 9, 43, 67)
Mais si vous voulez traiter avant NAs l'appel de fonction, vous devez faire quelque chose comme ceci:
pour supprimer chaque 'NA' à partir d'un vecteur:
vx = vx[!is.na(a)]
pour supprimer chaque 'NA' à partir d'un vecteur et le remplacer w/a '0':
ifelse(is.na(vx), 0, vx)
pour supprimer toute chaque rangée qui contient « NA » à partir d'une trame de données:
dfx = dfx[complete.cases(dfx),]
Toutes ces fonctions de façon permanente supprimer « NA » ou rangées avec un « NA » en eux. Cependant, ce n'est pas tout à fait ce que vous voulez - faire une copie excisée NA de la trame de données peut être nécessaire pour la prochaine étape dans le flux de travail, mais dans les étapes suivantes, vous voulez souvent ces lignes (par exemple , pour calculer une statistique colonne par colonne pour une colonne dont les lignes sont manquantes en raison d'un appel préalable à 'compléter les cas' mais cette colonne ne contient pas de valeurs 'NA'.
d'être aussi clair que possible sur ce que je cherche: python/numpy a une classe, tableau masqué, avec une méthode masque, qui vous permet cachez --mais pas remove-- NA pendant un appel de fonction. Y a-t-il une fonction analogue dans R?
Votre lien au zoo est cassé. [Ici] (http://cran.r-project.org/web/packages/zoo/zoo.pdf) est un lien vers la dernière documentation que j'ai pu trouver (avertissement .pdf), et [ici] (http://cran.r-project.org/web/packages/zoo/index.html) est un lien vers ce que je pense être le dernier résumé du zoo. – deadstump
Mauvais pluriel 's' dans l'URL tel qu'il est 'package = ...', pas 'packages = ...'. Maintenant corrigé, merci. –