Voir plus de détails:
La plupart des fonctions statistiques (par exemple, lm()) ont quelque chose comme na.action qui applique au modèle, et non pas à des variables individuelles. na.fail() renvoie l'objet (l'ensemble de données) s'il n'y a pas de valeurs NA, sinon il renvoie NA (arrêt de l'analyse). na.pass() renvoie l'objet de données qu'il possède ou non des valeurs NA, ce qui est utile si la fonction traite les valeurs NA en interne. na.omit() renvoie l'objet avec des observations entières (lignes) omises si l'une des variables utilisées dans le modèle est NA pour cette observation. na.exclude() est identique à na.omit(), sauf qu'il autorise les fonctions utilisant naresid ou napredict. Vous pouvez considérer na.action comme une fonction sur votre objet de données, le résultat étant l'objet de données dans la fonction lm(). La syntaxe de la fonction lm() permet de spécifier le na.action comme paramètre:
lm(na.omit(dataset),y~a+b+c)
lm(dataset,y~a+b+c,na.omit) # same as above, and the more common usage
Vous pouvez configurer votre traitement par défaut des valeurs manquantes avec
options("na.actions"=na.omit)
'split (df, est .na (df $ var2)) ' – Sotos