J'ai travaillé sur le code pour créer une fonction parallèle de type lapply() qui utilise le moteur Elastic Map Reduce d'Amazon comme 'grille' pour le traitement (oui, c'est un mapper sans réducteur). Après avoir obtenu le code stable, je vais le résumer comme un backend foreach. Mais d'abord j'ai besoin de construire des tests pour tester le code que j'ai.R: Création de cas de test de type lapply()
Quels seraient les bons cas de test pour cette fonction?
Mon cas de test canonique est maintenant à droite comme suit:
myList <- NULL
set.seed(1)
for (i in 1:10){
a <- c(rnorm(999), NA)
myList[[i]] <- a
}
outputLocal <- lapply(myList, mean, na.rm=T)
outputEmr <- emrlapply(myList, mean, myCluster, na.rm=T)
all.equal(outputEmr, outputLocal)
Ce cas de test fait que l'argument optionnel na.rm=T
est transmis correctement aux machines distantes. Quels sont les autres cas de test que je pourrais utiliser? Je ne supporte pas actuellement les arguments simplify
ou USE.NAMES
, bien que je le ferai dans le futur.
bonne entrée! Je vous remercie –