2017-10-09 3 views
2

J'ai une matrice de probabilités symétrique avec des entrées diagonales nulles. On suppose que quelque chose commeRcpp Rcpp vectorisée avec probabilités dans la matrice Armadillo

0 0.5 0.1 0.6 
    0.5 0 0.2 0.1 
    0.1 0.2 0 0.2 
    0.6 0.1 0.2 0 

Je veux dessiner une matrice fictive de sorte que la probabilité de l'entrée [i, j] l'entrée [i, j] dans la matrice des probabilités. Notez que la matrice de probabilités que j'ai est une matrice de Armadillo (une grande matrice 5000x5000). bien sûr, les mannequins diagonaux devraient être nuls parce que leurs probabilités sont nulles. J'ai construit deux fonctions pour le faire mais elles ne sont pas rapides. Je devrais échantillonner cette matrice plusieurs fois dans des boucles.

mat binom1(mat& prob){ 
    int n=prob.n_rows; 
    mat sample(n,n,fill::zeros); 
    NumericVector temp(2); 

    for(int i(0);i<n-1;++i){ 
    for(int j(i+1);j<n;++j){ 
    temp=rbinom(2,1,prob(i,j)); 
    sample(i,j)=temp(0); sample(j,i)=temp(1); 
    } 
    } 
return sample; 
} 


mat binom2(mat& prob){ 
    int n=prob.n_rows; 
    mat sample(n,n); 

    for(int i(0);i<n;++i){ 
    for(int j(0);j<n;++j){ 
     sample(i,j)=as<double>(rbinom(1,1,prob(i,j))); 
    } 
    } 
    return sample; 
} 

Les deux sont plus lents que vectorisé rbinom R.

z=matrix(runif(1000^2),1000) #just an example for 1000x1000 matrix 
    microbenchmark(rbinom(nrow(z)^2,1,z),binom1(z),binom2(z)) 

Résultats

   expr  min  lq  mean  median uq  max 
rbinom(nrow(z)^2, 1, z) 95.43756 95.94606 98.29283 97.5273 100.3040 108.2293 
       binom1(z) 131.33937 133.25487 139.75683 136.4530 139.5511 229.0484 
       binom2(z) 168.38226 172.60000 177.95935 175.6447 180.9531 277.3501 

Y at-il un moyen de rendre plus rapidement le code?

Je vois un exemple here. Mais dans mon cas, les probabilités sont dans la matrice Armadillo

+0

double possible de [binomiale aléatoire vectorisée CRPP tire] (https://stackoverflow.com/questions/29430726/vectorised- rcpp-random-binomial-drawers) –

+0

J'essaie de l'utiliser mais dans mon cas les probabilités sont dans la matrice Armadillo –

Répondre

1

Merci beaucoup. J'ai aussi utilisé ce

umat binom4(mat& prob){ 
    int n=prob.n_rows; 
    mat temp(n,n,fill::randu); 
    return (temp<prob); 
    } 

Je pense qu'il est un peu plus rapide

microbenchmark(rbinom(nrow(z)^2,1,z),binom1(z),binom2(z),binom3(z),binom4(z)) 

       expr  min  lq  mean median  uq  max  neval 
rbinom(nrow(z)^2, 1, z) 94.24809 95.29728 97.24977 95.86829 98.19758 108.30877 100 
       binom1(z) 130.20266 132.48951 138.07100 134.03693 137.34613 297.86393 100 
       binom2(z) 164.96716 168.17024 175.89784 170.29310 173.93890 338.99306 100 
       binom3(z) 64.57977 64.78340 67.03158 65.81533 67.42386 92.31300 100 
       binom4(z) 29.66925 31.44107 32.81296 31.77392 33.31575 55.65539 100 
+0

C'est une bonne solution. –

1

Compte tenu de la réponse quasi-double, vous pouvez utiliser:

mat binom3(const mat& prob) { 

    int n = prob.n_rows; 
    mat sample(n, n); 

    std::transform(prob.begin(), prob.end(), sample.begin(), 
       [=](double p){ return R::rbinom(1, p); }); 

    return sample; 
} 

Microbenchmark:

Unit: milliseconds 
        expr  min  lq  mean median  uq  max neval 
rbinom(length(z), 1, z) 46.88264 47.28971 48.09543 47.66346 48.40734 65.29790 100 
       binom1(z) 76.98416 82.60813 84.93669 83.51432 84.04780 126.46992 100 
       binom2(z) 96.20707 98.59145 101.99215 99.56175 102.02750 153.04754 100 
       binom3(z) 34.01417 34.49066 35.12199 34.93946 35.47979 38.22539 100 
+0

Ok merci –