2010-10-26 9 views
0

J'ai une fonction qui détermine si un tableau a besoin d'être lissé. J'ai plusieurs tableaux sur lesquels cette opération doit être effectuée. Je voudrais utiliser la construction de sections dans OpenMP pour le faire. Malheureusement, je suis confronté à des erreurs de segmentation dès que le code grossit dans une taille appréciable. Cela peut être un problème de limitation de mémoire, mais j'aimerais avoir votre avis. Voici le pseudo-code pour l'appel à la fonction:Rendre les fonctions thread safe en C pour OpenMP

#pragma omp parallel default(shared) private(i,j,k,memd,memi,mdpmi,mdpme,mipmn,mipmn,mdinv,meinv,miinv,mimime,memime,gchk,spat,dtinv,mtempx,mtempy,mtempz,mtempinv) \ 
        firstprivate(memd,memi,mdpmi,mdpme,mipmn,mipmn,mdinv,meinv,miinv,mimime,memime,gchk,spat,dtinv) 
{ 
. 
. 
. 
    #pragma omp single 
    printf("----- Check for smoothing -----\n"); 
    #pragma omp sections 
    { 
    //Grids are now at the same timestep so we smooth 
    #pragma omp section 
    { 
     printf("----- Smoothing of Rho by TID:%d\n",omp_get_thread_num()); 
     smooth(mhd->rho,mhd->rhosmo,grid,omp_get_thread_num()); 
    } 
    #pragma omp section 
    { 
     printf("----- Smoothing of Rhoi by TID:%d\n",omp_get_thread_num()); 
     smooth(mhd->rhoi,mhd->rhoismo,grid,omp_get_thread_num()); 
    } 
    . 
    . 
    . 
    } /*-- End of Sections --*/ 
    . 
    . 
    . 
} /*-- End of Parallel Region --*/ 

Maintenant la fonction ressemble à ceci

void smooth(double ***field,char ***tsmooth,GRID *grid,int tid) 
{ 
    double mtempx[grid->nx][grid->ny][grid->nz]; 
    double mtempy[grid->nx][grid->ny][grid->nz]; 
    double mtempz[grid->nx][grid->ny][grid->nz]; 
    double mtempinv; 
    double etol=1e-10; //Oscillation amplitude tollerance 
    double itol=1e-2; //Inverse tollerance 
    for(i=0;i<grid->nx;i++) 
    { 
    for(j=0;j<grid->ny;j++) 
    { 
     for(k=0;k<grid->nz;k++) 
     { 
      printf("----- SMOOTH(TID:%2d) i=%3d j=%3d k=%3d\n",tid,i,j,k); 
      mtempx[i][j][k]=0.0; 
      mtempy[i][j][k]=0.0; 
      mtempz[i][j][k]=0.0; 
      tsmooth[i][j][k]=0; 
     } 
    } 
    } 
    for(i=1;i<grid->nx-1;i++) 
    { 
    for(j=1;j<grid->ny-1;j++) 
    { 
     for(k=1;k<grid->nz-1;k++) 
     { 
     mtempinv=1.; 
     if (sqrt(field[i][j][k]*field[i][j][k]) > itol) mtempinv=1./field[i][j][k]; 
     mtempx[i][j][k]=(field[i+1][j][k]-field[i][j][k])*(field[i][j][k]-field[i-1][j][k]); 
     mtempy[i][j][k]=(field[i][j+1][k]-field[i][j][k])*(field[i][j][k]-field[i][j-1][k]); 
     mtempz[i][j][k]=(field[i][j][k+1]-field[i][j][k])*(field[i][j][k]-field[i][j][k-1]); 
     if (sqrt(mtempx[i][j][k]*mtempx[i][j][k])*mtempinv*mtempinv <= etol) mtempx[i][j][k]=0.0; 
     if (sqrt(mtempy[i][j][k]*mtempy[i][j][k])*mtempinv*mtempinv <= etol) mtempy[i][j][k]=0.0; 
     if (sqrt(mtempz[i][j][k]*mtempz[i][j][k])*mtempinv*mtempinv <= etol) mtempz[i][j][k]=0.0; 
     } 
    } 
    } 
    for(i=1;i<grid->nx-1;i++) 
    { 
    for(j=1;j<grid->ny-1;j++) 
    { 
     for(k=1;k<grid->nz-1;k++) 
     { 
     if ( ((mtempx[i][j][k] < 0.0) && ((mtempx[i+1][j][k] < 0.0)||(mtempx[i-1][j][k] < 0.0))) 
       || ((mtempy[i][j][k] < 0.0) && ((mtempy[i][j+1][k] < 0.0)||(mtempy[i][j-1][k] < 0.0))) 
       || ((mtempz[i][j][k] < 0.0) && ((mtempz[i][j][k+1] < 0.0)||(mtempx[i][j][k-1] < 0.0)))) tsmooth[i][j][k]=1; 
     } 
    } 
    } 

}

Maintenant, cela a bien fonctionné en série et pour les tableaux 101x7x49 il semblait fonctionne bien mais quand je suis allé à un tableau de 389x7x739 je pourrais passer la première instruction printf dans la fonction. Remarque J'ai seulement ajouté les instructions printf pour aider à comprendre ce qui se passait. Ne devrait-il pas être threadsafe?

Répondre

1

Les matrices temporaires (mtempx, mtempy, etc.) nécessitent plus d'espace que ne le permet votre pile système. À la place, allouez dynamiquement ces tampons (ou déclarez-les statiquement comme étant de taille fixe).

+0

Je crois que vous avez raison. Je vais essayer de les allouer dynamiquement. – Lazer

+0

Et, pour répondre à la question posée à l'origine: Je ne vois pas de problèmes de sécurité de thread évident dans la fonction. – Throwback1986