je voudrais paralléliser le code suivantopenmp parallélisé code en C++ est plus lente que la série une
for (i=0; i<M; i++){
temp = 0.
for (j=0; j<N; j++){
temp += A[i][j]*v[j];
u[i] = temp;
}
où différent u [i] peut être calculé de façon indépendante. Donc j'ai essayé de faire
#pragma omp parallel for private (j,temp)
for (i=0; i<M; i++){
temp = 0.
for (j=0; j<N; j++){
temp += A[i][j]*v[j];
u[i] = temp;
}
et je trouve que le deuxième cas est plus lent que le premier. Une idée de pourquoi c'est ainsi? ici M ~ 100 et N ~ 2.
Il existe déjà [une réponse] (https://stackoverflow.com/a/17429524/5809597) pour cela. –