2016-09-18 4 views
1

je le code suivant qui provoque une erreur dans le contexte d'une plus grande base de code:__assume() semble provoquer une erreur interne dans FPUNV: « Appel a mal nombre de paramètres ... »

struct Quadruple 
{ 
    double _sum; 
    double _corr; 

    // Fast multiply by -1, 0 or +1 (doesn't need extended precision operations). 
    __device__ inline Quadruple& MulSign(const int8_t sign); 
}; 

// ... 

__device__ inline Quadruple& Quadruple::MulSign(const int8_t sign) 
{ 
    __assume(-1 <= sign && sign <= 1); // enable more optimization premises 
    _sum *= sign; 
    _corr *= sign; 
    return *this; 
} 

// ... 

int8_t y = /* ... read from memory ... */; 
Quadruple a = /* ... computed here ... */; 
Quadruple b = Quadruple(a).MulSign(y); 

lors de la compilation du code avec CUDA 8RC + MSVC++ 2013 je reçois l'erreur suivante:

1> Compiling CUDA source file Example.gpu.cu... 
1> 
1> D:\ExDir>"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\bin\nvcc.exe" -gencode=arch=compute_20,code=\"sm_21,compute_20\" --use-local-env --cl-version 2013 -ccbin "C:\Program Files (x86)\Microsoft Visual Studio 12.0\VC\bin\x86_amd64" -I"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\include" -I"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\include"  --keep-dir x64\Release -maxrregcount=0 --machine 64 --compile -cudart static  -D_DENSE_REP -DWIN32 -DWIN64 -DNDEBUG -D_CONSOLE -D_MBCS -Xcompiler "/EHsc /W4 /nologo /Ox /Zi /MD " -o x64\Release\Example.gpu.cu.obj "D:\ExDir\Example.gpu.cu" 
1>ptxas C : /Users/ExUser/AppData/Local/Temp/tmpxft_00002ffc_00000000-4_CuSvm.gpu.ptx, line 2513; error : Call has wrong number of parameters 
1> ptxas fatal : Ptx assembly aborted due to errors 
1> Example.gpu.cu 
1>C:\Program Files (x86)\MSBuild\Microsoft.Cpp\v4.0\V120\BuildCustomizations\CUDA 8.0.targets(599,9): error MSB3721: The command ""C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\bin\nvcc.exe" -gencode=arch=compute_20,code=\"sm_21,compute_20\" --use-local-env --cl-version 2013 -ccbin "C:\Program Files (x86)\Microsoft Visual Studio 12.0\VC\bin\x86_amd64" -I"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\include" -I"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\include"  --keep-dir x64\Release -maxrregcount=0 --machine 64 --compile -cudart static  -D_DENSE_REP -DWIN32 -DWIN64 -DNDEBUG -D_CONSOLE -D_MBCS -Xcompiler "/EHsc /W4 /nologo /Ox /Zi /MD " -o x64\Release\Example.gpu.cu.obj "D:\ExDir\Example.gpu.cu"" exited with code 255. 

Après avoir commenté sur __assume(-1 <= sign && sign <= 1);, le code se compile bien.

Est-ce un bogue dans NVCC, ou est-ce que __assume de MSVC++ n'est pas supporté par NVCC, ou est-ce que je fais quelque chose de mal? Y at-il une solution de contournement (gardant __assume ou un équivalent, bien sûr)?

Répondre

4

__assume() est un Microsoft (et par la suite Intel icc) intrinsèque du compilateur. Il ne fait pas partie du langage C++ et n'est pas supporté dans CUDA (ou dans GCC ou Clang d'ailleurs).