xref: /petsc/src/sys/objects/device/impls/cupm/cupmblasinterface.cxx (revision 0e6b6b5985dd9b1172860d21fb88bd3966bf7c54)
117f48955SJacob Faibussowitsch #include <petsc/private/cupmblasinterface.hpp>
217f48955SJacob Faibussowitsch 
39371c9d4SSatish Balay namespace Petsc {
417f48955SJacob Faibussowitsch 
5*0e6b6b59SJacob Faibussowitsch namespace device {
617f48955SJacob Faibussowitsch 
7*0e6b6b59SJacob Faibussowitsch namespace cupm {
817f48955SJacob Faibussowitsch 
9*0e6b6b59SJacob Faibussowitsch namespace impl {
1017f48955SJacob Faibussowitsch 
11*0e6b6b59SJacob Faibussowitsch #define PETSC_CUPMBLAS_STATIC_VARIABLE_DEFN(THEIRS, DEVICE, OURS) const decltype(THEIRS) BlasInterfaceImpl<DeviceType::DEVICE>::OURS;
1217f48955SJacob Faibussowitsch 
1317f48955SJacob Faibussowitsch // in case either one or the other don't agree on a name, you can specify all three here:
1417f48955SJacob Faibussowitsch //
1517f48955SJacob Faibussowitsch // PETSC_CUPMBLAS_DEFINE_STATIC_VARIABLE_EXACT(CUBLAS_STATUS_SUCCESS, rocblas_status_success,
1617f48955SJacob Faibussowitsch // CUPMBLAS_STATUS_SUCCESS) ->
1717f48955SJacob Faibussowitsch // const decltype(CUBLAS_STATUS_SUCCESS)  BlasInterface<DeviceType::CUDA>::CUPMBLAS_STATUS_SUCCESS;
1817f48955SJacob Faibussowitsch // const decltype(rocblas_status_success) BlasInterface<DeviceType::HIP>::CUPMBLAS_STATUS_SUCCESS;
1917f48955SJacob Faibussowitsch #define PETSC_CUPMBLAS_DEFINE_STATIC_VARIABLE_EXACT(CUORIGINAL, HIPORIGINAL, OURS) \
209371c9d4SSatish Balay   PetscIfPetscDefined(HAVE_CUDA, PETSC_CUPMBLAS_STATIC_VARIABLE_DEFN, PetscExpandToNothing)(CUORIGINAL, CUDA, OURS) PetscIfPetscDefined(HAVE_HIP, PETSC_CUPMBLAS_STATIC_VARIABLE_DEFN, PetscExpandToNothing)(HIPORIGINAL, HIP, OURS)
2117f48955SJacob Faibussowitsch 
2217f48955SJacob Faibussowitsch // if both cuda and hip agree on the same naming scheme i.e. CUBLAS_STATUS_SUCCESS and
2317f48955SJacob Faibussowitsch // HIPBLAS_STATUS_SUCCESS:
2417f48955SJacob Faibussowitsch //
2517f48955SJacob Faibussowitsch // PETSC_CUPMBLAS_DEFINE_STATIC_VARIABLE_MATCHING_PREFIX(STATUS_SUCCESS) ->
2617f48955SJacob Faibussowitsch // const decltype(CUBLAS_STATUS_SUCCESS)  BlasInterface<DeviceType::CUDA>::CUPMBLAS_STATUS_SUCCESS;
2717f48955SJacob Faibussowitsch // const decltype(HIPBLAS_STATUS_SUCCESS) BlasInterface<DeviceType::HIP>::CUPMBLAS_STATUS_SUCCESS;
289371c9d4SSatish Balay #define PETSC_CUPMBLAS_DEFINE_STATIC_VARIABLE_MATCHING_SCHEME(SUFFIX) PETSC_CUPMBLAS_DEFINE_STATIC_VARIABLE_EXACT(PetscConcat(CUBLAS_, SUFFIX), PetscConcat(HIPBLAS_, SUFFIX), PetscConcat(CUPMBLAS_, SUFFIX))
2917f48955SJacob Faibussowitsch 
3017f48955SJacob Faibussowitsch PETSC_CUPMBLAS_DEFINE_STATIC_VARIABLE_MATCHING_SCHEME(STATUS_SUCCESS)
3117f48955SJacob Faibussowitsch PETSC_CUPMBLAS_DEFINE_STATIC_VARIABLE_MATCHING_SCHEME(STATUS_NOT_INITIALIZED)
3217f48955SJacob Faibussowitsch PETSC_CUPMBLAS_DEFINE_STATIC_VARIABLE_MATCHING_SCHEME(STATUS_ALLOC_FAILED)
33*0e6b6b59SJacob Faibussowitsch PETSC_CUPMBLAS_DEFINE_STATIC_VARIABLE_MATCHING_SCHEME(POINTER_MODE_HOST)
34*0e6b6b59SJacob Faibussowitsch PETSC_CUPMBLAS_DEFINE_STATIC_VARIABLE_MATCHING_SCHEME(POINTER_MODE_DEVICE)
3517f48955SJacob Faibussowitsch 
36*0e6b6b59SJacob Faibussowitsch #if PetscDefined(HAVE_CUDA)
37*0e6b6b59SJacob Faibussowitsch template struct BlasInterface<DeviceType::CUDA>;
38*0e6b6b59SJacob Faibussowitsch #endif
3917f48955SJacob Faibussowitsch 
40*0e6b6b59SJacob Faibussowitsch #if PetscDefined(HAVE_HIP)
41*0e6b6b59SJacob Faibussowitsch template struct BlasInterface<DeviceType::HIP>;
42*0e6b6b59SJacob Faibussowitsch #endif
4317f48955SJacob Faibussowitsch 
44*0e6b6b59SJacob Faibussowitsch } // namespace impl
45*0e6b6b59SJacob Faibussowitsch 
46*0e6b6b59SJacob Faibussowitsch } // namespace cupm
47*0e6b6b59SJacob Faibussowitsch 
48*0e6b6b59SJacob Faibussowitsch } // namespace device
4917f48955SJacob Faibussowitsch 
5017f48955SJacob Faibussowitsch } // namespace Petsc
51