10e6b6b59SJacob Faibussowitsch #ifndef PETSCDEVICE_H 2030f984aSJacob Faibussowitsch #define PETSCDEVICE_H 3030f984aSJacob Faibussowitsch 4030f984aSJacob Faibussowitsch #include <petscdevicetypes.h> 50e6b6b59SJacob Faibussowitsch #include <petscviewertypes.h> 6030f984aSJacob Faibussowitsch 76797ed33SJacob Faibussowitsch #if PETSC_CPP_VERSION >= 11 // C++11 86797ed33SJacob Faibussowitsch #define PETSC_DEVICE_ALIGNOF(...) alignof(decltype(__VA_ARGS__)) 96797ed33SJacob Faibussowitsch #elif PETSC_C_VERSION >= 11 // C11 106797ed33SJacob Faibussowitsch #ifdef __GNUC__ 116797ed33SJacob Faibussowitsch #define PETSC_DEVICE_ALIGNOF(...) _Alignof(__typeof__(__VA_ARGS__)) 126797ed33SJacob Faibussowitsch #else 136797ed33SJacob Faibussowitsch #include <stddef.h> // max_align_t 146797ed33SJacob Faibussowitsch // Note we cannot just do _Alignof(expression) since clang warns that "'_Alignof' applied to an 156797ed33SJacob Faibussowitsch // expression is a GNU extension", so we just default to max_align_t which is ultra safe 166797ed33SJacob Faibussowitsch #define PETSC_DEVICE_ALIGNOF(...) _Alignof(max_align_t) 176797ed33SJacob Faibussowitsch #endif // __GNUC__ 186797ed33SJacob Faibussowitsch #else 196797ed33SJacob Faibussowitsch #define PETSC_DEVICE_ALIGNOF(...) PETSC_MEMALIGN 206797ed33SJacob Faibussowitsch #endif 216797ed33SJacob Faibussowitsch 220e6b6b59SJacob Faibussowitsch /* SUBMANSEC = Sys */ 23030f984aSJacob Faibussowitsch 240e6b6b59SJacob Faibussowitsch // REVIEW ME: this should probably go somewhere better, configure-time? 250e6b6b59SJacob Faibussowitsch #define PETSC_HAVE_HOST 1 26030f984aSJacob Faibussowitsch 270e6b6b59SJacob Faibussowitsch /* logging support */ 280e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscClassId PETSC_DEVICE_CLASSID; 290e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscClassId PETSC_DEVICE_CONTEXT_CLASSID; 30030f984aSJacob Faibussowitsch 31030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceInitializePackage(void); 32030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceFinalizePackage(void); 330e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscGetMemType(const void *, PetscMemType *); 34030f984aSJacob Faibussowitsch 35030f984aSJacob Faibussowitsch /* PetscDevice */ 360e6b6b59SJacob Faibussowitsch #if PetscDefined(HAVE_CXX) 37a4af0ceeSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceCreate(PetscDeviceType, PetscInt, PetscDevice *); 380e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceDestroy(PetscDevice *); 39030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceConfigure(PetscDevice); 40a4af0ceeSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceView(PetscDevice, PetscViewer); 410e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceGetType(PetscDevice, PetscDeviceType *); 4291e63d38SStefano Zampini PETSC_EXTERN PetscErrorCode PetscDeviceGetDeviceId(PetscDevice, PetscInt *); 430e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscDeviceType PETSC_DEVICE_DEFAULT(void); 440e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceSetDefaultDeviceType(PetscDeviceType); 450e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceInitialize(PetscDeviceType); 460e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscBool PetscDeviceInitialized(PetscDeviceType); 470e6b6b59SJacob Faibussowitsch #else 483ba16761SJacob Faibussowitsch #define PetscDeviceCreate(PetscDeviceType, PetscInt, dev) (*(dev) = PETSC_NULLPTR, PETSC_SUCCESS) 493ba16761SJacob Faibussowitsch #define PetscDeviceDestroy(dev) (*(dev) = PETSC_NULLPTR, PETSC_SUCCESS) 503ba16761SJacob Faibussowitsch #define PetscDeviceConfigure(PetscDevice) PETSC_SUCCESS 513ba16761SJacob Faibussowitsch #define PetscDeviceView(PetscDevice, PetscViewer) PETSC_SUCCESS 523ba16761SJacob Faibussowitsch #define PetscDeviceGetType(PetscDevice, type) (*(type) = PETSC_DEVICE_DEFAULT(), PETSC_SUCCESS) 533ba16761SJacob Faibussowitsch #define PetscDeviceGetDeviceId(PetscDevice, id) (*(id) = 0, PETSC_SUCCESS) 540e6b6b59SJacob Faibussowitsch #define PETSC_DEVICE_DEFAULT() PETSC_DEVICE_HOST 553ba16761SJacob Faibussowitsch #define PetscDeviceSetDefaultDeviceType(PetscDeviceType) PETSC_SUCCESS 563ba16761SJacob Faibussowitsch #define PetscDeviceInitialize(PetscDeviceType) PETSC_SUCCESS 570e6b6b59SJacob Faibussowitsch #define PetscDeviceInitialized(dtype) ((dtype) == PETSC_DEVICE_HOST) 580e6b6b59SJacob Faibussowitsch #endif /* PetscDefined(HAVE_CXX) */ 59030f984aSJacob Faibussowitsch 60030f984aSJacob Faibussowitsch /* PetscDeviceContext */ 610e6b6b59SJacob Faibussowitsch #if PetscDefined(HAVE_CXX) 62030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextCreate(PetscDeviceContext *); 63030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextDestroy(PetscDeviceContext *); 64030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextSetStreamType(PetscDeviceContext, PetscStreamType); 65030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextGetStreamType(PetscDeviceContext, PetscStreamType *); 660e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextSetDevice(PetscDeviceContext, PetscDevice); 670e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextGetDevice(PetscDeviceContext, PetscDevice *); 680e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextGetDeviceType(PetscDeviceContext, PetscDeviceType *); 69030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextSetUp(PetscDeviceContext); 70030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextDuplicate(PetscDeviceContext, PetscDeviceContext *); 71030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextQueryIdle(PetscDeviceContext, PetscBool *); 72030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextWaitForContext(PetscDeviceContext, PetscDeviceContext); 730e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextForkWithStreamType(PetscDeviceContext, PetscStreamType, PetscInt, PetscDeviceContext **); 74030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextFork(PetscDeviceContext, PetscInt, PetscDeviceContext **); 75030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextJoin(PetscDeviceContext, PetscInt, PetscDeviceContextJoinMode, PetscDeviceContext **); 76030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextSynchronize(PetscDeviceContext); 770e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextSetFromOptions(MPI_Comm, PetscDeviceContext); 780e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextView(PetscDeviceContext, PetscViewer); 79f9fea11eSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextViewFromOptions(PetscDeviceContext, PetscObject, const char name[]); 80030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextGetCurrentContext(PetscDeviceContext *); 81030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextSetCurrentContext(PetscDeviceContext); 82*31d47070SJunchao Zhang PETSC_EXTERN PetscErrorCode PetscDeviceContextGetStreamHandle(PetscDeviceContext, void *); 83f61c9696SKaushik Kulkarni #else 843ba16761SJacob Faibussowitsch #define PetscDeviceContextCreate(dctx) (*(dctx) = PETSC_NULLPTR, PETSC_SUCCESS) 853ba16761SJacob Faibussowitsch #define PetscDeviceContextDestroy(dctx) (*(dctx) = PETSC_NULLPTR, PETSC_SUCCESS) 863ba16761SJacob Faibussowitsch #define PetscDeviceContextSetStreamType(PetscDeviceContext, PetscStreamType) PETSC_SUCCESS 873ba16761SJacob Faibussowitsch #define PetscDeviceContextGetStreamType(PetscDeviceContext, type) (*(type) = PETSC_STREAM_GLOBAL_BLOCKING, PETSC_SUCCESS) 883ba16761SJacob Faibussowitsch #define PetscDeviceContextSetDevice(PetscDeviceContext, PetscDevice) PETSC_SUCCESS 893ba16761SJacob Faibussowitsch #define PetscDeviceContextGetDevice(PetscDeviceContext, device) (*(device) = PETSC_NULLPTR, PETSC_SUCCESS) 903ba16761SJacob Faibussowitsch #define PetscDeviceContextGetDeviceType(PetscDeviceContext, type) (*(type) = PETSC_DEVICE_DEFAULT(), PETSC_SUCCESS) 913ba16761SJacob Faibussowitsch #define PetscDeviceContextSetUp(PetscDeviceContext) PETSC_SUCCESS 923ba16761SJacob Faibussowitsch #define PetscDeviceContextDuplicate(PetscDeviceContextl, PetscDeviceContextr) (*(PetscDeviceContextr) = PETSC_NULLPTR, PETSC_SUCCESS) 933ba16761SJacob Faibussowitsch #define PetscDeviceContextQueryIdle(PetscDeviceContext, idle) (*(idle) = PETSC_TRUE, PETSC_SUCCESS) 943ba16761SJacob Faibussowitsch #define PetscDeviceContextWaitForContext(PetscDeviceContextl, PetscDeviceContextr) PETSC_SUCCESS 953ba16761SJacob Faibussowitsch #define PetscDeviceContextForkWithStreamType(PetscDeviceContextp, PetscStreamType, PetscInt, PetscDeviceContextc) (*(PetscDeviceContextc) = PETSC_NULLPTR, PETSC_SUCCESS) 963ba16761SJacob Faibussowitsch #define PetscDeviceContextFork(PetscDeviceContextp, PetscInt, PetscDeviceContextc) (*(PetscDeviceContextc) = PETSC_NULLPTR, PETSC_SUCCESS) 973ba16761SJacob Faibussowitsch #define PetscDeviceContextJoin(PetscDeviceContextp, PetscInt, PetscDeviceContextJoinMode, PetscDeviceContextc) (*(PetscDeviceContextc) = PETSC_NULLPTR, PETSC_SUCCESS) 983ba16761SJacob Faibussowitsch #define PetscDeviceContextSynchronize(PetscDeviceContext) PETSC_SUCCESS 993ba16761SJacob Faibussowitsch #define PetscDeviceContextSetFromOptions(MPI_Comm, PetscDeviceContext) PETSC_SUCCESS 1003ba16761SJacob Faibussowitsch #define PetscDeviceContextView(PetscDeviceContext, PetscViewer) PETSC_SUCCESS 1013ba16761SJacob Faibussowitsch #define PetscDeviceContextViewFromOptions(PetscDeviceContext, PetscObject, PetscViewer) PETSC_SUCCESS 1023ba16761SJacob Faibussowitsch #define PetscDeviceContextGetCurrentContext(dctx) (*(dctx) = PETSC_NULLPTR, PETSC_SUCCESS) 1033ba16761SJacob Faibussowitsch #define PetscDeviceContextSetCurrentContext(PetscDeviceContext) PETSC_SUCCESS 104*31d47070SJunchao Zhang #define PetscDeviceContextGetStreamHandle(PetscDeviceContext, handle) (*(handle) = PETSC_NULLPTR, PETSC_SUCCESS) 1050e6b6b59SJacob Faibussowitsch #endif /* PetscDefined(HAVE_CXX) */ 1060e6b6b59SJacob Faibussowitsch 1070e6b6b59SJacob Faibussowitsch /* memory */ 1080e6b6b59SJacob Faibussowitsch #if PetscDefined(HAVE_CXX) 1096797ed33SJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceAllocate_Private(PetscDeviceContext, PetscBool, PetscMemType, size_t, size_t, void **PETSC_RESTRICT); 1106797ed33SJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceDeallocate_Private(PetscDeviceContext, void *PETSC_RESTRICT); 1110e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceMemcpy(PetscDeviceContext, void *PETSC_RESTRICT, const void *PETSC_RESTRICT, size_t); 1120e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceMemset(PetscDeviceContext, void *PETSC_RESTRICT, PetscInt, size_t); 1130e6b6b59SJacob Faibussowitsch #else 1140e6b6b59SJacob Faibussowitsch #include <string.h> // memset() 1156797ed33SJacob Faibussowitsch #define PetscDeviceAllocate_Private(PetscDeviceContext, clear, PetscMemType, size, alignment, ptr) PetscMallocA(1, (clear), __LINE__, PETSC_FUNCTION_NAME, __FILE__, (size), (ptr)) 1166797ed33SJacob Faibussowitsch #define PetscDeviceDeallocate_Private(PetscDeviceContext, ptr) PetscFree((ptr)) 1170e6b6b59SJacob Faibussowitsch #define PetscDeviceMemcpy(PetscDeviceContext, dest, src, size) PetscMemcpy((dest), (src), (size)) 1183ba16761SJacob Faibussowitsch #define PetscDeviceMemset(PetscDeviceContext, ptr, v, size) ((void)memset((ptr), (unsigned char)(v), (size)), PETSC_SUCCESS) 1190e6b6b59SJacob Faibussowitsch #endif /* PetscDefined(HAVE_CXX) */ 1200e6b6b59SJacob Faibussowitsch 1210e6b6b59SJacob Faibussowitsch /*MC 1220e6b6b59SJacob Faibussowitsch PetscDeviceMalloc - Allocate device-aware memory 1230e6b6b59SJacob Faibussowitsch 1240e6b6b59SJacob Faibussowitsch Synopsis: 1250e6b6b59SJacob Faibussowitsch #include <petscdevice.h> 1260e6b6b59SJacob Faibussowitsch PetscErrorCode PetscDeviceMalloc(PetscDeviceContext dctx, PetscMemType mtype, size_t n, Type **ptr) 1270e6b6b59SJacob Faibussowitsch 1280e6b6b59SJacob Faibussowitsch Not Collective, Asynchronous, Auto-dependency aware 1290e6b6b59SJacob Faibussowitsch 1300e6b6b59SJacob Faibussowitsch Input Parameters: 1310e6b6b59SJacob Faibussowitsch + dctx - The `PetscDeviceContext` used to allocate the memory 1320e6b6b59SJacob Faibussowitsch . mtype - The type of memory to allocate 1330e6b6b59SJacob Faibussowitsch - n - The amount (in elements) to allocate 1340e6b6b59SJacob Faibussowitsch 1350e6b6b59SJacob Faibussowitsch Output Parameter: 1360e6b6b59SJacob Faibussowitsch . ptr - The pointer to store the result in 1370e6b6b59SJacob Faibussowitsch 1380e6b6b59SJacob Faibussowitsch Notes: 1396797ed33SJacob Faibussowitsch Memory allocated with this function must be freed with `PetscDeviceFree()`. 1400e6b6b59SJacob Faibussowitsch 1416797ed33SJacob Faibussowitsch If `n` is zero, then `ptr` is set to `PETSC_NULLPTR`. 1426797ed33SJacob Faibussowitsch 1436797ed33SJacob Faibussowitsch This routine falls back to using `PetscMalloc1()` if PETSc was not configured with device 1446797ed33SJacob Faibussowitsch support. The user should note that `mtype` is ignored in this case, as `PetscMalloc1()` 1456797ed33SJacob Faibussowitsch allocates only host memory. 1466797ed33SJacob Faibussowitsch 1476797ed33SJacob Faibussowitsch This routine uses the `sizeof()` of the memory type requested to determine the total memory 1486797ed33SJacob Faibussowitsch to be allocated, therefore you should not multiply the number of elements requested by the 1490e6b6b59SJacob Faibussowitsch `sizeof()` the type\: 1500e6b6b59SJacob Faibussowitsch 1510e6b6b59SJacob Faibussowitsch .vb 1520e6b6b59SJacob Faibussowitsch PetscInt *arr; 1530e6b6b59SJacob Faibussowitsch 1540e6b6b59SJacob Faibussowitsch // correct 1550e6b6b59SJacob Faibussowitsch PetscDeviceMalloc(dctx,PETSC_MEMTYPE_DEVICE,n,&arr); 1560e6b6b59SJacob Faibussowitsch 1570e6b6b59SJacob Faibussowitsch // incorrect 1580e6b6b59SJacob Faibussowitsch PetscDeviceMalloc(dctx,PETSC_MEMTYPE_DEVICE,n*sizeof(*arr),&arr); 1590e6b6b59SJacob Faibussowitsch .ve 1600e6b6b59SJacob Faibussowitsch 1616797ed33SJacob Faibussowitsch Note result stored `ptr` is immediately valid and the user may freely inspect or manipulate 1626797ed33SJacob Faibussowitsch its value on function return, i.e.\: 1636797ed33SJacob Faibussowitsch 1646797ed33SJacob Faibussowitsch .vb 1656797ed33SJacob Faibussowitsch PetscInt *ptr; 1666797ed33SJacob Faibussowitsch 1676797ed33SJacob Faibussowitsch PetscDeviceMalloc(dctx, PETSC_MEMTYPE_DEVICE, 20, &ptr); 1686797ed33SJacob Faibussowitsch 1696797ed33SJacob Faibussowitsch PetscInt *sub_ptr = ptr + 10; // OK, no need to synchronize 1706797ed33SJacob Faibussowitsch 1716797ed33SJacob Faibussowitsch ptr[0] = 10; // ERROR, directly accessing contents of ptr is undefined until synchronization 1726797ed33SJacob Faibussowitsch .ve 1736797ed33SJacob Faibussowitsch 1746797ed33SJacob Faibussowitsch DAG representation: 1756797ed33SJacob Faibussowitsch .vb 1766797ed33SJacob Faibussowitsch time -> 1776797ed33SJacob Faibussowitsch 1786797ed33SJacob Faibussowitsch -> dctx - |= CALL =| -\- dctx --> 1796797ed33SJacob Faibussowitsch \- ptr -> 1806797ed33SJacob Faibussowitsch .ve 1810e6b6b59SJacob Faibussowitsch 1820e6b6b59SJacob Faibussowitsch Level: beginner 1830e6b6b59SJacob Faibussowitsch 1840e6b6b59SJacob Faibussowitsch .N ASYNC_API 1850e6b6b59SJacob Faibussowitsch 1860e6b6b59SJacob Faibussowitsch .seealso: `PetscDeviceFree()`, `PetscDeviceCalloc()`, `PetscDeviceArrayCopy()`, 1876797ed33SJacob Faibussowitsch `PetscDeviceArrayZero()` 1880e6b6b59SJacob Faibussowitsch M*/ 1896797ed33SJacob Faibussowitsch #define PetscDeviceMalloc(dctx, mtype, n, ptr) PetscDeviceAllocate_Private((dctx), PETSC_FALSE, (mtype), (size_t)(n) * sizeof(**(ptr)), PETSC_DEVICE_ALIGNOF(**(ptr)), (void **)(ptr)) 1900e6b6b59SJacob Faibussowitsch 1910e6b6b59SJacob Faibussowitsch /*MC 1920e6b6b59SJacob Faibussowitsch PetscDeviceCalloc - Allocate zeroed device-aware memory 1930e6b6b59SJacob Faibussowitsch 1940e6b6b59SJacob Faibussowitsch Synopsis: 1950e6b6b59SJacob Faibussowitsch #include <petscdevice.h> 1960e6b6b59SJacob Faibussowitsch PetscErrorCode PetscDeviceCalloc(PetscDeviceContext dctx, PetscMemType mtype, size_t n, Type **ptr) 1970e6b6b59SJacob Faibussowitsch 1980e6b6b59SJacob Faibussowitsch Not Collective, Asynchronous, Auto-dependency aware 1990e6b6b59SJacob Faibussowitsch 2000e6b6b59SJacob Faibussowitsch Input Parameters: 2010e6b6b59SJacob Faibussowitsch + dctx - The `PetscDeviceContext` used to allocate the memory 2020e6b6b59SJacob Faibussowitsch . mtype - The type of memory to allocate 2030e6b6b59SJacob Faibussowitsch - n - The amount (in elements) to allocate 2040e6b6b59SJacob Faibussowitsch 2050e6b6b59SJacob Faibussowitsch Output Parameter: 2060e6b6b59SJacob Faibussowitsch . ptr - The pointer to store the result in 2070e6b6b59SJacob Faibussowitsch 2080e6b6b59SJacob Faibussowitsch Notes: 2090e6b6b59SJacob Faibussowitsch Has identical usage to `PetscDeviceMalloc()` except that the memory is zeroed before it is 2100e6b6b59SJacob Faibussowitsch returned. See `PetscDeviceMalloc()` for further discussion. 2110e6b6b59SJacob Faibussowitsch 2120e6b6b59SJacob Faibussowitsch This routine falls back to using `PetscCalloc1()` if PETSc was not configured with device 2130e6b6b59SJacob Faibussowitsch support. The user should note that `mtype` is ignored in this case, as `PetscCalloc1()` 2140e6b6b59SJacob Faibussowitsch allocates only host memory. 2150e6b6b59SJacob Faibussowitsch 2160e6b6b59SJacob Faibussowitsch Level: beginner 2170e6b6b59SJacob Faibussowitsch 2180e6b6b59SJacob Faibussowitsch .N ASYNC_API 2190e6b6b59SJacob Faibussowitsch 2200e6b6b59SJacob Faibussowitsch .seealso: `PetscDeviceFree()`, `PetscDeviceMalloc()`, `PetscDeviceArrayCopy()`, 2216797ed33SJacob Faibussowitsch `PetscDeviceArrayZero()` 2220e6b6b59SJacob Faibussowitsch M*/ 2236797ed33SJacob Faibussowitsch #define PetscDeviceCalloc(dctx, mtype, n, ptr) PetscDeviceAllocate_Private((dctx), PETSC_TRUE, (mtype), (size_t)(n) * sizeof(**(ptr)), PETSC_DEVICE_ALIGNOF(**(ptr)), (void **)(ptr)) 2240e6b6b59SJacob Faibussowitsch 2250e6b6b59SJacob Faibussowitsch /*MC 2260e6b6b59SJacob Faibussowitsch PetscDeviceFree - Free device-aware memory 2270e6b6b59SJacob Faibussowitsch 2280e6b6b59SJacob Faibussowitsch Synopsis: 2290e6b6b59SJacob Faibussowitsch #include <petscdevice.h> 2300e6b6b59SJacob Faibussowitsch PetscErrorCode PetscDeviceFree(PetscDeviceContext dctx, void *ptr) 2310e6b6b59SJacob Faibussowitsch 2320e6b6b59SJacob Faibussowitsch Not Collective, Asynchronous, Auto-dependency aware 2330e6b6b59SJacob Faibussowitsch 2340e6b6b59SJacob Faibussowitsch Input Parameters: 2350e6b6b59SJacob Faibussowitsch + dctx - The `PetscDeviceContext` used to free the memory 2360e6b6b59SJacob Faibussowitsch - ptr - The pointer to free 2370e6b6b59SJacob Faibussowitsch 2380e6b6b59SJacob Faibussowitsch Notes: 2396797ed33SJacob Faibussowitsch `ptr` may be `NULL`, and is set to `PETSC_NULLPTR` on successful deallocation. 2400e6b6b59SJacob Faibussowitsch 2416797ed33SJacob Faibussowitsch `ptr` must have been allocated using `PetscDeviceMalloc()`, `PetscDeviceCalloc()`. 2420e6b6b59SJacob Faibussowitsch 2430e6b6b59SJacob Faibussowitsch This routine falls back to using `PetscFree()` if PETSc was not configured with device 2440e6b6b59SJacob Faibussowitsch support. The user should note that `PetscFree()` frees only host memory. 2450e6b6b59SJacob Faibussowitsch 2466797ed33SJacob Faibussowitsch DAG representation: 2476797ed33SJacob Faibussowitsch .vb 2486797ed33SJacob Faibussowitsch time -> 2496797ed33SJacob Faibussowitsch 2506797ed33SJacob Faibussowitsch -> dctx -/- |= CALL =| - dctx -> 2516797ed33SJacob Faibussowitsch -> ptr -/ 2526797ed33SJacob Faibussowitsch .ve 2530e6b6b59SJacob Faibussowitsch 2540e6b6b59SJacob Faibussowitsch Level: beginner 2550e6b6b59SJacob Faibussowitsch 2560e6b6b59SJacob Faibussowitsch .N ASYNC_API 2570e6b6b59SJacob Faibussowitsch 2586797ed33SJacob Faibussowitsch .seealso: `PetscDeviceMalloc()`, `PetscDeviceCalloc()` 2590e6b6b59SJacob Faibussowitsch M*/ 2603ba16761SJacob Faibussowitsch #define PetscDeviceFree(dctx, ptr) ((PetscErrorCode)(PetscDeviceDeallocate_Private((dctx), (ptr)) || ((ptr) = PETSC_NULLPTR, PETSC_SUCCESS))) 2610e6b6b59SJacob Faibussowitsch 2620e6b6b59SJacob Faibussowitsch /*MC 2630e6b6b59SJacob Faibussowitsch PetscDeviceArrayCopy - Copy memory in a device-aware manner 2640e6b6b59SJacob Faibussowitsch 2650e6b6b59SJacob Faibussowitsch Synopsis: 2660e6b6b59SJacob Faibussowitsch #include <petscdevice.h> 2676bc29738SJacob Faibussowitsch PetscErrorCode PetscDeviceArrayCopy(PetscDeviceContext dctx, void *dest, const void *src, size_t n) 2680e6b6b59SJacob Faibussowitsch 2690e6b6b59SJacob Faibussowitsch Not Collective, Asynchronous, Auto-dependency aware 2700e6b6b59SJacob Faibussowitsch 2710e6b6b59SJacob Faibussowitsch Input Parameters: 2720e6b6b59SJacob Faibussowitsch + dctx - The `PetscDeviceContext` used to copy the memory 2730e6b6b59SJacob Faibussowitsch . dest - The pointer to copy to 2740e6b6b59SJacob Faibussowitsch . src - The pointer to copy from 2750e6b6b59SJacob Faibussowitsch - n - The amount (in elements) to copy 2760e6b6b59SJacob Faibussowitsch 2770e6b6b59SJacob Faibussowitsch Notes: 2780e6b6b59SJacob Faibussowitsch Both `dest` and `src` must have been allocated using any of `PetscDeviceMalloc()`, 2796797ed33SJacob Faibussowitsch `PetscDeviceCalloc()`. 2800e6b6b59SJacob Faibussowitsch 2810e6b6b59SJacob Faibussowitsch This uses the `sizeof()` of the `src` memory type requested to determine the total memory to 2820e6b6b59SJacob Faibussowitsch be copied, therefore you should not multiply the number of elements by the `sizeof()` the 2830e6b6b59SJacob Faibussowitsch type\: 2840e6b6b59SJacob Faibussowitsch 2850e6b6b59SJacob Faibussowitsch .vb 2860e6b6b59SJacob Faibussowitsch PetscInt *to,*from; 2870e6b6b59SJacob Faibussowitsch 2880e6b6b59SJacob Faibussowitsch // correct 2896bc29738SJacob Faibussowitsch PetscDeviceArrayCopy(dctx,to,from,n); 2900e6b6b59SJacob Faibussowitsch 2910e6b6b59SJacob Faibussowitsch // incorrect 2926bc29738SJacob Faibussowitsch PetscDeviceArrayCopy(dctx,to,from,n*sizeof(*from)); 2930e6b6b59SJacob Faibussowitsch .ve 2940e6b6b59SJacob Faibussowitsch 2950e6b6b59SJacob Faibussowitsch See `PetscDeviceMemcpy()` for further discussion. 2960e6b6b59SJacob Faibussowitsch 2970e6b6b59SJacob Faibussowitsch Level: beginner 2980e6b6b59SJacob Faibussowitsch 2990e6b6b59SJacob Faibussowitsch .N ASYNC_API 3000e6b6b59SJacob Faibussowitsch 3016797ed33SJacob Faibussowitsch .seealso: `PetscDeviceMalloc()`, `PetscDeviceCalloc()`, `PetscDeviceFree()`, 3026797ed33SJacob Faibussowitsch `PetscDeviceArrayZero()`, `PetscDeviceMemcpy()` 3030e6b6b59SJacob Faibussowitsch M*/ 3046797ed33SJacob Faibussowitsch #define PetscDeviceArrayCopy(dctx, dest, src, n) PetscDeviceMemcpy((dctx), (dest), (src), (size_t)(n) * sizeof(*(src))) 3050e6b6b59SJacob Faibussowitsch 3060e6b6b59SJacob Faibussowitsch /*MC 3070e6b6b59SJacob Faibussowitsch PetscDeviceArrayZero - Zero memory in a device-aware manner 3080e6b6b59SJacob Faibussowitsch 3090e6b6b59SJacob Faibussowitsch Synopsis: 3100e6b6b59SJacob Faibussowitsch #include <petscdevice.h> 3116bc29738SJacob Faibussowitsch PetscErrorCode PetscDeviceArrayZero(PetscDeviceContext dctx, void *ptr, size_t n) 3120e6b6b59SJacob Faibussowitsch 3130e6b6b59SJacob Faibussowitsch Not Collective, Asynchronous, Auto-dependency aware 3140e6b6b59SJacob Faibussowitsch 3150e6b6b59SJacob Faibussowitsch Input Parameters: 3160e6b6b59SJacob Faibussowitsch + dctx - The `PetscDeviceContext` used to zero the memory 3170e6b6b59SJacob Faibussowitsch . ptr - The pointer to the memory 3180e6b6b59SJacob Faibussowitsch - n - The amount (in elements) to zero 3190e6b6b59SJacob Faibussowitsch 3200e6b6b59SJacob Faibussowitsch Notes: 3216797ed33SJacob Faibussowitsch `ptr` must have been allocated using `PetscDeviceMalloc()` or `PetscDeviceCalloc()`. 3220e6b6b59SJacob Faibussowitsch 3230e6b6b59SJacob Faibussowitsch This uses the `sizeof()` of the memory type requested to determine the total memory to be 3240e6b6b59SJacob Faibussowitsch zeroed, therefore you should not multiply the number of elements by the `sizeof()` the type\: 3250e6b6b59SJacob Faibussowitsch 3260e6b6b59SJacob Faibussowitsch .vb 3270e6b6b59SJacob Faibussowitsch PetscInt *ptr; 3280e6b6b59SJacob Faibussowitsch 3290e6b6b59SJacob Faibussowitsch // correct 3306bc29738SJacob Faibussowitsch PetscDeviceArrayZero(dctx,ptr,n); 3310e6b6b59SJacob Faibussowitsch 3320e6b6b59SJacob Faibussowitsch // incorrect 3336bc29738SJacob Faibussowitsch PetscDeviceArrayZero(dctx,ptr,n*sizeof(*ptr)); 3340e6b6b59SJacob Faibussowitsch .ve 3350e6b6b59SJacob Faibussowitsch 336d5b43468SJose E. Roman See `PetscDeviceMemset()` for further discussion. 3370e6b6b59SJacob Faibussowitsch 3380e6b6b59SJacob Faibussowitsch Level: beginner 3390e6b6b59SJacob Faibussowitsch 3400e6b6b59SJacob Faibussowitsch .N ASYNC_API 3410e6b6b59SJacob Faibussowitsch 3426797ed33SJacob Faibussowitsch .seealso: `PetscDeviceMalloc()`, `PetscDeviceCalloc()`, `PetscDeviceFree()`, 3436797ed33SJacob Faibussowitsch `PetscDeviceArrayCopy()`, `PetscDeviceMemset()` 3440e6b6b59SJacob Faibussowitsch M*/ 3456797ed33SJacob Faibussowitsch #define PetscDeviceArrayZero(dctx, ptr, n) PetscDeviceMemset((dctx), (ptr), 0, (size_t)(n) * sizeof(*(ptr))) 34698921bdaSJacob Faibussowitsch 347030f984aSJacob Faibussowitsch #endif /* PETSCDEVICE_H */ 348