1a4963045SJacob Faibussowitsch #pragma once 2030f984aSJacob Faibussowitsch 3030f984aSJacob Faibussowitsch #include <petscdevicetypes.h> 40e6b6b59SJacob Faibussowitsch #include <petscviewertypes.h> 5030f984aSJacob Faibussowitsch 66797ed33SJacob Faibussowitsch #if PETSC_CPP_VERSION >= 11 // C++11 76797ed33SJacob Faibussowitsch #define PETSC_DEVICE_ALIGNOF(...) alignof(decltype(__VA_ARGS__)) 86797ed33SJacob Faibussowitsch #elif PETSC_C_VERSION >= 11 // C11 96797ed33SJacob Faibussowitsch #ifdef __GNUC__ 106797ed33SJacob Faibussowitsch #define PETSC_DEVICE_ALIGNOF(...) _Alignof(__typeof__(__VA_ARGS__)) 116797ed33SJacob Faibussowitsch #else 126797ed33SJacob Faibussowitsch #include <stddef.h> // max_align_t 136797ed33SJacob Faibussowitsch // Note we cannot just do _Alignof(expression) since clang warns that "'_Alignof' applied to an 146797ed33SJacob Faibussowitsch // expression is a GNU extension", so we just default to max_align_t which is ultra safe 156797ed33SJacob Faibussowitsch #define PETSC_DEVICE_ALIGNOF(...) _Alignof(max_align_t) 166797ed33SJacob Faibussowitsch #endif // __GNUC__ 176797ed33SJacob Faibussowitsch #else 186797ed33SJacob Faibussowitsch #define PETSC_DEVICE_ALIGNOF(...) PETSC_MEMALIGN 196797ed33SJacob Faibussowitsch #endif 206797ed33SJacob Faibussowitsch 210e6b6b59SJacob Faibussowitsch /* SUBMANSEC = Sys */ 22030f984aSJacob Faibussowitsch 230e6b6b59SJacob Faibussowitsch // REVIEW ME: this should probably go somewhere better, configure-time? 240e6b6b59SJacob Faibussowitsch #define PETSC_HAVE_HOST 1 25030f984aSJacob Faibussowitsch 260e6b6b59SJacob Faibussowitsch /* logging support */ 270e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscClassId PETSC_DEVICE_CLASSID; 280e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscClassId PETSC_DEVICE_CONTEXT_CLASSID; 29030f984aSJacob Faibussowitsch 30030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceInitializePackage(void); 31030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceFinalizePackage(void); 320e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscGetMemType(const void *, PetscMemType *); 33030f984aSJacob Faibussowitsch 34030f984aSJacob Faibussowitsch /* PetscDevice */ 350e6b6b59SJacob Faibussowitsch #if PetscDefined(HAVE_CXX) 36a4af0ceeSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceCreate(PetscDeviceType, PetscInt, PetscDevice *); 370e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceDestroy(PetscDevice *); 38030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceConfigure(PetscDevice); 39a4af0ceeSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceView(PetscDevice, PetscViewer); 400e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceGetType(PetscDevice, PetscDeviceType *); 4191e63d38SStefano Zampini PETSC_EXTERN PetscErrorCode PetscDeviceGetDeviceId(PetscDevice, PetscInt *); 420e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscDeviceType PETSC_DEVICE_DEFAULT(void); 430e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceSetDefaultDeviceType(PetscDeviceType); 440e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceInitialize(PetscDeviceType); 450e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscBool PetscDeviceInitialized(PetscDeviceType); 460e6b6b59SJacob Faibussowitsch #else 473ba16761SJacob Faibussowitsch #define PetscDeviceCreate(PetscDeviceType, PetscInt, dev) (*(dev) = PETSC_NULLPTR, PETSC_SUCCESS) 483ba16761SJacob Faibussowitsch #define PetscDeviceDestroy(dev) (*(dev) = PETSC_NULLPTR, PETSC_SUCCESS) 493ba16761SJacob Faibussowitsch #define PetscDeviceConfigure(PetscDevice) PETSC_SUCCESS 503ba16761SJacob Faibussowitsch #define PetscDeviceView(PetscDevice, PetscViewer) PETSC_SUCCESS 513ba16761SJacob Faibussowitsch #define PetscDeviceGetType(PetscDevice, type) (*(type) = PETSC_DEVICE_DEFAULT(), PETSC_SUCCESS) 523ba16761SJacob Faibussowitsch #define PetscDeviceGetDeviceId(PetscDevice, id) (*(id) = 0, PETSC_SUCCESS) 530e6b6b59SJacob Faibussowitsch #define PETSC_DEVICE_DEFAULT() PETSC_DEVICE_HOST 543ba16761SJacob Faibussowitsch #define PetscDeviceSetDefaultDeviceType(PetscDeviceType) PETSC_SUCCESS 553ba16761SJacob Faibussowitsch #define PetscDeviceInitialize(PetscDeviceType) PETSC_SUCCESS 560e6b6b59SJacob Faibussowitsch #define PetscDeviceInitialized(dtype) ((dtype) == PETSC_DEVICE_HOST) 570e6b6b59SJacob Faibussowitsch #endif /* PetscDefined(HAVE_CXX) */ 58030f984aSJacob Faibussowitsch 59030f984aSJacob Faibussowitsch /* PetscDeviceContext */ 600e6b6b59SJacob Faibussowitsch #if PetscDefined(HAVE_CXX) 61030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextCreate(PetscDeviceContext *); 62030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextDestroy(PetscDeviceContext *); 63030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextSetStreamType(PetscDeviceContext, PetscStreamType); 64030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextGetStreamType(PetscDeviceContext, PetscStreamType *); 650e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextSetDevice(PetscDeviceContext, PetscDevice); 660e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextGetDevice(PetscDeviceContext, PetscDevice *); 670e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextGetDeviceType(PetscDeviceContext, PetscDeviceType *); 68030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextSetUp(PetscDeviceContext); 69030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextDuplicate(PetscDeviceContext, PetscDeviceContext *); 70030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextQueryIdle(PetscDeviceContext, PetscBool *); 71030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextWaitForContext(PetscDeviceContext, PetscDeviceContext); 720e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextForkWithStreamType(PetscDeviceContext, PetscStreamType, PetscInt, PetscDeviceContext **); 73030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextFork(PetscDeviceContext, PetscInt, PetscDeviceContext **); 74030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextJoin(PetscDeviceContext, PetscInt, PetscDeviceContextJoinMode, PetscDeviceContext **); 75030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextSynchronize(PetscDeviceContext); 760e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextSetFromOptions(MPI_Comm, PetscDeviceContext); 770e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextView(PetscDeviceContext, PetscViewer); 78f9fea11eSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextViewFromOptions(PetscDeviceContext, PetscObject, const char name[]); 79030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextGetCurrentContext(PetscDeviceContext *); 80030f984aSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextSetCurrentContext(PetscDeviceContext); 81*8a4d221bSJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceContextGetStreamHandle(PetscDeviceContext, void **); 82f61c9696SKaushik Kulkarni #else 833ba16761SJacob Faibussowitsch #define PetscDeviceContextCreate(dctx) (*(dctx) = PETSC_NULLPTR, PETSC_SUCCESS) 843ba16761SJacob Faibussowitsch #define PetscDeviceContextDestroy(dctx) (*(dctx) = PETSC_NULLPTR, PETSC_SUCCESS) 853ba16761SJacob Faibussowitsch #define PetscDeviceContextSetStreamType(PetscDeviceContext, PetscStreamType) PETSC_SUCCESS 863ba16761SJacob Faibussowitsch #define PetscDeviceContextGetStreamType(PetscDeviceContext, type) (*(type) = PETSC_STREAM_GLOBAL_BLOCKING, PETSC_SUCCESS) 873ba16761SJacob Faibussowitsch #define PetscDeviceContextSetDevice(PetscDeviceContext, PetscDevice) PETSC_SUCCESS 883ba16761SJacob Faibussowitsch #define PetscDeviceContextGetDevice(PetscDeviceContext, device) (*(device) = PETSC_NULLPTR, PETSC_SUCCESS) 893ba16761SJacob Faibussowitsch #define PetscDeviceContextGetDeviceType(PetscDeviceContext, type) (*(type) = PETSC_DEVICE_DEFAULT(), PETSC_SUCCESS) 903ba16761SJacob Faibussowitsch #define PetscDeviceContextSetUp(PetscDeviceContext) PETSC_SUCCESS 913ba16761SJacob Faibussowitsch #define PetscDeviceContextDuplicate(PetscDeviceContextl, PetscDeviceContextr) (*(PetscDeviceContextr) = PETSC_NULLPTR, PETSC_SUCCESS) 923ba16761SJacob Faibussowitsch #define PetscDeviceContextQueryIdle(PetscDeviceContext, idle) (*(idle) = PETSC_TRUE, PETSC_SUCCESS) 933ba16761SJacob Faibussowitsch #define PetscDeviceContextWaitForContext(PetscDeviceContextl, PetscDeviceContextr) PETSC_SUCCESS 943ba16761SJacob Faibussowitsch #define PetscDeviceContextForkWithStreamType(PetscDeviceContextp, PetscStreamType, PetscInt, PetscDeviceContextc) (*(PetscDeviceContextc) = PETSC_NULLPTR, PETSC_SUCCESS) 953ba16761SJacob Faibussowitsch #define PetscDeviceContextFork(PetscDeviceContextp, PetscInt, PetscDeviceContextc) (*(PetscDeviceContextc) = PETSC_NULLPTR, PETSC_SUCCESS) 963ba16761SJacob Faibussowitsch #define PetscDeviceContextJoin(PetscDeviceContextp, PetscInt, PetscDeviceContextJoinMode, PetscDeviceContextc) (*(PetscDeviceContextc) = PETSC_NULLPTR, PETSC_SUCCESS) 973ba16761SJacob Faibussowitsch #define PetscDeviceContextSynchronize(PetscDeviceContext) PETSC_SUCCESS 983ba16761SJacob Faibussowitsch #define PetscDeviceContextSetFromOptions(MPI_Comm, PetscDeviceContext) PETSC_SUCCESS 993ba16761SJacob Faibussowitsch #define PetscDeviceContextView(PetscDeviceContext, PetscViewer) PETSC_SUCCESS 1003ba16761SJacob Faibussowitsch #define PetscDeviceContextViewFromOptions(PetscDeviceContext, PetscObject, PetscViewer) PETSC_SUCCESS 1013ba16761SJacob Faibussowitsch #define PetscDeviceContextGetCurrentContext(dctx) (*(dctx) = PETSC_NULLPTR, PETSC_SUCCESS) 1023ba16761SJacob Faibussowitsch #define PetscDeviceContextSetCurrentContext(PetscDeviceContext) PETSC_SUCCESS 10331d47070SJunchao Zhang #define PetscDeviceContextGetStreamHandle(PetscDeviceContext, handle) (*(handle) = PETSC_NULLPTR, PETSC_SUCCESS) 1040e6b6b59SJacob Faibussowitsch #endif /* PetscDefined(HAVE_CXX) */ 1050e6b6b59SJacob Faibussowitsch 1060e6b6b59SJacob Faibussowitsch /* memory */ 1070e6b6b59SJacob Faibussowitsch #if PetscDefined(HAVE_CXX) 1086797ed33SJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceAllocate_Private(PetscDeviceContext, PetscBool, PetscMemType, size_t, size_t, void **PETSC_RESTRICT); 1096797ed33SJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceDeallocate_Private(PetscDeviceContext, void *PETSC_RESTRICT); 1100e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceMemcpy(PetscDeviceContext, void *PETSC_RESTRICT, const void *PETSC_RESTRICT, size_t); 1110e6b6b59SJacob Faibussowitsch PETSC_EXTERN PetscErrorCode PetscDeviceMemset(PetscDeviceContext, void *PETSC_RESTRICT, PetscInt, size_t); 1120e6b6b59SJacob Faibussowitsch #else 1130e6b6b59SJacob Faibussowitsch #include <string.h> // memset() 1146797ed33SJacob Faibussowitsch #define PetscDeviceAllocate_Private(PetscDeviceContext, clear, PetscMemType, size, alignment, ptr) PetscMallocA(1, (clear), __LINE__, PETSC_FUNCTION_NAME, __FILE__, (size), (ptr)) 1156797ed33SJacob Faibussowitsch #define PetscDeviceDeallocate_Private(PetscDeviceContext, ptr) PetscFree((ptr)) 1160e6b6b59SJacob Faibussowitsch #define PetscDeviceMemcpy(PetscDeviceContext, dest, src, size) PetscMemcpy((dest), (src), (size)) 1173ba16761SJacob Faibussowitsch #define PetscDeviceMemset(PetscDeviceContext, ptr, v, size) ((void)memset((ptr), (unsigned char)(v), (size)), PETSC_SUCCESS) 1180e6b6b59SJacob Faibussowitsch #endif /* PetscDefined(HAVE_CXX) */ 1190e6b6b59SJacob Faibussowitsch 1200e6b6b59SJacob Faibussowitsch /*MC 1210e6b6b59SJacob Faibussowitsch PetscDeviceMalloc - Allocate device-aware memory 1220e6b6b59SJacob Faibussowitsch 1230e6b6b59SJacob Faibussowitsch Synopsis: 1240e6b6b59SJacob Faibussowitsch #include <petscdevice.h> 1250e6b6b59SJacob Faibussowitsch PetscErrorCode PetscDeviceMalloc(PetscDeviceContext dctx, PetscMemType mtype, size_t n, Type **ptr) 1260e6b6b59SJacob Faibussowitsch 1270e6b6b59SJacob Faibussowitsch Not Collective, Asynchronous, Auto-dependency aware 1280e6b6b59SJacob Faibussowitsch 1290e6b6b59SJacob Faibussowitsch Input Parameters: 1300e6b6b59SJacob Faibussowitsch + dctx - The `PetscDeviceContext` used to allocate the memory 1310e6b6b59SJacob Faibussowitsch . mtype - The type of memory to allocate 1320e6b6b59SJacob Faibussowitsch - n - The amount (in elements) to allocate 1330e6b6b59SJacob Faibussowitsch 1340e6b6b59SJacob Faibussowitsch Output Parameter: 1350e6b6b59SJacob Faibussowitsch . ptr - The pointer to store the result in 1360e6b6b59SJacob Faibussowitsch 1370e6b6b59SJacob Faibussowitsch Notes: 1386797ed33SJacob Faibussowitsch Memory allocated with this function must be freed with `PetscDeviceFree()`. 1390e6b6b59SJacob Faibussowitsch 1406797ed33SJacob Faibussowitsch If `n` is zero, then `ptr` is set to `PETSC_NULLPTR`. 1416797ed33SJacob Faibussowitsch 1426797ed33SJacob Faibussowitsch This routine falls back to using `PetscMalloc1()` if PETSc was not configured with device 1436797ed33SJacob Faibussowitsch support. The user should note that `mtype` is ignored in this case, as `PetscMalloc1()` 1446797ed33SJacob Faibussowitsch allocates only host memory. 1456797ed33SJacob Faibussowitsch 1466797ed33SJacob Faibussowitsch This routine uses the `sizeof()` of the memory type requested to determine the total memory 1476797ed33SJacob Faibussowitsch to be allocated, therefore you should not multiply the number of elements requested by the 1480e6b6b59SJacob Faibussowitsch `sizeof()` the type\: 1490e6b6b59SJacob Faibussowitsch 1500e6b6b59SJacob Faibussowitsch .vb 1510e6b6b59SJacob Faibussowitsch PetscInt *arr; 1520e6b6b59SJacob Faibussowitsch 1530e6b6b59SJacob Faibussowitsch // correct 1540e6b6b59SJacob Faibussowitsch PetscDeviceMalloc(dctx,PETSC_MEMTYPE_DEVICE,n,&arr); 1550e6b6b59SJacob Faibussowitsch 1560e6b6b59SJacob Faibussowitsch // incorrect 1570e6b6b59SJacob Faibussowitsch PetscDeviceMalloc(dctx,PETSC_MEMTYPE_DEVICE,n*sizeof(*arr),&arr); 1580e6b6b59SJacob Faibussowitsch .ve 1590e6b6b59SJacob Faibussowitsch 1606797ed33SJacob Faibussowitsch Note result stored `ptr` is immediately valid and the user may freely inspect or manipulate 1616797ed33SJacob Faibussowitsch its value on function return, i.e.\: 1626797ed33SJacob Faibussowitsch 1636797ed33SJacob Faibussowitsch .vb 1646797ed33SJacob Faibussowitsch PetscInt *ptr; 1656797ed33SJacob Faibussowitsch 1666797ed33SJacob Faibussowitsch PetscDeviceMalloc(dctx, PETSC_MEMTYPE_DEVICE, 20, &ptr); 1676797ed33SJacob Faibussowitsch 1686797ed33SJacob Faibussowitsch PetscInt *sub_ptr = ptr + 10; // OK, no need to synchronize 1696797ed33SJacob Faibussowitsch 1706797ed33SJacob Faibussowitsch ptr[0] = 10; // ERROR, directly accessing contents of ptr is undefined until synchronization 1716797ed33SJacob Faibussowitsch .ve 1726797ed33SJacob Faibussowitsch 1736797ed33SJacob Faibussowitsch DAG representation: 1746797ed33SJacob Faibussowitsch .vb 1756797ed33SJacob Faibussowitsch time -> 1766797ed33SJacob Faibussowitsch 1776797ed33SJacob Faibussowitsch -> dctx - |= CALL =| -\- dctx --> 1786797ed33SJacob Faibussowitsch \- ptr -> 1796797ed33SJacob Faibussowitsch .ve 1800e6b6b59SJacob Faibussowitsch 1810e6b6b59SJacob Faibussowitsch Level: beginner 1820e6b6b59SJacob Faibussowitsch 1830e6b6b59SJacob Faibussowitsch .N ASYNC_API 1840e6b6b59SJacob Faibussowitsch 1850e6b6b59SJacob Faibussowitsch .seealso: `PetscDeviceFree()`, `PetscDeviceCalloc()`, `PetscDeviceArrayCopy()`, 1866797ed33SJacob Faibussowitsch `PetscDeviceArrayZero()` 1870e6b6b59SJacob Faibussowitsch M*/ 1886797ed33SJacob Faibussowitsch #define PetscDeviceMalloc(dctx, mtype, n, ptr) PetscDeviceAllocate_Private((dctx), PETSC_FALSE, (mtype), (size_t)(n) * sizeof(**(ptr)), PETSC_DEVICE_ALIGNOF(**(ptr)), (void **)(ptr)) 1890e6b6b59SJacob Faibussowitsch 1900e6b6b59SJacob Faibussowitsch /*MC 1910e6b6b59SJacob Faibussowitsch PetscDeviceCalloc - Allocate zeroed device-aware memory 1920e6b6b59SJacob Faibussowitsch 1930e6b6b59SJacob Faibussowitsch Synopsis: 1940e6b6b59SJacob Faibussowitsch #include <petscdevice.h> 1950e6b6b59SJacob Faibussowitsch PetscErrorCode PetscDeviceCalloc(PetscDeviceContext dctx, PetscMemType mtype, size_t n, Type **ptr) 1960e6b6b59SJacob Faibussowitsch 1970e6b6b59SJacob Faibussowitsch Not Collective, Asynchronous, Auto-dependency aware 1980e6b6b59SJacob Faibussowitsch 1990e6b6b59SJacob Faibussowitsch Input Parameters: 2000e6b6b59SJacob Faibussowitsch + dctx - The `PetscDeviceContext` used to allocate the memory 2010e6b6b59SJacob Faibussowitsch . mtype - The type of memory to allocate 2020e6b6b59SJacob Faibussowitsch - n - The amount (in elements) to allocate 2030e6b6b59SJacob Faibussowitsch 2040e6b6b59SJacob Faibussowitsch Output Parameter: 2050e6b6b59SJacob Faibussowitsch . ptr - The pointer to store the result in 2060e6b6b59SJacob Faibussowitsch 2070e6b6b59SJacob Faibussowitsch Notes: 2080e6b6b59SJacob Faibussowitsch Has identical usage to `PetscDeviceMalloc()` except that the memory is zeroed before it is 2090e6b6b59SJacob Faibussowitsch returned. See `PetscDeviceMalloc()` for further discussion. 2100e6b6b59SJacob Faibussowitsch 2110e6b6b59SJacob Faibussowitsch This routine falls back to using `PetscCalloc1()` if PETSc was not configured with device 2120e6b6b59SJacob Faibussowitsch support. The user should note that `mtype` is ignored in this case, as `PetscCalloc1()` 2130e6b6b59SJacob Faibussowitsch allocates only host memory. 2140e6b6b59SJacob Faibussowitsch 2150e6b6b59SJacob Faibussowitsch Level: beginner 2160e6b6b59SJacob Faibussowitsch 2170e6b6b59SJacob Faibussowitsch .N ASYNC_API 2180e6b6b59SJacob Faibussowitsch 2190e6b6b59SJacob Faibussowitsch .seealso: `PetscDeviceFree()`, `PetscDeviceMalloc()`, `PetscDeviceArrayCopy()`, 2206797ed33SJacob Faibussowitsch `PetscDeviceArrayZero()` 2210e6b6b59SJacob Faibussowitsch M*/ 2226797ed33SJacob Faibussowitsch #define PetscDeviceCalloc(dctx, mtype, n, ptr) PetscDeviceAllocate_Private((dctx), PETSC_TRUE, (mtype), (size_t)(n) * sizeof(**(ptr)), PETSC_DEVICE_ALIGNOF(**(ptr)), (void **)(ptr)) 2230e6b6b59SJacob Faibussowitsch 2240e6b6b59SJacob Faibussowitsch /*MC 2250e6b6b59SJacob Faibussowitsch PetscDeviceFree - Free device-aware memory 2260e6b6b59SJacob Faibussowitsch 2270e6b6b59SJacob Faibussowitsch Synopsis: 2280e6b6b59SJacob Faibussowitsch #include <petscdevice.h> 2290e6b6b59SJacob Faibussowitsch PetscErrorCode PetscDeviceFree(PetscDeviceContext dctx, void *ptr) 2300e6b6b59SJacob Faibussowitsch 2310e6b6b59SJacob Faibussowitsch Not Collective, Asynchronous, Auto-dependency aware 2320e6b6b59SJacob Faibussowitsch 2330e6b6b59SJacob Faibussowitsch Input Parameters: 2340e6b6b59SJacob Faibussowitsch + dctx - The `PetscDeviceContext` used to free the memory 2350e6b6b59SJacob Faibussowitsch - ptr - The pointer to free 2360e6b6b59SJacob Faibussowitsch 2370e6b6b59SJacob Faibussowitsch Notes: 2386797ed33SJacob Faibussowitsch `ptr` may be `NULL`, and is set to `PETSC_NULLPTR` on successful deallocation. 2390e6b6b59SJacob Faibussowitsch 2406797ed33SJacob Faibussowitsch `ptr` must have been allocated using `PetscDeviceMalloc()`, `PetscDeviceCalloc()`. 2410e6b6b59SJacob Faibussowitsch 2420e6b6b59SJacob Faibussowitsch This routine falls back to using `PetscFree()` if PETSc was not configured with device 2430e6b6b59SJacob Faibussowitsch support. The user should note that `PetscFree()` frees only host memory. 2440e6b6b59SJacob Faibussowitsch 2456797ed33SJacob Faibussowitsch DAG representation: 2466797ed33SJacob Faibussowitsch .vb 2476797ed33SJacob Faibussowitsch time -> 2486797ed33SJacob Faibussowitsch 2496797ed33SJacob Faibussowitsch -> dctx -/- |= CALL =| - dctx -> 2506797ed33SJacob Faibussowitsch -> ptr -/ 2516797ed33SJacob Faibussowitsch .ve 2520e6b6b59SJacob Faibussowitsch 2530e6b6b59SJacob Faibussowitsch Level: beginner 2540e6b6b59SJacob Faibussowitsch 2550e6b6b59SJacob Faibussowitsch .N ASYNC_API 2560e6b6b59SJacob Faibussowitsch 2576797ed33SJacob Faibussowitsch .seealso: `PetscDeviceMalloc()`, `PetscDeviceCalloc()` 2580e6b6b59SJacob Faibussowitsch M*/ 2593ba16761SJacob Faibussowitsch #define PetscDeviceFree(dctx, ptr) ((PetscErrorCode)(PetscDeviceDeallocate_Private((dctx), (ptr)) || ((ptr) = PETSC_NULLPTR, PETSC_SUCCESS))) 2600e6b6b59SJacob Faibussowitsch 2610e6b6b59SJacob Faibussowitsch /*MC 2620e6b6b59SJacob Faibussowitsch PetscDeviceArrayCopy - Copy memory in a device-aware manner 2630e6b6b59SJacob Faibussowitsch 2640e6b6b59SJacob Faibussowitsch Synopsis: 2650e6b6b59SJacob Faibussowitsch #include <petscdevice.h> 2666bc29738SJacob Faibussowitsch PetscErrorCode PetscDeviceArrayCopy(PetscDeviceContext dctx, void *dest, const void *src, size_t n) 2670e6b6b59SJacob Faibussowitsch 2680e6b6b59SJacob Faibussowitsch Not Collective, Asynchronous, Auto-dependency aware 2690e6b6b59SJacob Faibussowitsch 2700e6b6b59SJacob Faibussowitsch Input Parameters: 2710e6b6b59SJacob Faibussowitsch + dctx - The `PetscDeviceContext` used to copy the memory 2720e6b6b59SJacob Faibussowitsch . dest - The pointer to copy to 2730e6b6b59SJacob Faibussowitsch . src - The pointer to copy from 2740e6b6b59SJacob Faibussowitsch - n - The amount (in elements) to copy 2750e6b6b59SJacob Faibussowitsch 2760e6b6b59SJacob Faibussowitsch Notes: 2770e6b6b59SJacob Faibussowitsch Both `dest` and `src` must have been allocated using any of `PetscDeviceMalloc()`, 2786797ed33SJacob Faibussowitsch `PetscDeviceCalloc()`. 2790e6b6b59SJacob Faibussowitsch 2800e6b6b59SJacob Faibussowitsch This uses the `sizeof()` of the `src` memory type requested to determine the total memory to 2810e6b6b59SJacob Faibussowitsch be copied, therefore you should not multiply the number of elements by the `sizeof()` the 2820e6b6b59SJacob Faibussowitsch type\: 2830e6b6b59SJacob Faibussowitsch 2840e6b6b59SJacob Faibussowitsch .vb 2850e6b6b59SJacob Faibussowitsch PetscInt *to,*from; 2860e6b6b59SJacob Faibussowitsch 2870e6b6b59SJacob Faibussowitsch // correct 2886bc29738SJacob Faibussowitsch PetscDeviceArrayCopy(dctx,to,from,n); 2890e6b6b59SJacob Faibussowitsch 2900e6b6b59SJacob Faibussowitsch // incorrect 2916bc29738SJacob Faibussowitsch PetscDeviceArrayCopy(dctx,to,from,n*sizeof(*from)); 2920e6b6b59SJacob Faibussowitsch .ve 2930e6b6b59SJacob Faibussowitsch 2940e6b6b59SJacob Faibussowitsch See `PetscDeviceMemcpy()` for further discussion. 2950e6b6b59SJacob Faibussowitsch 2960e6b6b59SJacob Faibussowitsch Level: beginner 2970e6b6b59SJacob Faibussowitsch 2980e6b6b59SJacob Faibussowitsch .N ASYNC_API 2990e6b6b59SJacob Faibussowitsch 3006797ed33SJacob Faibussowitsch .seealso: `PetscDeviceMalloc()`, `PetscDeviceCalloc()`, `PetscDeviceFree()`, 3016797ed33SJacob Faibussowitsch `PetscDeviceArrayZero()`, `PetscDeviceMemcpy()` 3020e6b6b59SJacob Faibussowitsch M*/ 3036797ed33SJacob Faibussowitsch #define PetscDeviceArrayCopy(dctx, dest, src, n) PetscDeviceMemcpy((dctx), (dest), (src), (size_t)(n) * sizeof(*(src))) 3040e6b6b59SJacob Faibussowitsch 3050e6b6b59SJacob Faibussowitsch /*MC 3060e6b6b59SJacob Faibussowitsch PetscDeviceArrayZero - Zero memory in a device-aware manner 3070e6b6b59SJacob Faibussowitsch 3080e6b6b59SJacob Faibussowitsch Synopsis: 3090e6b6b59SJacob Faibussowitsch #include <petscdevice.h> 3106bc29738SJacob Faibussowitsch PetscErrorCode PetscDeviceArrayZero(PetscDeviceContext dctx, void *ptr, size_t n) 3110e6b6b59SJacob Faibussowitsch 3120e6b6b59SJacob Faibussowitsch Not Collective, Asynchronous, Auto-dependency aware 3130e6b6b59SJacob Faibussowitsch 3140e6b6b59SJacob Faibussowitsch Input Parameters: 3150e6b6b59SJacob Faibussowitsch + dctx - The `PetscDeviceContext` used to zero the memory 3160e6b6b59SJacob Faibussowitsch . ptr - The pointer to the memory 3170e6b6b59SJacob Faibussowitsch - n - The amount (in elements) to zero 3180e6b6b59SJacob Faibussowitsch 3190e6b6b59SJacob Faibussowitsch Notes: 3206797ed33SJacob Faibussowitsch `ptr` must have been allocated using `PetscDeviceMalloc()` or `PetscDeviceCalloc()`. 3210e6b6b59SJacob Faibussowitsch 3220e6b6b59SJacob Faibussowitsch This uses the `sizeof()` of the memory type requested to determine the total memory to be 3230e6b6b59SJacob Faibussowitsch zeroed, therefore you should not multiply the number of elements by the `sizeof()` the type\: 3240e6b6b59SJacob Faibussowitsch 3250e6b6b59SJacob Faibussowitsch .vb 3260e6b6b59SJacob Faibussowitsch PetscInt *ptr; 3270e6b6b59SJacob Faibussowitsch 3280e6b6b59SJacob Faibussowitsch // correct 3296bc29738SJacob Faibussowitsch PetscDeviceArrayZero(dctx,ptr,n); 3300e6b6b59SJacob Faibussowitsch 3310e6b6b59SJacob Faibussowitsch // incorrect 3326bc29738SJacob Faibussowitsch PetscDeviceArrayZero(dctx,ptr,n*sizeof(*ptr)); 3330e6b6b59SJacob Faibussowitsch .ve 3340e6b6b59SJacob Faibussowitsch 335d5b43468SJose E. Roman See `PetscDeviceMemset()` for further discussion. 3360e6b6b59SJacob Faibussowitsch 3370e6b6b59SJacob Faibussowitsch Level: beginner 3380e6b6b59SJacob Faibussowitsch 3390e6b6b59SJacob Faibussowitsch .N ASYNC_API 3400e6b6b59SJacob Faibussowitsch 3416797ed33SJacob Faibussowitsch .seealso: `PetscDeviceMalloc()`, `PetscDeviceCalloc()`, `PetscDeviceFree()`, 3426797ed33SJacob Faibussowitsch `PetscDeviceArrayCopy()`, `PetscDeviceMemset()` 3430e6b6b59SJacob Faibussowitsch M*/ 3446797ed33SJacob Faibussowitsch #define PetscDeviceArrayZero(dctx, ptr, n) PetscDeviceMemset((dctx), (ptr), 0, (size_t)(n) * sizeof(*(ptr))) 345