jit-source/hip/hip-shared-basis-nontensor-templates.h

*6c13bbcbSJeremy L Thompson// Copyright (c) 2017-2024, Lawrence Livermore National Security, LLC and other CEED contributors.
*6c13bbcbSJeremy L Thompson// All Rights Reserved. See the top-level LICENSE and NOTICE files for details.
*6c13bbcbSJeremy L Thompson//
*6c13bbcbSJeremy L Thompson// SPDX-License-Identifier: BSD-2-Clause
*6c13bbcbSJeremy L Thompson//
*6c13bbcbSJeremy L Thompson// This file is part of CEED:  http://github.com/ceed
*6c13bbcbSJeremy L Thompson
*6c13bbcbSJeremy L Thompson/// @file
*6c13bbcbSJeremy L Thompson/// Internal header for HIP shared memory non-tensor basis templates
*6c13bbcbSJeremy L Thompson#include <ceed/types.h>
*6c13bbcbSJeremy L Thompson
*6c13bbcbSJeremy L Thompson//------------------------------------------------------------------------------
*6c13bbcbSJeremy L Thompson// 1D tensor contraction
*6c13bbcbSJeremy L Thompson//------------------------------------------------------------------------------
*6c13bbcbSJeremy L Thompsontemplate <int NUM_COMP, int P_1D, int Q_1D>
*6c13bbcbSJeremy L Thompsoninline __device__ void Contract1d(SharedData_Hip &data, const CeedScalar *U, const CeedScalar *B, CeedScalar *V) {
*6c13bbcbSJeremy L Thompson  data.slice[data.t_id_x] = *U;
*6c13bbcbSJeremy L Thompson  __syncthreads();
*6c13bbcbSJeremy L Thompson  *V = 0.0;
*6c13bbcbSJeremy L Thompson  if (data.t_id_x < Q_1D) {
*6c13bbcbSJeremy L Thompson    for (CeedInt i = 0; i < P_1D; i++) {
*6c13bbcbSJeremy L Thompson      *V += B[i + data.t_id_x * P_1D] * data.slice[i];  // Contract x direction
*6c13bbcbSJeremy L Thompson    }
*6c13bbcbSJeremy L Thompson  }
*6c13bbcbSJeremy L Thompson  __syncthreads();
*6c13bbcbSJeremy L Thompson}
*6c13bbcbSJeremy L Thompson
*6c13bbcbSJeremy L Thompson//------------------------------------------------------------------------------
*6c13bbcbSJeremy L Thompson// 1D transpose tensor contraction
*6c13bbcbSJeremy L Thompson//------------------------------------------------------------------------------
*6c13bbcbSJeremy L Thompsontemplate <int NUM_COMP, int P_1D, int Q_1D>
*6c13bbcbSJeremy L Thompsoninline __device__ void ContractTranspose1d(SharedData_Hip &data, const CeedScalar *U, const CeedScalar *B, CeedScalar *V) {
*6c13bbcbSJeremy L Thompson  data.slice[data.t_id_x] = *U;
*6c13bbcbSJeremy L Thompson  __syncthreads();
*6c13bbcbSJeremy L Thompson  if (data.t_id_x < P_1D) {
*6c13bbcbSJeremy L Thompson    for (CeedInt i = 0; i < Q_1D; i++) {
*6c13bbcbSJeremy L Thompson      *V += B[data.t_id_x + i * P_1D] * data.slice[i];  // Contract x direction
*6c13bbcbSJeremy L Thompson    }
*6c13bbcbSJeremy L Thompson  }
*6c13bbcbSJeremy L Thompson  __syncthreads();
*6c13bbcbSJeremy L Thompson}
*6c13bbcbSJeremy L Thompson
*6c13bbcbSJeremy L Thompson//------------------------------------------------------------------------------
*6c13bbcbSJeremy L Thompson// Interpolate to quadrature points
*6c13bbcbSJeremy L Thompson//------------------------------------------------------------------------------
*6c13bbcbSJeremy L Thompsontemplate <int NUM_COMP, int P, int Q>
*6c13bbcbSJeremy L Thompsoninline __device__ void Interp1d(SharedData_Hip &data, const CeedScalar *__restrict__ r_U, const CeedScalar *c_B, CeedScalar *__restrict__ r_V) {
*6c13bbcbSJeremy L Thompson  for (CeedInt comp = 0; comp < NUM_COMP; comp++) {
*6c13bbcbSJeremy L Thompson    Contract1d<NUM_COMP, P, Q>(data, &r_U[comp], c_B, &r_V[comp]);
*6c13bbcbSJeremy L Thompson  }
*6c13bbcbSJeremy L Thompson}
*6c13bbcbSJeremy L Thompson
*6c13bbcbSJeremy L Thompson//------------------------------------------------------------------------------
*6c13bbcbSJeremy L Thompson// Interpolate transpose
*6c13bbcbSJeremy L Thompson//------------------------------------------------------------------------------
*6c13bbcbSJeremy L Thompsontemplate <int NUM_COMP, int P, int Q>
*6c13bbcbSJeremy L Thompsoninline __device__ void InterpTranspose1d(SharedData_Hip &data, const CeedScalar *__restrict__ r_U, const CeedScalar *c_B,
*6c13bbcbSJeremy L Thompson                                         CeedScalar *__restrict__ r_V) {
*6c13bbcbSJeremy L Thompson  for (CeedInt comp = 0; comp < NUM_COMP; comp++) {
*6c13bbcbSJeremy L Thompson    r_V[comp] = 0.0;
*6c13bbcbSJeremy L Thompson    ContractTranspose1d<NUM_COMP, P, Q>(data, &r_U[comp], c_B, &r_V[comp]);
*6c13bbcbSJeremy L Thompson  }
*6c13bbcbSJeremy L Thompson}
*6c13bbcbSJeremy L Thompson
*6c13bbcbSJeremy L Thompson//------------------------------------------------------------------------------
*6c13bbcbSJeremy L Thompson// Derivatives at quadrature points
*6c13bbcbSJeremy L Thompson//------------------------------------------------------------------------------
*6c13bbcbSJeremy L Thompsontemplate <int NUM_COMP, int P, int Q>
*6c13bbcbSJeremy L Thompsoninline __device__ void Grad1d(SharedData_Hip &data, const CeedScalar *__restrict__ r_U, const CeedScalar *c_G,
*6c13bbcbSJeremy L Thompson                              CeedScalar *__restrict__ r_V) {
*6c13bbcbSJeremy L Thompson  for (CeedInt dim = 0; dim < DIM; dim++) {
*6c13bbcbSJeremy L Thompson    for (CeedInt comp = 0; comp < NUM_COMP; comp++) {
*6c13bbcbSJeremy L Thompson      Contract1d<NUM_COMP, P, Q>(data, &r_U[comp], &c_G[dim * P * Q], &r_V[comp + dim * NUM_COMP]);
*6c13bbcbSJeremy L Thompson    }
*6c13bbcbSJeremy L Thompson  }
*6c13bbcbSJeremy L Thompson}
*6c13bbcbSJeremy L Thompson
*6c13bbcbSJeremy L Thompson//------------------------------------------------------------------------------
*6c13bbcbSJeremy L Thompson// Derivatives transpose
*6c13bbcbSJeremy L Thompson//------------------------------------------------------------------------------
*6c13bbcbSJeremy L Thompsontemplate <int NUM_COMP, int P, int Q>
*6c13bbcbSJeremy L Thompsoninline __device__ void GradTranspose1d(SharedData_Hip &data, const CeedScalar *__restrict__ r_U, const CeedScalar *c_G,
*6c13bbcbSJeremy L Thompson                                       CeedScalar *__restrict__ r_V) {
*6c13bbcbSJeremy L Thompson  for (CeedInt comp = 0; comp < NUM_COMP; comp++) r_V[comp] = 0.0;
*6c13bbcbSJeremy L Thompson  for (CeedInt dim = 0; dim < DIM; dim++) {
*6c13bbcbSJeremy L Thompson    for (CeedInt comp = 0; comp < NUM_COMP; comp++) {
*6c13bbcbSJeremy L Thompson      ContractTranspose1d<NUM_COMP, P, Q>(data, &r_U[comp + dim * NUM_COMP], &c_G[dim * P * Q], &r_V[comp]);
*6c13bbcbSJeremy L Thompson    }
*6c13bbcbSJeremy L Thompson  }
*6c13bbcbSJeremy L Thompson}
*6c13bbcbSJeremy L Thompson
*6c13bbcbSJeremy L Thompson//------------------------------------------------------------------------------
*6c13bbcbSJeremy L Thompson// Quadrature weights
*6c13bbcbSJeremy L Thompson//------------------------------------------------------------------------------
*6c13bbcbSJeremy L Thompsontemplate <int Q>
*6c13bbcbSJeremy L Thompsoninline __device__ void Weight1d(SharedData_Hip &data, const CeedScalar *__restrict__ q_weight_1d, CeedScalar *w) {
*6c13bbcbSJeremy L Thompson  *w = (data.t_id_x < Q) ? q_weight_1d[data.t_id_x] : 0.0;
*6c13bbcbSJeremy L Thompson}