qfunctions/bps/bp3sphere.h

*ed264d09SValeria Barra// Copyright (c) 2017, Lawrence Livermore National Security, LLC. Produced at
*ed264d09SValeria Barra// the Lawrence Livermore National Laboratory. LLNL-CODE-734707. All Rights
*ed264d09SValeria Barra// reserved. See files LICENSE and NOTICE for details.
*ed264d09SValeria Barra//
*ed264d09SValeria Barra// This file is part of CEED, a collection of benchmarks, miniapps, software
*ed264d09SValeria Barra// libraries and APIs for efficient high-order finite element and spectral
*ed264d09SValeria Barra// element discretizations for exascale applications. For more information and
*ed264d09SValeria Barra// source code availability see http://github.com/ceed.
*ed264d09SValeria Barra//
*ed264d09SValeria Barra// The CEED research is supported by the Exascale Computing Project 17-SC-20-SC,
*ed264d09SValeria Barra// a collaborative effort of two U.S. Department of Energy organizations (Office
*ed264d09SValeria Barra// of Science and the National Nuclear Security Administration) responsible for
*ed264d09SValeria Barra// the planning and preparation of a capable exascale ecosystem, including
*ed264d09SValeria Barra// software, applications, hardware, advanced system engineering and early
*ed264d09SValeria Barra// testbed platforms, in support of the nation's exascale computing imperative.
*ed264d09SValeria Barra
*ed264d09SValeria Barra/// @file
*ed264d09SValeria Barra/// libCEED QFunctions for diffusion operator example for a scalar field on the sphere using PETSc
*ed264d09SValeria Barra
*ed264d09SValeria Barra#ifndef __CUDACC__
*ed264d09SValeria Barra#  include <math.h>
*ed264d09SValeria Barra#endif
*ed264d09SValeria Barra
*ed264d09SValeria Barra// *****************************************************************************
*ed264d09SValeria Barra// This QFunction sets up the geometric factors required for integration and
*ed264d09SValeria Barra//   coordinate transformations when reference coordinates have a different
*ed264d09SValeria Barra//   dimension than the one of physical coordinates
*ed264d09SValeria Barra//
*ed264d09SValeria Barra// Reference (parent) 2D coordinates: X \in [-1, 1]^2
*ed264d09SValeria Barra//
*ed264d09SValeria Barra// Global 3D physical coordinates given by the mesh: xx \in [-R, R]^3
*ed264d09SValeria Barra//   with R radius of the sphere
*ed264d09SValeria Barra//
*ed264d09SValeria Barra// Local 3D physical coordinates on the 2D manifold: x \in [-l, l]^3
*ed264d09SValeria Barra//   with l half edge of the cube inscribed in the sphere
*ed264d09SValeria Barra//
*ed264d09SValeria Barra// Change of coordinates matrix computed by the library:
*ed264d09SValeria Barra//   (physical 3D coords relative to reference 2D coords)
*ed264d09SValeria Barra//   dxx_j/dX_i (indicial notation) [3 * 2]
*ed264d09SValeria Barra//
*ed264d09SValeria Barra// Change of coordinates x (on the 2D manifold) relative to xx (phyisical 3D):
*ed264d09SValeria Barra//   dx_i/dxx_j (indicial notation) [3 * 3]
*ed264d09SValeria Barra//
*ed264d09SValeria Barra// Change of coordinates x (on the 2D manifold) relative to X (reference 2D):
*ed264d09SValeria Barra//   (by chain rule)
*ed264d09SValeria Barra//   dx_i/dX_j [3 * 2] = dx_i/dxx_k [3 * 3] * dxx_k/dX_j [3 * 2]
*ed264d09SValeria Barra//
*ed264d09SValeria Barra// modJ is given by the magnitude of the cross product of the columns of dx_i/dX_j
*ed264d09SValeria Barra//
*ed264d09SValeria Barra// The quadrature data is stored in the array qdata.
*ed264d09SValeria Barra//
*ed264d09SValeria Barra// We require the determinant of the Jacobian to properly compute integrals of
*ed264d09SValeria Barra//   the form: int( u v )
*ed264d09SValeria Barra//
*ed264d09SValeria Barra// qdata[0]: modJ * w
*ed264d09SValeria Barra//
*ed264d09SValeria Barra// We use the Moore–Penrose (left) pseudoinverse of dx_i/dX_j, to compute dX_i/dx_j (and its transpose),
*ed264d09SValeria Barra//   needed to properly compute integrals of the form: int( gradv gradu )
*ed264d09SValeria Barra//
*ed264d09SValeria Barra// dX_i/dx_j [2 * 3] = (dx_i/dX_j)+ = (dxdX^T dxdX)^(-1) dxdX
*ed264d09SValeria Barra//
*ed264d09SValeria Barra// Stored: dX_i/dx_j * dX_j/dx_i (in Voigt convention)
*ed264d09SValeria Barra//   in qdata[1:3] as
*ed264d09SValeria Barra//   [dXdxdXdxT11 dXdxdXdxT12]
*ed264d09SValeria Barra//   [dXdxdXdxT21 dXdxdXdxT22]
*ed264d09SValeria Barra// *****************************************************************************
*ed264d09SValeria Barra
*ed264d09SValeria Barra// -----------------------------------------------------------------------------
*ed264d09SValeria BarraCEED_QFUNCTION(SetupDiffGeo)(void *ctx, CeedInt Q,
*ed264d09SValeria Barra                             const CeedScalar *const *in,
*ed264d09SValeria Barra                             CeedScalar *const *out) {
*ed264d09SValeria Barra  const CeedScalar *X = in[0], *J = in[1], *w = in[2];
*ed264d09SValeria Barra  CeedScalar *qdata = out[0];
*ed264d09SValeria Barra
*ed264d09SValeria Barra  // Quadrature Point Loop
*ed264d09SValeria Barra  CeedPragmaSIMD
*ed264d09SValeria Barra  for (CeedInt i=0; i<Q; i++) {
*ed264d09SValeria Barra    // Read global Cartesian coordinates
*ed264d09SValeria Barra    const CeedScalar xx[3] = {X[i+0*Q],
*ed264d09SValeria Barra                              X[i+1*Q],
*ed264d09SValeria Barra                              X[i+2*Q]
*ed264d09SValeria Barra                             };
*ed264d09SValeria Barra
*ed264d09SValeria Barra    // Read dxxdX Jacobian entries, stored as
*ed264d09SValeria Barra    // 0 3
*ed264d09SValeria Barra    // 1 4
*ed264d09SValeria Barra    // 2 5
*ed264d09SValeria Barra    const CeedScalar dxxdX[3][2] = {{J[i+Q*0],
*ed264d09SValeria Barra                                     J[i+Q*3]},
*ed264d09SValeria Barra                                    {J[i+Q*1],
*ed264d09SValeria Barra                                     J[i+Q*4]},
*ed264d09SValeria Barra                                    {J[i+Q*2],
*ed264d09SValeria Barra                                     J[i+Q*5]}
*ed264d09SValeria Barra                                   };
*ed264d09SValeria Barra
*ed264d09SValeria Barra    // Setup
*ed264d09SValeria Barra    // x = xx (xx^T xx)^{-1/2}
*ed264d09SValeria Barra    // dx/dxx = I (xx^T xx)^{-1/2} - xx xx^T (xx^T xx)^{-3/2}
*ed264d09SValeria Barra    const CeedScalar modxxsq = xx[0]*xx[0]+xx[1]*xx[1]+xx[2]*xx[2];
*ed264d09SValeria Barra    CeedScalar xxsq[3][3];
*ed264d09SValeria Barra    for (int j=0; j<3; j++)
*ed264d09SValeria Barra      for (int k=0; k<3; k++)
*ed264d09SValeria Barra        xxsq[j][k] = xx[j]*xx[k] / (sqrt(modxxsq) * modxxsq);
*ed264d09SValeria Barra
*ed264d09SValeria Barra    const CeedScalar dxdxx[3][3] = {{1./sqrt(modxxsq) - xxsq[0][0],
*ed264d09SValeria Barra                                     -xxsq[0][1],
*ed264d09SValeria Barra                                     -xxsq[0][2]},
*ed264d09SValeria Barra                                    {-xxsq[1][0],
*ed264d09SValeria Barra                                     1./sqrt(modxxsq) - xxsq[1][1],
*ed264d09SValeria Barra                                     -xxsq[1][2]},
*ed264d09SValeria Barra                                    {-xxsq[2][0],
*ed264d09SValeria Barra                                     -xxsq[2][1],
*ed264d09SValeria Barra                                     1./sqrt(modxxsq) - xxsq[2][2]}
*ed264d09SValeria Barra                                   };
*ed264d09SValeria Barra
*ed264d09SValeria Barra    CeedScalar dxdX[3][2];
*ed264d09SValeria Barra    for (int j=0; j<3; j++)
*ed264d09SValeria Barra      for (int k=0; k<2; k++) {
*ed264d09SValeria Barra        dxdX[j][k] = 0;
*ed264d09SValeria Barra        for (int l=0; l<3; l++)
*ed264d09SValeria Barra          dxdX[j][k] += dxdxx[j][l]*dxxdX[l][k];
*ed264d09SValeria Barra      }
*ed264d09SValeria Barra
*ed264d09SValeria Barra    // J is given by the cross product of the columns of dxdX
*ed264d09SValeria Barra    const CeedScalar J[3]= {dxdX[1][0]*dxdX[2][1] - dxdX[2][0]*dxdX[1][1],
*ed264d09SValeria Barra                            dxdX[2][0]*dxdX[0][1] - dxdX[0][0]*dxdX[2][1],
*ed264d09SValeria Barra                            dxdX[0][0]*dxdX[1][1] - dxdX[1][0]*dxdX[0][1]
*ed264d09SValeria Barra                           };
*ed264d09SValeria Barra
*ed264d09SValeria Barra    // Use the magnitude of J as our detJ (volume scaling factor)
*ed264d09SValeria Barra    const CeedScalar modJ = sqrt(J[0]*J[0]+J[1]*J[1]+J[2]*J[2]);
*ed264d09SValeria Barra
*ed264d09SValeria Barra    // Interp-to-Interp qdata
*ed264d09SValeria Barra    qdata[i+Q*0] = modJ * w[i];
*ed264d09SValeria Barra
*ed264d09SValeria Barra    // dxdX_j,k * dxdX_k,j, needed for the pseudoinverse
*ed264d09SValeria Barra    CeedScalar dxdXTdxdX[2][2];
*ed264d09SValeria Barra    for (int j=0; j<2; j++)
*ed264d09SValeria Barra      for (int k=0; k<2; k++) {
*ed264d09SValeria Barra        dxdXTdxdX[j][k] = 0;
*ed264d09SValeria Barra        for (int l=0; l<3; l++)
*ed264d09SValeria Barra          dxdXTdxdX[j][k] += dxdX[l][j]*dxdX[l][k];
*ed264d09SValeria Barra      }
*ed264d09SValeria Barra
*ed264d09SValeria Barra    const CeedScalar detdxdXTdxdX =  dxdXTdxdX[0][0] * dxdXTdxdX[1][1]
*ed264d09SValeria Barra                                    -dxdXTdxdX[1][0] * dxdXTdxdX[0][1];
*ed264d09SValeria Barra
*ed264d09SValeria Barra    // Compute inverse of dxdXTdxdX, needed for the pseudoinverse
*ed264d09SValeria Barra    CeedScalar dxdXTdxdXinv[2][2];
*ed264d09SValeria Barra    dxdXTdxdXinv[0][0] =  dxdXTdxdX[1][1] / detdxdXTdxdX;
*ed264d09SValeria Barra    dxdXTdxdXinv[0][1] = -dxdXTdxdX[0][1] / detdxdXTdxdX;
*ed264d09SValeria Barra    dxdXTdxdXinv[1][0] = -dxdXTdxdX[1][0] / detdxdXTdxdX;
*ed264d09SValeria Barra    dxdXTdxdXinv[1][1] =  dxdXTdxdX[0][0] / detdxdXTdxdX;
*ed264d09SValeria Barra
*ed264d09SValeria Barra    // Compute the pseudo inverse of dxdX
*ed264d09SValeria Barra    CeedScalar pseudodXdx[2][3];
*ed264d09SValeria Barra    for (int j=0; j<2; j++)
*ed264d09SValeria Barra      for (int k=0; k<3; k++) {
*ed264d09SValeria Barra        pseudodXdx[j][k] = 0;
*ed264d09SValeria Barra        for (int l=0; l<2; l++)
*ed264d09SValeria Barra          pseudodXdx[j][k] += dxdXTdxdXinv[j][l]*dxdX[k][l];
*ed264d09SValeria Barra      }
*ed264d09SValeria Barra
*ed264d09SValeria Barra    // Grad-to-Grad qdata is given by pseudodXdx * pseudodXdxT
*ed264d09SValeria Barra    CeedScalar dXdxdXdxT[2][2];
*ed264d09SValeria Barra    for (int j=0; j<2; j++)
*ed264d09SValeria Barra      for (int k=0; k<2; k++) {
*ed264d09SValeria Barra        dXdxdXdxT[j][k] = 0;
*ed264d09SValeria Barra        for (int l=0; l<3; l++)
*ed264d09SValeria Barra          dXdxdXdxT[j][k] += pseudodXdx[j][l]*pseudodXdx[k][l];
*ed264d09SValeria Barra      }
*ed264d09SValeria Barra
*ed264d09SValeria Barra    // Stored in Voigt convention
*ed264d09SValeria Barra    qdata[i+Q*1] = dXdxdXdxT[0][0];
*ed264d09SValeria Barra    qdata[i+Q*2] = dXdxdXdxT[1][1];
*ed264d09SValeria Barra    qdata[i+Q*3] = dXdxdXdxT[0][1];
*ed264d09SValeria Barra
*ed264d09SValeria Barra  } // End of Quadrature Point Loop
*ed264d09SValeria Barra
*ed264d09SValeria Barra  // Return
*ed264d09SValeria Barra  return 0;
*ed264d09SValeria Barra}
*ed264d09SValeria Barra
*ed264d09SValeria Barra// *****************************************************************************
*ed264d09SValeria Barra// This QFunction sets up the rhs and true solution for the problem
*ed264d09SValeria Barra// *****************************************************************************
*ed264d09SValeria Barra
*ed264d09SValeria Barra// -----------------------------------------------------------------------------
*ed264d09SValeria BarraCEED_QFUNCTION(SetupDiffRhs)(void *ctx, CeedInt Q,
*ed264d09SValeria Barra                             const CeedScalar *const *in,
*ed264d09SValeria Barra                             CeedScalar *const *out) {
*ed264d09SValeria Barra  // Inputs
*ed264d09SValeria Barra  const CeedScalar *X = in[0], *qdata = in[1];
*ed264d09SValeria Barra  // Outputs
*ed264d09SValeria Barra  CeedScalar *true_soln = out[0], *rhs = out[1];
*ed264d09SValeria Barra
*ed264d09SValeria Barra  // Context
*ed264d09SValeria Barra  const CeedScalar *context = (const CeedScalar*)ctx;
*ed264d09SValeria Barra  const CeedScalar R        = context[0];
*ed264d09SValeria Barra
*ed264d09SValeria Barra  // Quadrature Point Loop
*ed264d09SValeria Barra  CeedPragmaSIMD
*ed264d09SValeria Barra  for (CeedInt i=0; i<Q; i++) {
*ed264d09SValeria Barra    // Read global Cartesian coordinates
*ed264d09SValeria Barra    CeedScalar x = X[i+Q*0], y = X[i+Q*1], z = X[i+Q*2];
*ed264d09SValeria Barra    // Normalize quadrature point coordinates to sphere
*ed264d09SValeria Barra    CeedScalar rad = sqrt(x*x + y*y + z*z);
*ed264d09SValeria Barra    x *= R / rad;
*ed264d09SValeria Barra    y *= R / rad;
*ed264d09SValeria Barra    z *= R / rad;
*ed264d09SValeria Barra    // Compute latitude and longitude
*ed264d09SValeria Barra    const CeedScalar theta  = asin(z / R); // latitude
*ed264d09SValeria Barra    const CeedScalar lambda = atan2(y, x); // longitude
*ed264d09SValeria Barra
*ed264d09SValeria Barra    true_soln[i+Q*0] = sin(lambda) * cos(theta);
*ed264d09SValeria Barra
*ed264d09SValeria Barra    rhs[i+Q*0] = qdata[i+Q*0] * 2 * sin(lambda)*cos(theta) / (R*R);
*ed264d09SValeria Barra
*ed264d09SValeria Barra  } // End of Quadrature Point Loop
*ed264d09SValeria Barra
*ed264d09SValeria Barra  return 0;
*ed264d09SValeria Barra}
*ed264d09SValeria Barra
*ed264d09SValeria Barra// *****************************************************************************
*ed264d09SValeria Barra// This QFunction applies the diffusion operator for a scalar field.
*ed264d09SValeria Barra//
*ed264d09SValeria Barra// Inputs:
*ed264d09SValeria Barra//   ug     - Input vector gradient at quadrature points
*ed264d09SValeria Barra//   qdata  - Geometric factors
*ed264d09SValeria Barra//
*ed264d09SValeria Barra// Output:
*ed264d09SValeria Barra//   vg     - Output vector (test functions) gradient at quadrature points
*ed264d09SValeria Barra//
*ed264d09SValeria Barra// *****************************************************************************
*ed264d09SValeria Barra
*ed264d09SValeria Barra// -----------------------------------------------------------------------------
*ed264d09SValeria BarraCEED_QFUNCTION(Diff)(void *ctx, CeedInt Q,
*ed264d09SValeria Barra                     const CeedScalar *const *in, CeedScalar *const *out) {
*ed264d09SValeria Barra  // Inputs
*ed264d09SValeria Barra  const CeedScalar *ug = in[0], *qdata = in[1];
*ed264d09SValeria Barra  // Outputs
*ed264d09SValeria Barra  CeedScalar *vg = out[0];
*ed264d09SValeria Barra
*ed264d09SValeria Barra  // Quadrature Point Loop
*ed264d09SValeria Barra  CeedPragmaSIMD
*ed264d09SValeria Barra  for (CeedInt i=0; i<Q; i++) {
*ed264d09SValeria Barra    // Read spatial derivatives of u
*ed264d09SValeria Barra    const CeedScalar du[2]           =  {ug[i+Q*0],
*ed264d09SValeria Barra                                         ug[i+Q*1]
*ed264d09SValeria Barra                                        };
*ed264d09SValeria Barra    // Read qdata
*ed264d09SValeria Barra    const CeedScalar wJ              =   qdata[i+Q*0];
*ed264d09SValeria Barra    // -- Grad-to-Grad qdata
*ed264d09SValeria Barra    // ---- dXdx_j,k * dXdx_k,j
*ed264d09SValeria Barra    const CeedScalar dXdxdXdxT[2][2] = {{qdata[i+Q*1],
*ed264d09SValeria Barra                                         qdata[i+Q*3]},
*ed264d09SValeria Barra                                        {qdata[i+Q*3],
*ed264d09SValeria Barra                                         qdata[i+Q*2]}
*ed264d09SValeria Barra                                       };
*ed264d09SValeria Barra
*ed264d09SValeria Barra    for (int j=0; j<2; j++) // j = direction of vg
*ed264d09SValeria Barra      vg[i+j*Q] = wJ * (du[0] * dXdxdXdxT[0][j] +
*ed264d09SValeria Barra                        du[1] * dXdxdXdxT[1][j]);
*ed264d09SValeria Barra
*ed264d09SValeria Barra  } // End of Quadrature Point Loop
*ed264d09SValeria Barra
*ed264d09SValeria Barra  return 0;
*ed264d09SValeria Barra}
*ed264d09SValeria Barra// -----------------------------------------------------------------------------