mpi/mpiviennacl/mpiaijviennacl.cxx

*8f86e40fSKarl Rupp#include "petscconf.h"
*8f86e40fSKarl Rupp#include <../src/mat/impls/aij/mpi/mpiaij.h>   /*I "petscmat.h" I*/
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp#undef __FUNCT__
*8f86e40fSKarl Rupp#define __FUNCT__ "MatMPIAIJSetPreallocation_MPIAIJViennaCL"
*8f86e40fSKarl RuppPetscErrorCode  MatMPIAIJSetPreallocation_MPIAIJViennaCL(Mat B,PetscInt d_nz,const PetscInt d_nnz[],PetscInt o_nz,const PetscInt o_nnz[])
*8f86e40fSKarl Rupp{
*8f86e40fSKarl Rupp  Mat_MPIAIJ *b = (Mat_MPIAIJ*)B->data;
*8f86e40fSKarl Rupp  PetscErrorCode ierr;
*8f86e40fSKarl Rupp  PetscInt       i;
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp  PetscFunctionBegin;
*8f86e40fSKarl Rupp  if (d_nz == PETSC_DEFAULT || d_nz == PETSC_DECIDE) d_nz = 5;
*8f86e40fSKarl Rupp  if (o_nz == PETSC_DEFAULT || o_nz == PETSC_DECIDE) o_nz = 2;
*8f86e40fSKarl Rupp  if (d_nz < 0) SETERRQ1(PETSC_COMM_SELF,PETSC_ERR_ARG_OUTOFRANGE,"d_nz cannot be less than 0: value %D",d_nz);
*8f86e40fSKarl Rupp  if (o_nz < 0) SETERRQ1(PETSC_COMM_SELF,PETSC_ERR_ARG_OUTOFRANGE,"o_nz cannot be less than 0: value %D",o_nz);
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp  ierr = PetscLayoutSetUp(B->rmap);CHKERRQ(ierr);
*8f86e40fSKarl Rupp  ierr = PetscLayoutSetUp(B->cmap);CHKERRQ(ierr);
*8f86e40fSKarl Rupp  if (d_nnz) {
*8f86e40fSKarl Rupp    for (i=0; i<B->rmap->n; i++) {
*8f86e40fSKarl Rupp      if (d_nnz[i] < 0) SETERRQ2(PETSC_COMM_SELF,PETSC_ERR_ARG_OUTOFRANGE,"d_nnz cannot be less than 0: local row %D value %D",i,d_nnz[i]);
*8f86e40fSKarl Rupp    }
*8f86e40fSKarl Rupp  }
*8f86e40fSKarl Rupp  if (o_nnz) {
*8f86e40fSKarl Rupp    for (i=0; i<B->rmap->n; i++) {
*8f86e40fSKarl Rupp      if (o_nnz[i] < 0) SETERRQ2(PETSC_COMM_SELF,PETSC_ERR_ARG_OUTOFRANGE,"o_nnz cannot be less than 0: local row %D value %D",i,o_nnz[i]);
*8f86e40fSKarl Rupp    }
*8f86e40fSKarl Rupp  }
*8f86e40fSKarl Rupp  if (!B->preallocated) {
*8f86e40fSKarl Rupp    /* Explicitly create the two MATSEQAIJVIENNACL matrices. */
*8f86e40fSKarl Rupp    ierr = MatCreate(PETSC_COMM_SELF,&b->A);CHKERRQ(ierr);
*8f86e40fSKarl Rupp    ierr = MatSetSizes(b->A,B->rmap->n,B->cmap->n,B->rmap->n,B->cmap->n);CHKERRQ(ierr);
*8f86e40fSKarl Rupp    ierr = MatSetType(b->A,MATSEQAIJVIENNACL);CHKERRQ(ierr);
*8f86e40fSKarl Rupp    ierr = PetscLogObjectParent(B,b->A);CHKERRQ(ierr);
*8f86e40fSKarl Rupp    ierr = MatCreate(PETSC_COMM_SELF,&b->B);CHKERRQ(ierr);
*8f86e40fSKarl Rupp    ierr = MatSetSizes(b->B,B->rmap->n,B->cmap->N,B->rmap->n,B->cmap->N);CHKERRQ(ierr);
*8f86e40fSKarl Rupp    ierr = MatSetType(b->B,MATSEQAIJVIENNACL);CHKERRQ(ierr);
*8f86e40fSKarl Rupp    ierr = PetscLogObjectParent(B,b->B);CHKERRQ(ierr);
*8f86e40fSKarl Rupp  }
*8f86e40fSKarl Rupp  ierr = MatSeqAIJSetPreallocation(b->A,d_nz,d_nnz);CHKERRQ(ierr);
*8f86e40fSKarl Rupp  ierr = MatSeqAIJSetPreallocation(b->B,o_nz,o_nnz);CHKERRQ(ierr);
*8f86e40fSKarl Rupp  B->preallocated = PETSC_TRUE;
*8f86e40fSKarl Rupp  PetscFunctionReturn(0);
*8f86e40fSKarl Rupp}
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp#undef __FUNCT__
*8f86e40fSKarl Rupp#define __FUNCT__ "MatGetVecs_MPIAIJViennaCL"
*8f86e40fSKarl RuppPetscErrorCode  MatGetVecs_MPIAIJViennaCL(Mat mat,Vec *right,Vec *left)
*8f86e40fSKarl Rupp{
*8f86e40fSKarl Rupp  PetscErrorCode ierr;
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp  PetscFunctionBegin;
*8f86e40fSKarl Rupp  if (right) {
*8f86e40fSKarl Rupp    ierr = VecCreate(PetscObjectComm((PetscObject)mat),right);CHKERRQ(ierr);
*8f86e40fSKarl Rupp    ierr = VecSetSizes(*right,mat->cmap->n,PETSC_DETERMINE);CHKERRQ(ierr);
*8f86e40fSKarl Rupp    ierr = VecSetBlockSize(*right,mat->rmap->bs);CHKERRQ(ierr);
*8f86e40fSKarl Rupp    ierr = VecSetType(*right,VECVIENNACL);CHKERRQ(ierr);
*8f86e40fSKarl Rupp    ierr = VecSetLayout(*right,mat->cmap);CHKERRQ(ierr);
*8f86e40fSKarl Rupp  }
*8f86e40fSKarl Rupp  if (left) {
*8f86e40fSKarl Rupp    ierr = VecCreate(PetscObjectComm((PetscObject)mat),left);CHKERRQ(ierr);
*8f86e40fSKarl Rupp    ierr = VecSetSizes(*left,mat->rmap->n,PETSC_DETERMINE);CHKERRQ(ierr);
*8f86e40fSKarl Rupp    ierr = VecSetBlockSize(*left,mat->rmap->bs);CHKERRQ(ierr);
*8f86e40fSKarl Rupp    ierr = VecSetType(*left,VECVIENNACL);CHKERRQ(ierr);
*8f86e40fSKarl Rupp    ierr = VecSetLayout(*left,mat->rmap);CHKERRQ(ierr);
*8f86e40fSKarl Rupp  }
*8f86e40fSKarl Rupp  PetscFunctionReturn(0);
*8f86e40fSKarl Rupp}
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp#undef __FUNCT__
*8f86e40fSKarl Rupp#define __FUNCT__ "MatDestroy_MPIAIJViennaCL"
*8f86e40fSKarl RuppPetscErrorCode MatDestroy_MPIAIJViennaCL(Mat A)
*8f86e40fSKarl Rupp{
*8f86e40fSKarl Rupp  PetscErrorCode ierr;
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp  PetscFunctionBegin;
*8f86e40fSKarl Rupp  ierr = MatDestroy_MPIAIJ(A);CHKERRQ(ierr);
*8f86e40fSKarl Rupp  PetscFunctionReturn(0);
*8f86e40fSKarl Rupp}
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp#undef __FUNCT__
*8f86e40fSKarl Rupp#define __FUNCT__ "MatCreate_MPIAIJViennaCL"
*8f86e40fSKarl RuppPETSC_EXTERN PetscErrorCode MatCreate_MPIAIJViennaCL(Mat A)
*8f86e40fSKarl Rupp{
*8f86e40fSKarl Rupp  PetscErrorCode ierr;
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp  PetscFunctionBegin;
*8f86e40fSKarl Rupp  ierr = MatCreate_MPIAIJ(A);CHKERRQ(ierr);
*8f86e40fSKarl Rupp  ierr = PetscObjectComposeFunction((PetscObject)A,"MatMPIAIJSetPreallocation_C","MatMPIAIJSetPreallocation_MPIAIJViennaCL",MatMPIAIJSetPreallocation_MPIAIJViennaCL);CHKERRQ(ierr);
*8f86e40fSKarl Rupp  A->ops->getvecs        = MatGetVecs_MPIAIJViennaCL;
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp  ierr = PetscObjectChangeTypeName((PetscObject)A,MATMPIAIJVIENNACL);CHKERRQ(ierr);
*8f86e40fSKarl Rupp  PetscFunctionReturn(0);
*8f86e40fSKarl Rupp}
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp/*@
*8f86e40fSKarl Rupp   MatCreateAIJViennaCL - Creates a sparse matrix in AIJ (compressed row) format
*8f86e40fSKarl Rupp   (the default parallel PETSc format).  This matrix will ultimately pushed down
*8f86e40fSKarl Rupp   to GPUs and use the ViennaCL library for calculations. For good matrix
*8f86e40fSKarl Rupp   assembly performance the user should preallocate the matrix storage by setting
*8f86e40fSKarl Rupp   the parameter nz (or the array nnz).  By setting these parameters accurately,
*8f86e40fSKarl Rupp   performance during matrix assembly can be increased substantially.
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp   Collective on MPI_Comm
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp   Input Parameters:
*8f86e40fSKarl Rupp+  comm - MPI communicator, set to PETSC_COMM_SELF
*8f86e40fSKarl Rupp.  m - number of rows
*8f86e40fSKarl Rupp.  n - number of columns
*8f86e40fSKarl Rupp.  nz - number of nonzeros per row (same for all rows)
*8f86e40fSKarl Rupp-  nnz - array containing the number of nonzeros in the various rows
*8f86e40fSKarl Rupp         (possibly different for each row) or NULL
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp   Output Parameter:
*8f86e40fSKarl Rupp.  A - the matrix
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp   It is recommended that one use the MatCreate(), MatSetType() and/or MatSetFromOptions(),
*8f86e40fSKarl Rupp   MatXXXXSetPreallocation() paradigm instead of this routine directly.
*8f86e40fSKarl Rupp   [MatXXXXSetPreallocation() is, for example, MatSeqAIJSetPreallocation]
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp   Notes:
*8f86e40fSKarl Rupp   If nnz is given then nz is ignored
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp   The AIJ format (also called the Yale sparse matrix format or
*8f86e40fSKarl Rupp   compressed row storage), is fully compatible with standard Fortran 77
*8f86e40fSKarl Rupp   storage.  That is, the stored row and column indices can begin at
*8f86e40fSKarl Rupp   either one (as in Fortran) or zero.  See the users' manual for details.
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp   Specify the preallocated storage with either nz or nnz (not both).
*8f86e40fSKarl Rupp   Set nz=PETSC_DEFAULT and nnz=NULL for PETSc to control dynamic memory
*8f86e40fSKarl Rupp   allocation.  For large problems you MUST preallocate memory or you
*8f86e40fSKarl Rupp   will get TERRIBLE performance, see the users' manual chapter on matrices.
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp   By default, this format uses inodes (identical nodes) when possible, to
*8f86e40fSKarl Rupp   improve numerical efficiency of matrix-vector products and solves. We
*8f86e40fSKarl Rupp   search for consecutive rows with the same nonzero structure, thereby
*8f86e40fSKarl Rupp   reusing matrix information to achieve increased efficiency.
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp   Level: intermediate
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp.seealso: MatCreate(), MatCreateAIJ(), MatCreateAIJCUSP(), MatSetValues(), MatSeqAIJSetColumnIndices(), MatCreateSeqAIJWithArrays(), MatCreateAIJ(), MATMPIAIJVIENNACL, MATAIJVIENNACL
*8f86e40fSKarl Rupp@*/
*8f86e40fSKarl Rupp#undef __FUNCT__
*8f86e40fSKarl Rupp#define __FUNCT__ "MatCreateAIJViennaCL"
*8f86e40fSKarl RuppPetscErrorCode  MatCreateAIJViennaCL(MPI_Comm comm,PetscInt m,PetscInt n,PetscInt M,PetscInt N,PetscInt d_nz,const PetscInt d_nnz[],PetscInt o_nz,const PetscInt o_nnz[],Mat *A)
*8f86e40fSKarl Rupp{
*8f86e40fSKarl Rupp  PetscErrorCode ierr;
*8f86e40fSKarl Rupp  PetscMPIInt    size;
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp  PetscFunctionBegin;
*8f86e40fSKarl Rupp  ierr = MatCreate(comm,A);CHKERRQ(ierr);
*8f86e40fSKarl Rupp  ierr = MatSetSizes(*A,m,n,M,N);CHKERRQ(ierr);
*8f86e40fSKarl Rupp  ierr = MPI_Comm_size(comm,&size);CHKERRQ(ierr);
*8f86e40fSKarl Rupp  if (size > 1) {
*8f86e40fSKarl Rupp    ierr = MatSetType(*A,MATMPIAIJVIENNACL);CHKERRQ(ierr);
*8f86e40fSKarl Rupp    ierr = MatMPIAIJSetPreallocation(*A,d_nz,d_nnz,o_nz,o_nnz);CHKERRQ(ierr);
*8f86e40fSKarl Rupp  } else {
*8f86e40fSKarl Rupp    ierr = MatSetType(*A,MATSEQAIJVIENNACL);CHKERRQ(ierr);
*8f86e40fSKarl Rupp    ierr = MatSeqAIJSetPreallocation(*A,d_nz,d_nnz);CHKERRQ(ierr);
*8f86e40fSKarl Rupp  }
*8f86e40fSKarl Rupp  PetscFunctionReturn(0);
*8f86e40fSKarl Rupp}
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp/*M
*8f86e40fSKarl Rupp   MATAIJVIENNACL - MATMPIAIJVIENNACL= "aijviennacl" = "mpiaijviennacl" - A matrix type to be used for sparse matrices.
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp   A matrix type (CSR format) whose data resides on GPUs.
*8f86e40fSKarl Rupp   All matrix calculations are performed using the ViennaCL library.
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp   This matrix type is identical to MATSEQAIJVIENNACL when constructed with a single process communicator,
*8f86e40fSKarl Rupp   and MATMPIAIJVIENNACL otherwise.  As a result, for single process communicators,
*8f86e40fSKarl Rupp   MatSeqAIJSetPreallocation is supported, and similarly MatMPIAIJSetPreallocation is supported
*8f86e40fSKarl Rupp   for communicators controlling multiple processes.  It is recommended that you call both of
*8f86e40fSKarl Rupp   the above preallocation routines for simplicity.
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp   Options Database Keys:
*8f86e40fSKarl Rupp+  -mat_type mpiaijviennacl - sets the matrix type to "mpiaijviennacl" during a call to MatSetFromOptions()
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp  Level: beginner
*8f86e40fSKarl Rupp
*8f86e40fSKarl Rupp .seealso: MatCreateAIJViennaCL(), MATSEQAIJVIENNACL, MatCreateSeqAIJVIENNACL()
*8f86e40fSKarl RuppM*/
*8f86e40fSKarl Rupp