xref: /petsc/src/mat/tests/ex70.c (revision 9566063d113dddea24716c546802770db7481bc0)
16280154eSStefano Zampini #include <petscmat.h>
26280154eSStefano Zampini 
375ab9b9fSStefano Zampini static char help[] = "Tests MatMat operations with MAT_REUSE_MATRIX and already allocated dense result.\n\n";
475ab9b9fSStefano Zampini 
575ab9b9fSStefano Zampini static PetscScalar MAGIC_NUMBER = 12345;
66280154eSStefano Zampini 
76280154eSStefano Zampini static PetscErrorCode CheckLocal(Mat A, Mat B, PetscScalar *a, PetscScalar *b)
86280154eSStefano Zampini {
96280154eSStefano Zampini   PetscBool      wA = PETSC_FALSE, wB = PETSC_FALSE;
1075ab9b9fSStefano Zampini   PetscBool      wAv = PETSC_FALSE, wBv = PETSC_FALSE;
1175ab9b9fSStefano Zampini   PetscInt       lda,i,j,m,n;
126280154eSStefano Zampini 
136280154eSStefano Zampini   PetscFunctionBegin;
146280154eSStefano Zampini   if (a) {
156280154eSStefano Zampini     const PetscScalar *Aa;
16*9566063dSJacob Faibussowitsch     PetscCall(MatDenseGetArrayRead(A,&Aa));
176280154eSStefano Zampini     wA   = (PetscBool)(a != Aa);
18*9566063dSJacob Faibussowitsch     PetscCall(MatDenseGetLDA(A,&lda));
19*9566063dSJacob Faibussowitsch     PetscCall(MatGetLocalSize(A,&m,&n));
2075ab9b9fSStefano Zampini     for (j=0;j<n;j++) {
2175ab9b9fSStefano Zampini       for (i=m;i<lda;i++) {
2275ab9b9fSStefano Zampini         if (Aa[j*lda +i] != MAGIC_NUMBER) wAv = PETSC_TRUE;
2375ab9b9fSStefano Zampini       }
2475ab9b9fSStefano Zampini     }
25*9566063dSJacob Faibussowitsch     PetscCall(MatDenseRestoreArrayRead(A,&Aa));
266280154eSStefano Zampini   }
276280154eSStefano Zampini   if (b) {
286280154eSStefano Zampini     const PetscScalar *Bb;
29*9566063dSJacob Faibussowitsch     PetscCall(MatDenseGetArrayRead(B,&Bb));
306280154eSStefano Zampini     wB   = (PetscBool)(b != Bb);
31*9566063dSJacob Faibussowitsch     PetscCall(MatDenseGetLDA(B,&lda));
32*9566063dSJacob Faibussowitsch     PetscCall(MatGetLocalSize(B,&m,&n));
3375ab9b9fSStefano Zampini     for (j=0;j<n;j++) {
3475ab9b9fSStefano Zampini       for (i=m;i<lda;i++) {
3575ab9b9fSStefano Zampini         if (Bb[j*lda +i] != MAGIC_NUMBER) wBv = PETSC_TRUE;
3675ab9b9fSStefano Zampini       }
3775ab9b9fSStefano Zampini     }
38*9566063dSJacob Faibussowitsch     PetscCall(MatDenseRestoreArrayRead(B,&Bb));
396280154eSStefano Zampini   }
402c71b3e2SJacob Faibussowitsch   PetscCheckFalse(wA || wB,PETSC_COMM_SELF,PETSC_ERR_PLIB,"Wrong array in first Mat? %d, Wrong array in second Mat? %d",wA,wB);
412c71b3e2SJacob Faibussowitsch   PetscCheckFalse(wAv || wBv,PETSC_COMM_SELF,PETSC_ERR_PLIB,"Wrong data in first Mat? %d, Wrong data in second Mat? %d",wAv,wBv);
4275ab9b9fSStefano Zampini   PetscFunctionReturn(0);
4375ab9b9fSStefano Zampini }
4475ab9b9fSStefano Zampini 
4575ab9b9fSStefano Zampini typedef struct {
4675ab9b9fSStefano Zampini   Mat A;
4775ab9b9fSStefano Zampini   Mat P;
4875ab9b9fSStefano Zampini   Mat R;
4975ab9b9fSStefano Zampini } proj_data;
5075ab9b9fSStefano Zampini 
5175ab9b9fSStefano Zampini PetscErrorCode proj_destroy(void *ctx)
5275ab9b9fSStefano Zampini {
5375ab9b9fSStefano Zampini   proj_data      *userdata = (proj_data*)ctx;
5475ab9b9fSStefano Zampini 
5575ab9b9fSStefano Zampini   PetscFunctionBegin;
5628b400f6SJacob Faibussowitsch   PetscCheck(userdata,PETSC_COMM_SELF,PETSC_ERR_PLIB,"Missing userdata");
57*9566063dSJacob Faibussowitsch   PetscCall(MatDestroy(&userdata->A));
58*9566063dSJacob Faibussowitsch   PetscCall(MatDestroy(&userdata->P));
59*9566063dSJacob Faibussowitsch   PetscCall(MatDestroy(&userdata->R));
60*9566063dSJacob Faibussowitsch   PetscCall(PetscFree(userdata));
6175ab9b9fSStefano Zampini   PetscFunctionReturn(0);
6275ab9b9fSStefano Zampini }
6375ab9b9fSStefano Zampini 
6475ab9b9fSStefano Zampini PetscErrorCode proj_mult(Mat S, Vec X, Vec Y)
6575ab9b9fSStefano Zampini {
6675ab9b9fSStefano Zampini   Mat            A,R,P;
6775ab9b9fSStefano Zampini   Vec            Ax,Ay;
6875ab9b9fSStefano Zampini   Vec            Px,Py;
6975ab9b9fSStefano Zampini   proj_data      *userdata;
7075ab9b9fSStefano Zampini 
7175ab9b9fSStefano Zampini   PetscFunctionBegin;
72*9566063dSJacob Faibussowitsch   PetscCall(MatShellGetContext(S,&userdata));
7328b400f6SJacob Faibussowitsch   PetscCheck(userdata,PetscObjectComm((PetscObject)S),PETSC_ERR_PLIB,"Missing userdata");
7475ab9b9fSStefano Zampini   A = userdata->A;
7575ab9b9fSStefano Zampini   R = userdata->R;
7675ab9b9fSStefano Zampini   P = userdata->P;
7728b400f6SJacob Faibussowitsch   PetscCheck(A,PetscObjectComm((PetscObject)S),PETSC_ERR_PLIB,"Missing matrix");
782c71b3e2SJacob Faibussowitsch   PetscCheckFalse(!R && !P,PetscObjectComm((PetscObject)S),PETSC_ERR_PLIB,"Missing projectors");
792c71b3e2SJacob Faibussowitsch   PetscCheckFalse(R && P,PetscObjectComm((PetscObject)S),PETSC_ERR_PLIB,"Both projectors");
80*9566063dSJacob Faibussowitsch   PetscCall(MatCreateVecs(A,&Ax,&Ay));
8175ab9b9fSStefano Zampini   if (R) {
82*9566063dSJacob Faibussowitsch     PetscCall(MatCreateVecs(R,&Py,&Px));
8375ab9b9fSStefano Zampini   } else {
84*9566063dSJacob Faibussowitsch     PetscCall(MatCreateVecs(P,&Px,&Py));
8575ab9b9fSStefano Zampini   }
86*9566063dSJacob Faibussowitsch   PetscCall(VecCopy(X,Px));
8775ab9b9fSStefano Zampini   if (P) {
88*9566063dSJacob Faibussowitsch     PetscCall(MatMult(P,Px,Py));
8975ab9b9fSStefano Zampini   } else {
90*9566063dSJacob Faibussowitsch     PetscCall(MatMultTranspose(R,Px,Py));
9175ab9b9fSStefano Zampini   }
92*9566063dSJacob Faibussowitsch   PetscCall(VecCopy(Py,Ax));
93*9566063dSJacob Faibussowitsch   PetscCall(MatMult(A,Ax,Ay));
94*9566063dSJacob Faibussowitsch   PetscCall(VecCopy(Ay,Py));
9575ab9b9fSStefano Zampini   if (P) {
96*9566063dSJacob Faibussowitsch     PetscCall(MatMultTranspose(P,Py,Px));
9775ab9b9fSStefano Zampini   } else {
98*9566063dSJacob Faibussowitsch     PetscCall(MatMult(R,Py,Px));
9975ab9b9fSStefano Zampini   }
100*9566063dSJacob Faibussowitsch   PetscCall(VecCopy(Px,Y));
101*9566063dSJacob Faibussowitsch   PetscCall(VecDestroy(&Px));
102*9566063dSJacob Faibussowitsch   PetscCall(VecDestroy(&Py));
103*9566063dSJacob Faibussowitsch   PetscCall(VecDestroy(&Ax));
104*9566063dSJacob Faibussowitsch   PetscCall(VecDestroy(&Ay));
10575ab9b9fSStefano Zampini   PetscFunctionReturn(0);
10675ab9b9fSStefano Zampini }
10775ab9b9fSStefano Zampini 
10875ab9b9fSStefano Zampini PetscErrorCode MyPtShellPMultSymbolic(Mat S, Mat P, Mat PtAP, void** ctx)
10975ab9b9fSStefano Zampini {
11075ab9b9fSStefano Zampini   proj_data      *userdata;
11175ab9b9fSStefano Zampini 
11275ab9b9fSStefano Zampini   PetscFunctionBegin;
113*9566063dSJacob Faibussowitsch   PetscCall(PetscNew(&userdata));
114*9566063dSJacob Faibussowitsch   PetscCall(MatShellSetContext(PtAP,userdata));
11575ab9b9fSStefano Zampini   *ctx = (void *)userdata;
11675ab9b9fSStefano Zampini   PetscFunctionReturn(0);
11775ab9b9fSStefano Zampini }
11875ab9b9fSStefano Zampini 
11975ab9b9fSStefano Zampini PetscErrorCode MyPtShellPMultNumeric(Mat S, Mat P, Mat PtAP, void *ctx)
12075ab9b9fSStefano Zampini {
12175ab9b9fSStefano Zampini   Mat            A;
12275ab9b9fSStefano Zampini   proj_data      *userdata = (proj_data*)ctx;
12375ab9b9fSStefano Zampini 
12475ab9b9fSStefano Zampini   PetscFunctionBegin;
125*9566063dSJacob Faibussowitsch   PetscCall(MatShellGetContext(S,&A));
126*9566063dSJacob Faibussowitsch   PetscCall(PetscObjectReference((PetscObject)A));
127*9566063dSJacob Faibussowitsch   PetscCall(PetscObjectReference((PetscObject)P));
128*9566063dSJacob Faibussowitsch   PetscCall(MatDestroy(&userdata->A));
129*9566063dSJacob Faibussowitsch   PetscCall(MatDestroy(&userdata->P));
130*9566063dSJacob Faibussowitsch   PetscCall(MatDestroy(&userdata->R));
13175ab9b9fSStefano Zampini   userdata->A = A;
13275ab9b9fSStefano Zampini   userdata->P = P;
133*9566063dSJacob Faibussowitsch   PetscCall(MatShellSetOperation(PtAP,MATOP_MULT,(void (*)(void))proj_mult));
134*9566063dSJacob Faibussowitsch   PetscCall(MatSetUp(PtAP));
135*9566063dSJacob Faibussowitsch   PetscCall(MatAssemblyBegin(PtAP,MAT_FINAL_ASSEMBLY));
136*9566063dSJacob Faibussowitsch   PetscCall(MatAssemblyEnd(PtAP,MAT_FINAL_ASSEMBLY));
13775ab9b9fSStefano Zampini   PetscFunctionReturn(0);
13875ab9b9fSStefano Zampini }
13975ab9b9fSStefano Zampini 
14075ab9b9fSStefano Zampini PetscErrorCode MyRShellRtMultSymbolic(Mat S, Mat R, Mat RARt, void **ctx)
14175ab9b9fSStefano Zampini {
14275ab9b9fSStefano Zampini   proj_data      *userdata;
14375ab9b9fSStefano Zampini 
14475ab9b9fSStefano Zampini   PetscFunctionBegin;
145*9566063dSJacob Faibussowitsch   PetscCall(PetscNew(&userdata));
146*9566063dSJacob Faibussowitsch   PetscCall(MatShellSetContext(RARt,userdata));
14775ab9b9fSStefano Zampini   *ctx = (void *)userdata;
14875ab9b9fSStefano Zampini   PetscFunctionReturn(0);
14975ab9b9fSStefano Zampini }
15075ab9b9fSStefano Zampini 
15175ab9b9fSStefano Zampini PetscErrorCode MyRShellRtMultNumeric(Mat S, Mat R, Mat RARt, void *ctx)
15275ab9b9fSStefano Zampini {
15375ab9b9fSStefano Zampini   Mat            A;
15475ab9b9fSStefano Zampini   proj_data      *userdata = (proj_data*)ctx;
15575ab9b9fSStefano Zampini 
15675ab9b9fSStefano Zampini   PetscFunctionBegin;
157*9566063dSJacob Faibussowitsch   PetscCall(MatShellGetContext(S,&A));
158*9566063dSJacob Faibussowitsch   PetscCall(PetscObjectReference((PetscObject)A));
159*9566063dSJacob Faibussowitsch   PetscCall(PetscObjectReference((PetscObject)R));
160*9566063dSJacob Faibussowitsch   PetscCall(MatDestroy(&userdata->A));
161*9566063dSJacob Faibussowitsch   PetscCall(MatDestroy(&userdata->P));
162*9566063dSJacob Faibussowitsch   PetscCall(MatDestroy(&userdata->R));
16375ab9b9fSStefano Zampini   userdata->A = A;
16475ab9b9fSStefano Zampini   userdata->R = R;
165*9566063dSJacob Faibussowitsch   PetscCall(MatShellSetOperation(RARt,MATOP_MULT,(void (*)(void))proj_mult));
166*9566063dSJacob Faibussowitsch   PetscCall(MatSetUp(RARt));
167*9566063dSJacob Faibussowitsch   PetscCall(MatAssemblyBegin(RARt,MAT_FINAL_ASSEMBLY));
168*9566063dSJacob Faibussowitsch   PetscCall(MatAssemblyEnd(RARt,MAT_FINAL_ASSEMBLY));
16975ab9b9fSStefano Zampini   PetscFunctionReturn(0);
17075ab9b9fSStefano Zampini }
17175ab9b9fSStefano Zampini 
17275ab9b9fSStefano Zampini PetscErrorCode MyMatShellMatMultNumeric(Mat S, Mat B, Mat C, void *ctx)
17375ab9b9fSStefano Zampini {
17475ab9b9fSStefano Zampini   Mat            A;
17575ab9b9fSStefano Zampini 
17675ab9b9fSStefano Zampini   PetscFunctionBegin;
177*9566063dSJacob Faibussowitsch   PetscCall(MatShellGetContext(S,&A));
178*9566063dSJacob Faibussowitsch   PetscCall(MatMatMult(A,B,MAT_REUSE_MATRIX,PETSC_DEFAULT,&C));
17975ab9b9fSStefano Zampini   PetscFunctionReturn(0);
18075ab9b9fSStefano Zampini }
18175ab9b9fSStefano Zampini 
18275ab9b9fSStefano Zampini PetscErrorCode MyMatTransposeShellMatMultNumeric(Mat S, Mat B, Mat C, void *ctx)
18375ab9b9fSStefano Zampini {
18475ab9b9fSStefano Zampini   Mat            A;
18575ab9b9fSStefano Zampini 
18675ab9b9fSStefano Zampini   PetscFunctionBegin;
187*9566063dSJacob Faibussowitsch   PetscCall(MatShellGetContext(S,&A));
188*9566063dSJacob Faibussowitsch   PetscCall(MatTransposeMatMult(A,B,MAT_REUSE_MATRIX,PETSC_DEFAULT,&C));
18975ab9b9fSStefano Zampini   PetscFunctionReturn(0);
19075ab9b9fSStefano Zampini }
19175ab9b9fSStefano Zampini 
19275ab9b9fSStefano Zampini PetscErrorCode MyMatShellMatTransposeMultNumeric(Mat S, Mat B, Mat C, void *ctx)
19375ab9b9fSStefano Zampini {
19475ab9b9fSStefano Zampini   Mat            A;
19575ab9b9fSStefano Zampini 
19675ab9b9fSStefano Zampini   PetscFunctionBegin;
197*9566063dSJacob Faibussowitsch   PetscCall(MatShellGetContext(S,&A));
198*9566063dSJacob Faibussowitsch   PetscCall(MatMatTransposeMult(A,B,MAT_REUSE_MATRIX,PETSC_DEFAULT,&C));
1996280154eSStefano Zampini   PetscFunctionReturn(0);
2006280154eSStefano Zampini }
2016280154eSStefano Zampini 
2026280154eSStefano Zampini int main(int argc,char **args)
2036280154eSStefano Zampini {
20475ab9b9fSStefano Zampini   Mat            X,B,A,Bt,T,T2,PtAP = NULL,RARt = NULL, R = NULL;
20575ab9b9fSStefano Zampini   Vec            r,l,rs,ls;
20675ab9b9fSStefano Zampini   PetscInt       m,n,k,M = 10,N = 10,K = 5, ldx = 3, ldb = 5, ldr = 4;
2076280154eSStefano Zampini   const char     *deft = MATAIJ;
2086280154eSStefano Zampini   char           mattype[256];
2096280154eSStefano Zampini   PetscBool      flg,symm = PETSC_FALSE,testtt = PETSC_TRUE, testnest = PETSC_TRUE, testtranspose = PETSC_TRUE, testcircular = PETSC_FALSE, local = PETSC_TRUE;
2103604c0aeSStefano Zampini   PetscBool      testhtranspose = PETSC_TRUE;
21175ab9b9fSStefano Zampini   PetscBool      xgpu = PETSC_FALSE, bgpu = PETSC_FALSE, testshellops = PETSC_FALSE, testproj = PETSC_TRUE, testrart = PETSC_TRUE, testmatmatt = PETSC_TRUE, testmattmat = PETSC_TRUE;
21275ab9b9fSStefano Zampini   PetscScalar    *dataX = NULL,*dataB = NULL, *dataR = NULL, *dataBt = NULL;
21375ab9b9fSStefano Zampini   PetscScalar    *aX,*aB,*aBt;
214456288a8SStefano Zampini   PetscReal      err;
2156280154eSStefano Zampini   PetscErrorCode ierr;
2166280154eSStefano Zampini 
217*9566063dSJacob Faibussowitsch   PetscCall(PetscInitialize(&argc,&args,NULL,help));
218*9566063dSJacob Faibussowitsch   PetscCall(PetscOptionsGetInt(NULL,NULL,"-N",&N,NULL));
219*9566063dSJacob Faibussowitsch   PetscCall(PetscOptionsGetInt(NULL,NULL,"-M",&M,NULL));
220*9566063dSJacob Faibussowitsch   PetscCall(PetscOptionsGetInt(NULL,NULL,"-K",&K,NULL));
221*9566063dSJacob Faibussowitsch   PetscCall(PetscOptionsGetBool(NULL,NULL,"-symm",&symm,NULL));
222*9566063dSJacob Faibussowitsch   PetscCall(PetscOptionsGetBool(NULL,NULL,"-local",&local,NULL));
223*9566063dSJacob Faibussowitsch   PetscCall(PetscOptionsGetInt(NULL,NULL,"-ldx",&ldx,NULL));
224*9566063dSJacob Faibussowitsch   PetscCall(PetscOptionsGetInt(NULL,NULL,"-ldb",&ldb,NULL));
225*9566063dSJacob Faibussowitsch   PetscCall(PetscOptionsGetInt(NULL,NULL,"-ldr",&ldr,NULL));
226*9566063dSJacob Faibussowitsch   PetscCall(PetscOptionsGetBool(NULL,NULL,"-testtranspose",&testtranspose,NULL));
227*9566063dSJacob Faibussowitsch   PetscCall(PetscOptionsGetBool(NULL,NULL,"-testnest",&testnest,NULL));
228*9566063dSJacob Faibussowitsch   PetscCall(PetscOptionsGetBool(NULL,NULL,"-testtt",&testtt,NULL));
229*9566063dSJacob Faibussowitsch   PetscCall(PetscOptionsGetBool(NULL,NULL,"-testcircular",&testcircular,NULL));
230*9566063dSJacob Faibussowitsch   PetscCall(PetscOptionsGetBool(NULL,NULL,"-testshellops",&testshellops,NULL));
231*9566063dSJacob Faibussowitsch   PetscCall(PetscOptionsGetBool(NULL,NULL,"-testproj",&testproj,NULL));
232*9566063dSJacob Faibussowitsch   PetscCall(PetscOptionsGetBool(NULL,NULL,"-testrart",&testrart,NULL));
233*9566063dSJacob Faibussowitsch   PetscCall(PetscOptionsGetBool(NULL,NULL,"-testmatmatt",&testmatmatt,NULL));
234*9566063dSJacob Faibussowitsch   PetscCall(PetscOptionsGetBool(NULL,NULL,"-testmattmat",&testmattmat,NULL));
235*9566063dSJacob Faibussowitsch   PetscCall(PetscOptionsGetBool(NULL,NULL,"-xgpu",&xgpu,NULL));
236*9566063dSJacob Faibussowitsch   PetscCall(PetscOptionsGetBool(NULL,NULL,"-bgpu",&bgpu,NULL));
237*9566063dSJacob Faibussowitsch   PetscCall(PetscOptionsGetScalar(NULL,NULL,"-magic_number",&MAGIC_NUMBER,NULL));
23875ab9b9fSStefano Zampini   if (M != N) testproj = PETSC_FALSE;
23975ab9b9fSStefano Zampini 
240*9566063dSJacob Faibussowitsch   PetscCall(MatCreate(PETSC_COMM_WORLD,&A));
241*9566063dSJacob Faibussowitsch   PetscCall(MatSetSizes(A,PETSC_DECIDE,PETSC_DECIDE,M,N));
242*9566063dSJacob Faibussowitsch   PetscCall(MatSetType(A,MATAIJ));
243*9566063dSJacob Faibussowitsch   PetscCall(MatSetUp(A));
244*9566063dSJacob Faibussowitsch   PetscCall(MatSetRandom(A,NULL));
2456280154eSStefano Zampini   if (M==N && symm) {
2466280154eSStefano Zampini     Mat AT;
2476280154eSStefano Zampini 
248*9566063dSJacob Faibussowitsch     PetscCall(MatTranspose(A,MAT_INITIAL_MATRIX,&AT));
249*9566063dSJacob Faibussowitsch     PetscCall(MatAXPY(A,1.0,AT,DIFFERENT_NONZERO_PATTERN));
250*9566063dSJacob Faibussowitsch     PetscCall(MatDestroy(&AT));
251*9566063dSJacob Faibussowitsch     PetscCall(MatSetOption(A,MAT_SYMMETRIC,PETSC_TRUE));
2526280154eSStefano Zampini   }
253*9566063dSJacob Faibussowitsch   PetscCall(MatViewFromOptions(A,NULL,"-A_init_view"));
254*9566063dSJacob Faibussowitsch   ierr = PetscOptionsBegin(PETSC_COMM_WORLD,"","","");PetscCall(ierr);
255*9566063dSJacob Faibussowitsch   PetscCall(PetscOptionsFList("-A_mat_type","Matrix type","MatSetType",MatList,deft,mattype,256,&flg));
256*9566063dSJacob Faibussowitsch   ierr = PetscOptionsEnd();PetscCall(ierr);
2576280154eSStefano Zampini   if (flg) {
2586280154eSStefano Zampini     Mat A2;
2596280154eSStefano Zampini 
260*9566063dSJacob Faibussowitsch     PetscCall(MatDuplicate(A,MAT_COPY_VALUES,&A2));
261*9566063dSJacob Faibussowitsch     PetscCall(MatConvert(A,mattype,MAT_INPLACE_MATRIX,&A));
262*9566063dSJacob Faibussowitsch     PetscCall(MatMultEqual(A,A2,10,&flg));
2636280154eSStefano Zampini     if (!flg) {
2646280154eSStefano Zampini       Mat AE,A2E;
2656280154eSStefano Zampini 
266*9566063dSJacob Faibussowitsch       PetscCall(PetscPrintf(PETSC_COMM_WORLD,"Error with convert\n"));
267*9566063dSJacob Faibussowitsch       PetscCall(MatComputeOperator(A,MATDENSE,&AE));
268*9566063dSJacob Faibussowitsch       PetscCall(MatComputeOperator(A2,MATDENSE,&A2E));
269*9566063dSJacob Faibussowitsch       PetscCall(MatView(AE,NULL));
270*9566063dSJacob Faibussowitsch       PetscCall(MatView(A2E,NULL));
271*9566063dSJacob Faibussowitsch       PetscCall(MatAXPY(A2E,-1.0,A,SAME_NONZERO_PATTERN));
272*9566063dSJacob Faibussowitsch       PetscCall(MatView(A2E,NULL));
273*9566063dSJacob Faibussowitsch       PetscCall(MatDestroy(&A2E));
274*9566063dSJacob Faibussowitsch       PetscCall(MatDestroy(&AE));
2756280154eSStefano Zampini     }
276*9566063dSJacob Faibussowitsch     PetscCall(MatDestroy(&A2));
2776280154eSStefano Zampini   }
278*9566063dSJacob Faibussowitsch   PetscCall(MatViewFromOptions(A,NULL,"-A_view"));
2796280154eSStefano Zampini 
280*9566063dSJacob Faibussowitsch   PetscCall(MatGetLocalSize(A,&m,&n));
2816280154eSStefano Zampini   if (local) {
28275ab9b9fSStefano Zampini     PetscInt i;
28375ab9b9fSStefano Zampini 
284*9566063dSJacob Faibussowitsch     PetscCall(PetscMalloc1((m+ldx)*K,&dataX));
285*9566063dSJacob Faibussowitsch     PetscCall(PetscMalloc1((n+ldb)*K,&dataB));
286a0638e9dSStefano Zampini     for (i=0;i<(m+ldx)*K;i++) dataX[i] = MAGIC_NUMBER;
287a0638e9dSStefano Zampini     for (i=0;i<(n+ldb)*K;i++) dataB[i] = MAGIC_NUMBER;
2886280154eSStefano Zampini   }
289*9566063dSJacob Faibussowitsch   PetscCall(MatCreateDense(PETSC_COMM_WORLD,n,PETSC_DECIDE,N,K,dataB,&B));
290*9566063dSJacob Faibussowitsch   PetscCall(MatCreateDense(PETSC_COMM_WORLD,m,PETSC_DECIDE,M,K,dataX,&X));
29175ab9b9fSStefano Zampini   if (local) {
292*9566063dSJacob Faibussowitsch     PetscCall(MatDenseSetLDA(X,m+ldx));
293*9566063dSJacob Faibussowitsch     PetscCall(MatDenseSetLDA(B,n+ldb));
29475ab9b9fSStefano Zampini   }
295*9566063dSJacob Faibussowitsch   PetscCall(MatGetLocalSize(B,NULL,&k));
29675ab9b9fSStefano Zampini   if (local) {
29775ab9b9fSStefano Zampini     PetscInt i;
29875ab9b9fSStefano Zampini 
299*9566063dSJacob Faibussowitsch     PetscCall(PetscMalloc1((k+ldr)*N,&dataBt));
300a0638e9dSStefano Zampini     for (i=0;i<(k+ldr)*N;i++) dataBt[i] = MAGIC_NUMBER;
30175ab9b9fSStefano Zampini   }
302*9566063dSJacob Faibussowitsch   PetscCall(MatCreateDense(PETSC_COMM_WORLD,k,n,K,N,dataBt,&Bt));
30375ab9b9fSStefano Zampini   if (local) {
304*9566063dSJacob Faibussowitsch     PetscCall(MatDenseSetLDA(Bt,k+ldr));
30575ab9b9fSStefano Zampini   }
3066280154eSStefano Zampini 
3076280154eSStefano Zampini   /* store pointer to dense data for testing */
308*9566063dSJacob Faibussowitsch   PetscCall(MatDenseGetArrayRead(B,(const PetscScalar**)&dataB));
309*9566063dSJacob Faibussowitsch   PetscCall(MatDenseGetArrayRead(X,(const PetscScalar**)&dataX));
310*9566063dSJacob Faibussowitsch   PetscCall(MatDenseGetArrayRead(Bt,(const PetscScalar**)&dataBt));
3116280154eSStefano Zampini   aX   = dataX;
3126280154eSStefano Zampini   aB   = dataB;
31375ab9b9fSStefano Zampini   aBt  = dataBt;
314*9566063dSJacob Faibussowitsch   PetscCall(MatDenseRestoreArrayRead(Bt,(const PetscScalar**)&dataBt));
315*9566063dSJacob Faibussowitsch   PetscCall(MatDenseRestoreArrayRead(B,(const PetscScalar**)&dataB));
316*9566063dSJacob Faibussowitsch   PetscCall(MatDenseRestoreArrayRead(X,(const PetscScalar**)&dataX));
3176280154eSStefano Zampini   if (local) {
3186280154eSStefano Zampini     dataX  = aX;
3196280154eSStefano Zampini     dataB  = aB;
32075ab9b9fSStefano Zampini     dataBt = aBt;
3216280154eSStefano Zampini   }
32275ab9b9fSStefano Zampini 
323*9566063dSJacob Faibussowitsch   PetscCall(MatSetRandom(X,NULL));
324*9566063dSJacob Faibussowitsch   PetscCall(MatSetRandom(B,NULL));
325*9566063dSJacob Faibussowitsch   PetscCall(MatSetRandom(Bt,NULL));
326*9566063dSJacob Faibussowitsch   PetscCall(CheckLocal(X,NULL,aX,NULL));
327*9566063dSJacob Faibussowitsch   PetscCall(CheckLocal(Bt,B,aBt,aB));
32875ab9b9fSStefano Zampini 
329456288a8SStefano Zampini   /* convert to CUDA if needed */
330456288a8SStefano Zampini   if (bgpu) {
331*9566063dSJacob Faibussowitsch     PetscCall(MatConvert(B,MATDENSECUDA,MAT_INPLACE_MATRIX,&B));
332*9566063dSJacob Faibussowitsch     PetscCall(MatConvert(Bt,MATDENSECUDA,MAT_INPLACE_MATRIX,&Bt));
333456288a8SStefano Zampini   }
334456288a8SStefano Zampini   if (xgpu) {
335*9566063dSJacob Faibussowitsch     PetscCall(MatConvert(X,MATDENSECUDA,MAT_INPLACE_MATRIX,&X));
336456288a8SStefano Zampini   }
337*9566063dSJacob Faibussowitsch   PetscCall(CheckLocal(B,X,aB,aX));
3386280154eSStefano Zampini 
339e7b38fdfSStefano Zampini   /* Test MatDenseGetSubMatrix */
340e7b38fdfSStefano Zampini   {
341e7b38fdfSStefano Zampini     Mat B2,T3,T4;
342e7b38fdfSStefano Zampini 
343*9566063dSJacob Faibussowitsch     PetscCall(MatDuplicate(B,MAT_COPY_VALUES,&B2));
344*9566063dSJacob Faibussowitsch     PetscCall(MatDuplicate(B,MAT_DO_NOT_COPY_VALUES,&T4));
345*9566063dSJacob Faibussowitsch     PetscCall(MatSetRandom(T4,NULL));
346*9566063dSJacob Faibussowitsch     PetscCall(MatAXPY(B2,1.0,T4,SAME_NONZERO_PATTERN));
347*9566063dSJacob Faibussowitsch     PetscCall(MatDenseGetSubMatrix(B,PetscMin(1,K),PetscMin(2,K),&T));
348*9566063dSJacob Faibussowitsch     PetscCall(MatDenseGetSubMatrix(T4,PetscMin(1,K),PetscMin(2,K),&T2));
349*9566063dSJacob Faibussowitsch     PetscCall(MatDenseGetSubMatrix(B2,PetscMin(1,K),PetscMin(2,K),&T3));
350*9566063dSJacob Faibussowitsch     PetscCall(MatAXPY(T,1.0,T2,SAME_NONZERO_PATTERN));
351*9566063dSJacob Faibussowitsch     PetscCall(MatAXPY(T3,-1.0,T,SAME_NONZERO_PATTERN));
352*9566063dSJacob Faibussowitsch     PetscCall(MatNorm(T3,NORM_FROBENIUS,&err));
353e7b38fdfSStefano Zampini     if (err > PETSC_SMALL) {
354*9566063dSJacob Faibussowitsch       PetscCall(PetscPrintf(PETSC_COMM_WORLD,"Error with MatDenseGetSubMatrix\n"));
355*9566063dSJacob Faibussowitsch       PetscCall(MatView(T3,NULL));
356e7b38fdfSStefano Zampini     }
357*9566063dSJacob Faibussowitsch     PetscCall(MatDenseRestoreSubMatrix(B,&T));
358*9566063dSJacob Faibussowitsch     PetscCall(MatDenseRestoreSubMatrix(T4,&T2));
359*9566063dSJacob Faibussowitsch     PetscCall(MatDenseRestoreSubMatrix(B2,&T3));
360*9566063dSJacob Faibussowitsch     PetscCall(CheckLocal(B,NULL,aB,NULL));
361*9566063dSJacob Faibussowitsch     PetscCall(MatDestroy(&B2));
362*9566063dSJacob Faibussowitsch     PetscCall(MatDestroy(&T4));
363e7b38fdfSStefano Zampini   }
364e7b38fdfSStefano Zampini 
3656280154eSStefano Zampini   /* Test reusing a previously allocated dense buffer */
366*9566063dSJacob Faibussowitsch   PetscCall(MatMatMult(A,B,MAT_REUSE_MATRIX,PETSC_DEFAULT,&X));
367*9566063dSJacob Faibussowitsch   PetscCall(CheckLocal(B,X,aB,aX));
368*9566063dSJacob Faibussowitsch   PetscCall(MatMatMultEqual(A,B,X,10,&flg));
3696280154eSStefano Zampini   if (!flg) {
370*9566063dSJacob Faibussowitsch     PetscCall(PetscPrintf(PETSC_COMM_WORLD,"Error with reusage\n"));
371*9566063dSJacob Faibussowitsch     PetscCall(MatMatMult(A,B,MAT_INITIAL_MATRIX,PETSC_DEFAULT,&T));
372*9566063dSJacob Faibussowitsch     PetscCall(MatAXPY(T,-1.0,X,SAME_NONZERO_PATTERN));
373*9566063dSJacob Faibussowitsch     PetscCall(MatView(T,NULL));
374*9566063dSJacob Faibussowitsch     PetscCall(MatDestroy(&T));
3756280154eSStefano Zampini   }
3766280154eSStefano Zampini 
37775ab9b9fSStefano Zampini   /* Test MatTransposeMat and MatMatTranspose */
37875ab9b9fSStefano Zampini   if (testmattmat) {
379*9566063dSJacob Faibussowitsch     PetscCall(MatTransposeMatMult(A,X,MAT_REUSE_MATRIX,PETSC_DEFAULT,&B));
380*9566063dSJacob Faibussowitsch     PetscCall(CheckLocal(B,X,aB,aX));
381*9566063dSJacob Faibussowitsch     PetscCall(MatTransposeMatMultEqual(A,X,B,10,&flg));
38275ab9b9fSStefano Zampini     if (!flg) {
383*9566063dSJacob Faibussowitsch       PetscCall(PetscPrintf(PETSC_COMM_WORLD,"Error with reusage (MatTransposeMat)\n"));
384*9566063dSJacob Faibussowitsch       PetscCall(MatTransposeMatMult(A,X,MAT_INITIAL_MATRIX,PETSC_DEFAULT,&B));
385*9566063dSJacob Faibussowitsch       PetscCall(MatAXPY(T,-1.0,B,SAME_NONZERO_PATTERN));
386*9566063dSJacob Faibussowitsch       PetscCall(MatView(T,NULL));
387*9566063dSJacob Faibussowitsch       PetscCall(MatDestroy(&T));
38875ab9b9fSStefano Zampini     }
38975ab9b9fSStefano Zampini   }
39075ab9b9fSStefano Zampini   if (testmatmatt) {
391*9566063dSJacob Faibussowitsch     PetscCall(MatMatTransposeMult(A,Bt,MAT_REUSE_MATRIX,PETSC_DEFAULT,&X));
392*9566063dSJacob Faibussowitsch     PetscCall(CheckLocal(Bt,X,aBt,aX));
393*9566063dSJacob Faibussowitsch     PetscCall(MatMatTransposeMultEqual(A,Bt,X,10,&flg));
39475ab9b9fSStefano Zampini     if (!flg) {
395*9566063dSJacob Faibussowitsch       PetscCall(PetscPrintf(PETSC_COMM_WORLD,"Error with reusage (MatMatTranspose)\n"));
396*9566063dSJacob Faibussowitsch       PetscCall(MatMatTransposeMult(A,Bt,MAT_INITIAL_MATRIX,PETSC_DEFAULT,&T));
397*9566063dSJacob Faibussowitsch       PetscCall(MatAXPY(T,-1.0,X,SAME_NONZERO_PATTERN));
398*9566063dSJacob Faibussowitsch       PetscCall(MatView(T,NULL));
399*9566063dSJacob Faibussowitsch       PetscCall(MatDestroy(&T));
40075ab9b9fSStefano Zampini     }
40175ab9b9fSStefano Zampini   }
40275ab9b9fSStefano Zampini 
40375ab9b9fSStefano Zampini   /* Test projection operations (PtAP and RARt) */
40475ab9b9fSStefano Zampini   if (testproj) {
405*9566063dSJacob Faibussowitsch     PetscCall(MatPtAP(A,B,MAT_INITIAL_MATRIX,PETSC_DEFAULT,&PtAP));
406*9566063dSJacob Faibussowitsch     PetscCall(MatPtAPMultEqual(A,B,PtAP,10,&flg));
40775ab9b9fSStefano Zampini     if (!flg) {
408*9566063dSJacob Faibussowitsch       PetscCall(PetscPrintf(PETSC_COMM_WORLD,"Error with PtAP\n"));
409*9566063dSJacob Faibussowitsch       PetscCall(MatMatMult(A,B,MAT_INITIAL_MATRIX,PETSC_DEFAULT,&T));
410*9566063dSJacob Faibussowitsch       PetscCall(MatTransposeMatMult(B,T,MAT_INITIAL_MATRIX,PETSC_DEFAULT,&T2));
411*9566063dSJacob Faibussowitsch       PetscCall(MatAXPY(T2,-1.0,PtAP,SAME_NONZERO_PATTERN));
412*9566063dSJacob Faibussowitsch       PetscCall(MatView(T2,NULL));
413*9566063dSJacob Faibussowitsch       PetscCall(MatDestroy(&T2));
414*9566063dSJacob Faibussowitsch       PetscCall(MatDestroy(&T));
41575ab9b9fSStefano Zampini     }
416*9566063dSJacob Faibussowitsch     PetscCall(PetscMalloc1((k+ldr)*M,&dataR));
417*9566063dSJacob Faibussowitsch     PetscCall(MatCreateDense(PETSC_COMM_WORLD,PETSC_DECIDE,m,K,M,dataR,&R));
418*9566063dSJacob Faibussowitsch     PetscCall(MatDenseSetLDA(R,k+ldr));
419*9566063dSJacob Faibussowitsch     PetscCall(MatSetRandom(R,NULL));
42075ab9b9fSStefano Zampini     if (testrart) { /* fails for AIJCUSPARSE because RA operation is not defined */
421*9566063dSJacob Faibussowitsch       PetscCall(MatRARt(A,R,MAT_INITIAL_MATRIX,PETSC_DEFAULT,&RARt));
422*9566063dSJacob Faibussowitsch       PetscCall(MatRARtMultEqual(A,R,RARt,10,&flg));
42375ab9b9fSStefano Zampini       if (!flg) {
424*9566063dSJacob Faibussowitsch         PetscCall(PetscPrintf(PETSC_COMM_WORLD,"Error with RARt\n"));
425*9566063dSJacob Faibussowitsch         PetscCall(MatMatTransposeMult(A,R,MAT_INITIAL_MATRIX,PETSC_DEFAULT,&T));
426*9566063dSJacob Faibussowitsch         PetscCall(MatMatMult(R,T,MAT_INITIAL_MATRIX,PETSC_DEFAULT,&T2));
427*9566063dSJacob Faibussowitsch         PetscCall(MatAXPY(T2,-1.0,RARt,SAME_NONZERO_PATTERN));
428*9566063dSJacob Faibussowitsch         PetscCall(MatView(T2,NULL));
429*9566063dSJacob Faibussowitsch         PetscCall(MatDestroy(&T2));
430*9566063dSJacob Faibussowitsch         PetscCall(MatDestroy(&T));
43175ab9b9fSStefano Zampini       }
43275ab9b9fSStefano Zampini     }
43375ab9b9fSStefano Zampini   }
43475ab9b9fSStefano Zampini 
435456288a8SStefano Zampini   /* Test MatDenseGetColumnVec and friends */
436*9566063dSJacob Faibussowitsch   PetscCall(MatMatMult(A,B,MAT_REUSE_MATRIX,PETSC_DEFAULT,&X));
437*9566063dSJacob Faibussowitsch   PetscCall(MatMatMult(A,B,MAT_INITIAL_MATRIX,PETSC_DEFAULT,&T));
438*9566063dSJacob Faibussowitsch   PetscCall(MatDuplicate(T,MAT_DO_NOT_COPY_VALUES,&T2));
439456288a8SStefano Zampini   for (k=0;k<K;k++) {
440456288a8SStefano Zampini     Vec Xv,Tv,T2v;
441456288a8SStefano Zampini 
442*9566063dSJacob Faibussowitsch     PetscCall(MatDenseGetColumnVecRead(X,k,&Xv));
443*9566063dSJacob Faibussowitsch     PetscCall(MatDenseGetColumnVec(T,k,&Tv));
444*9566063dSJacob Faibussowitsch     PetscCall(MatDenseGetColumnVecWrite(T2,k,&T2v));
445*9566063dSJacob Faibussowitsch     PetscCall(VecCopy(Xv,T2v));
446*9566063dSJacob Faibussowitsch     PetscCall(VecAXPY(Tv,-1.,Xv));
447*9566063dSJacob Faibussowitsch     PetscCall(MatDenseRestoreColumnVecRead(X,k,&Xv));
448*9566063dSJacob Faibussowitsch     PetscCall(MatDenseRestoreColumnVec(T,k,&Tv));
449*9566063dSJacob Faibussowitsch     PetscCall(MatDenseRestoreColumnVecWrite(T2,k,&T2v));
450456288a8SStefano Zampini   }
451*9566063dSJacob Faibussowitsch   PetscCall(MatNorm(T,NORM_FROBENIUS,&err));
452456288a8SStefano Zampini   if (err > PETSC_SMALL) {
453*9566063dSJacob Faibussowitsch     PetscCall(PetscPrintf(PETSC_COMM_WORLD,"Error with MatDenseGetColumnVec\n"));
454*9566063dSJacob Faibussowitsch     PetscCall(MatView(T,NULL));
455456288a8SStefano Zampini   }
456*9566063dSJacob Faibussowitsch   PetscCall(MatAXPY(T2,-1.,X,SAME_NONZERO_PATTERN));
457*9566063dSJacob Faibussowitsch   PetscCall(MatNorm(T2,NORM_FROBENIUS,&err));
458456288a8SStefano Zampini   if (err > PETSC_SMALL) {
459*9566063dSJacob Faibussowitsch     PetscCall(PetscPrintf(PETSC_COMM_WORLD,"Error with MatDenseGetColumnVecWrite\n"));
460*9566063dSJacob Faibussowitsch     PetscCall(MatView(T2,NULL));
461456288a8SStefano Zampini   }
462*9566063dSJacob Faibussowitsch   PetscCall(MatDestroy(&T));
463*9566063dSJacob Faibussowitsch   PetscCall(MatDestroy(&T2));
464456288a8SStefano Zampini 
465456288a8SStefano Zampini   /* Test with MatShell */
466*9566063dSJacob Faibussowitsch   PetscCall(MatDuplicate(A,MAT_COPY_VALUES,&T));
467*9566063dSJacob Faibussowitsch   PetscCall(MatConvert(T,MATSHELL,MAT_INITIAL_MATRIX,&T2));
468*9566063dSJacob Faibussowitsch   PetscCall(MatDestroy(&T));
46975ab9b9fSStefano Zampini 
47075ab9b9fSStefano Zampini   /* scale matrix */
471*9566063dSJacob Faibussowitsch   PetscCall(MatScale(A,2.0));
472*9566063dSJacob Faibussowitsch   PetscCall(MatScale(T2,2.0));
473*9566063dSJacob Faibussowitsch   PetscCall(MatCreateVecs(A,&r,&l));
474*9566063dSJacob Faibussowitsch   PetscCall(VecSetRandom(r,NULL));
475*9566063dSJacob Faibussowitsch   PetscCall(VecSetRandom(l,NULL));
476*9566063dSJacob Faibussowitsch   PetscCall(MatCreateVecs(T2,&rs,&ls));
477*9566063dSJacob Faibussowitsch   PetscCall(VecCopy(r,rs));
478*9566063dSJacob Faibussowitsch   PetscCall(VecCopy(l,ls));
47975ab9b9fSStefano Zampini   if (testproj) {
480*9566063dSJacob Faibussowitsch     PetscCall(MatDiagonalScale(A,r,r));
481*9566063dSJacob Faibussowitsch     PetscCall(MatDiagonalScale(T2,rs,rs));
48275ab9b9fSStefano Zampini   } else {
483*9566063dSJacob Faibussowitsch     PetscCall(MatDiagonalScale(A,l,r));
484*9566063dSJacob Faibussowitsch     PetscCall(MatDiagonalScale(T2,ls,rs));
48575ab9b9fSStefano Zampini   }
486*9566063dSJacob Faibussowitsch   PetscCall(MatDuplicate(A,MAT_COPY_VALUES,&T));
487*9566063dSJacob Faibussowitsch   PetscCall(MatAXPY(A,4.5,T,SAME_NONZERO_PATTERN));
488*9566063dSJacob Faibussowitsch   PetscCall(MatAXPY(T2,4.5,T,DIFFERENT_NONZERO_PATTERN));
489*9566063dSJacob Faibussowitsch   PetscCall(MatMultEqual(T2,A,10,&flg));
49075ab9b9fSStefano Zampini   if (!flg) {
491*9566063dSJacob Faibussowitsch     PetscCall(PetscPrintf(PETSC_COMM_WORLD,"Error with MATSHELL (MatMult)\n"));
49275ab9b9fSStefano Zampini   }
493*9566063dSJacob Faibussowitsch   PetscCall(MatMultTransposeEqual(T2,A,10,&flg));
49475ab9b9fSStefano Zampini   if (!flg) {
495*9566063dSJacob Faibussowitsch     PetscCall(PetscPrintf(PETSC_COMM_WORLD,"Error with MATSHELL (MatMultTranspose)\n"));
49675ab9b9fSStefano Zampini   }
497*9566063dSJacob Faibussowitsch   PetscCall(MatDestroy(&T));
498*9566063dSJacob Faibussowitsch   PetscCall(VecDestroy(&ls));
499*9566063dSJacob Faibussowitsch   PetscCall(VecDestroy(&rs));
500*9566063dSJacob Faibussowitsch   PetscCall(VecDestroy(&l));
501*9566063dSJacob Faibussowitsch   PetscCall(VecDestroy(&r));
50275ab9b9fSStefano Zampini 
50375ab9b9fSStefano Zampini   /* recompute projections, test reusage */
504*9566063dSJacob Faibussowitsch   if (PtAP) PetscCall(MatPtAP(A,B,MAT_REUSE_MATRIX,PETSC_DEFAULT,&PtAP));
505*9566063dSJacob Faibussowitsch   if (RARt) PetscCall(MatRARt(A,R,MAT_REUSE_MATRIX,PETSC_DEFAULT,&RARt));
50675ab9b9fSStefano Zampini   if (testshellops) { /* test callbacks for user defined MatProducts */
507*9566063dSJacob Faibussowitsch     PetscCall(MatShellSetMatProductOperation(T2,MATPRODUCT_AB,NULL,MyMatShellMatMultNumeric,NULL,MATDENSE,MATDENSE));
508*9566063dSJacob Faibussowitsch     PetscCall(MatShellSetMatProductOperation(T2,MATPRODUCT_AB,NULL,MyMatShellMatMultNumeric,NULL,MATDENSECUDA,MATDENSECUDA));
509*9566063dSJacob Faibussowitsch     PetscCall(MatShellSetMatProductOperation(T2,MATPRODUCT_AtB,NULL,MyMatTransposeShellMatMultNumeric,NULL,MATDENSE,MATDENSE));
510*9566063dSJacob Faibussowitsch     PetscCall(MatShellSetMatProductOperation(T2,MATPRODUCT_AtB,NULL,MyMatTransposeShellMatMultNumeric,NULL,MATDENSECUDA,MATDENSECUDA));
511*9566063dSJacob Faibussowitsch     PetscCall(MatShellSetMatProductOperation(T2,MATPRODUCT_ABt,NULL,MyMatShellMatTransposeMultNumeric,NULL,MATDENSE,MATDENSE));
512*9566063dSJacob Faibussowitsch     PetscCall(MatShellSetMatProductOperation(T2,MATPRODUCT_ABt,NULL,MyMatShellMatTransposeMultNumeric,NULL,MATDENSECUDA,MATDENSECUDA));
51375ab9b9fSStefano Zampini     if (testproj) {
514*9566063dSJacob Faibussowitsch       PetscCall(MatShellSetMatProductOperation(T2,MATPRODUCT_PtAP,MyPtShellPMultSymbolic,MyPtShellPMultNumeric,proj_destroy,MATDENSE,MATSHELL));
515*9566063dSJacob Faibussowitsch       PetscCall(MatShellSetMatProductOperation(T2,MATPRODUCT_PtAP,MyPtShellPMultSymbolic,MyPtShellPMultNumeric,proj_destroy,MATDENSECUDA,MATSHELL));
516*9566063dSJacob Faibussowitsch       PetscCall(MatShellSetMatProductOperation(T2,MATPRODUCT_RARt,MyRShellRtMultSymbolic,MyRShellRtMultNumeric,proj_destroy,MATDENSE,MATSHELL));
517*9566063dSJacob Faibussowitsch       PetscCall(MatShellSetMatProductOperation(T2,MATPRODUCT_RARt,MyRShellRtMultSymbolic,MyRShellRtMultNumeric,proj_destroy,MATDENSECUDA,MATSHELL));
51875ab9b9fSStefano Zampini     }
51975ab9b9fSStefano Zampini   }
520*9566063dSJacob Faibussowitsch   PetscCall(CheckLocal(B,X,aB,aX));
52175ab9b9fSStefano Zampini   /* we either use the shell operations or the loop over columns code, applying the operator */
522*9566063dSJacob Faibussowitsch   PetscCall(MatMatMult(T2,B,MAT_REUSE_MATRIX,PETSC_DEFAULT,&X));
523*9566063dSJacob Faibussowitsch   PetscCall(CheckLocal(B,X,aB,aX));
524*9566063dSJacob Faibussowitsch   PetscCall(MatMatMultEqual(T2,B,X,10,&flg));
525456288a8SStefano Zampini   if (!flg) {
526*9566063dSJacob Faibussowitsch     PetscCall(PetscPrintf(PETSC_COMM_WORLD,"Error with reusage (MATSHELL)\n"));
527*9566063dSJacob Faibussowitsch     PetscCall(MatMatMult(A,B,MAT_INITIAL_MATRIX,PETSC_DEFAULT,&T));
528*9566063dSJacob Faibussowitsch     PetscCall(MatAXPY(T,-1.0,X,SAME_NONZERO_PATTERN));
529*9566063dSJacob Faibussowitsch     PetscCall(MatView(T,NULL));
530*9566063dSJacob Faibussowitsch     PetscCall(MatDestroy(&T));
531456288a8SStefano Zampini   }
53275ab9b9fSStefano Zampini   if (testproj) {
533*9566063dSJacob Faibussowitsch     PetscCall(MatPtAPMultEqual(T2,B,PtAP,10,&flg));
53475ab9b9fSStefano Zampini     if (!flg) {
535*9566063dSJacob Faibussowitsch       PetscCall(PetscPrintf(PETSC_COMM_WORLD,"Error with PtAP (MATSHELL)\n"));
53675ab9b9fSStefano Zampini     }
53775ab9b9fSStefano Zampini     if (testshellops) { /* projections fail if the product operations are not specified */
538*9566063dSJacob Faibussowitsch       PetscCall(MatPtAP(T2,B,MAT_INITIAL_MATRIX,PETSC_DEFAULT,&T));
539*9566063dSJacob Faibussowitsch       PetscCall(MatPtAP(T2,B,MAT_REUSE_MATRIX,PETSC_DEFAULT,&T));
540*9566063dSJacob Faibussowitsch       PetscCall(MatPtAPMultEqual(T2,B,T,10,&flg));
54175ab9b9fSStefano Zampini       if (!flg) {
54275ab9b9fSStefano Zampini         Mat TE;
5436718818eSStefano Zampini 
544*9566063dSJacob Faibussowitsch         PetscCall(PetscPrintf(PETSC_COMM_WORLD,"Error with PtAP (MATSHELL user defined)\n"));
545*9566063dSJacob Faibussowitsch         PetscCall(MatComputeOperator(T,MATDENSE,&TE));
546*9566063dSJacob Faibussowitsch         PetscCall(MatView(TE,NULL));
547*9566063dSJacob Faibussowitsch         PetscCall(MatView(PtAP,NULL));
548*9566063dSJacob Faibussowitsch         PetscCall(MatAXPY(TE,-1.0,PtAP,SAME_NONZERO_PATTERN));
549*9566063dSJacob Faibussowitsch         PetscCall(MatView(TE,NULL));
550*9566063dSJacob Faibussowitsch         PetscCall(MatDestroy(&TE));
55175ab9b9fSStefano Zampini       }
552*9566063dSJacob Faibussowitsch       PetscCall(MatDestroy(&T));
55375ab9b9fSStefano Zampini     }
55475ab9b9fSStefano Zampini     if (RARt) {
555*9566063dSJacob Faibussowitsch       PetscCall(MatRARtMultEqual(T2,R,RARt,10,&flg));
55675ab9b9fSStefano Zampini       if (!flg) {
557*9566063dSJacob Faibussowitsch         PetscCall(PetscPrintf(PETSC_COMM_WORLD,"Error with RARt (MATSHELL)\n"));
55875ab9b9fSStefano Zampini       }
55975ab9b9fSStefano Zampini     }
56075ab9b9fSStefano Zampini     if (testshellops) {
561*9566063dSJacob Faibussowitsch       PetscCall(MatRARt(T2,R,MAT_INITIAL_MATRIX,PETSC_DEFAULT,&T));
562*9566063dSJacob Faibussowitsch       PetscCall(MatRARt(T2,R,MAT_REUSE_MATRIX,PETSC_DEFAULT,&T));
563*9566063dSJacob Faibussowitsch       PetscCall(MatRARtMultEqual(T2,R,T,10,&flg));
56475ab9b9fSStefano Zampini       if (!flg) {
56575ab9b9fSStefano Zampini         Mat TE;
56675ab9b9fSStefano Zampini 
567*9566063dSJacob Faibussowitsch         PetscCall(PetscPrintf(PETSC_COMM_WORLD,"Error with RARt (MATSHELL user defined)\n"));
568*9566063dSJacob Faibussowitsch         PetscCall(MatComputeOperator(T,MATDENSE,&TE));
569*9566063dSJacob Faibussowitsch         PetscCall(MatView(TE,NULL));
57075ab9b9fSStefano Zampini         if (RARt) {
571*9566063dSJacob Faibussowitsch           PetscCall(MatView(RARt,NULL));
572*9566063dSJacob Faibussowitsch           PetscCall(MatAXPY(TE,-1.0,RARt,SAME_NONZERO_PATTERN));
573*9566063dSJacob Faibussowitsch           PetscCall(MatView(TE,NULL));
57475ab9b9fSStefano Zampini         }
575*9566063dSJacob Faibussowitsch         PetscCall(MatDestroy(&TE));
57675ab9b9fSStefano Zampini       }
577*9566063dSJacob Faibussowitsch       PetscCall(MatDestroy(&T));
57875ab9b9fSStefano Zampini     }
57975ab9b9fSStefano Zampini   }
58075ab9b9fSStefano Zampini 
58175ab9b9fSStefano Zampini   if (testmattmat) { /* we either use the shell operations or the loop over columns code applying the transposed operator */
582*9566063dSJacob Faibussowitsch     PetscCall(MatTransposeMatMult(T2,X,MAT_REUSE_MATRIX,PETSC_DEFAULT,&B));
583*9566063dSJacob Faibussowitsch     PetscCall(CheckLocal(B,X,aB,aX));
584*9566063dSJacob Faibussowitsch     PetscCall(MatTransposeMatMultEqual(T2,X,B,10,&flg));
585456288a8SStefano Zampini     if (!flg) {
586*9566063dSJacob Faibussowitsch       PetscCall(PetscPrintf(PETSC_COMM_WORLD,"Error with reusage (MatTranspose, MATSHELL)\n"));
587*9566063dSJacob Faibussowitsch       PetscCall(MatTransposeMatMult(A,X,MAT_INITIAL_MATRIX,PETSC_DEFAULT,&T));
588*9566063dSJacob Faibussowitsch       PetscCall(MatAXPY(T,-1.0,B,SAME_NONZERO_PATTERN));
589*9566063dSJacob Faibussowitsch       PetscCall(MatView(T,NULL));
590*9566063dSJacob Faibussowitsch       PetscCall(MatDestroy(&T));
5916718818eSStefano Zampini     }
592456288a8SStefano Zampini   }
59375ab9b9fSStefano Zampini   if (testmatmatt && testshellops) { /* only when shell operations are set */
594*9566063dSJacob Faibussowitsch     PetscCall(MatMatTransposeMult(T2,Bt,MAT_REUSE_MATRIX,PETSC_DEFAULT,&X));
595*9566063dSJacob Faibussowitsch     PetscCall(CheckLocal(Bt,X,aBt,aX));
596*9566063dSJacob Faibussowitsch     PetscCall(MatMatTransposeMultEqual(T2,Bt,X,10,&flg));
59775ab9b9fSStefano Zampini     if (!flg) {
598*9566063dSJacob Faibussowitsch       PetscCall(PetscPrintf(PETSC_COMM_WORLD,"Error with reusage (MatMatTranspose, MATSHELL)\n"));
599*9566063dSJacob Faibussowitsch       PetscCall(MatMatTransposeMult(A,Bt,MAT_INITIAL_MATRIX,PETSC_DEFAULT,&T));
600*9566063dSJacob Faibussowitsch       PetscCall(MatAXPY(T,-1.0,X,SAME_NONZERO_PATTERN));
601*9566063dSJacob Faibussowitsch       PetscCall(MatView(T,NULL));
602*9566063dSJacob Faibussowitsch       PetscCall(MatDestroy(&T));
60375ab9b9fSStefano Zampini     }
60475ab9b9fSStefano Zampini   }
605*9566063dSJacob Faibussowitsch   PetscCall(MatDestroy(&T2));
606456288a8SStefano Zampini 
6076280154eSStefano Zampini   if (testnest) { /* test with MatNest */
6086280154eSStefano Zampini     Mat NA;
6096280154eSStefano Zampini 
610*9566063dSJacob Faibussowitsch     PetscCall(MatCreateNest(PETSC_COMM_WORLD,1,NULL,1,NULL,&A,&NA));
611*9566063dSJacob Faibussowitsch     PetscCall(MatViewFromOptions(NA,NULL,"-NA_view"));
612*9566063dSJacob Faibussowitsch     PetscCall(MatMatMult(NA,B,MAT_REUSE_MATRIX,PETSC_DEFAULT,&X));
613*9566063dSJacob Faibussowitsch     PetscCall(CheckLocal(B,X,aB,aX));
614*9566063dSJacob Faibussowitsch     PetscCall(MatMatMultEqual(NA,B,X,10,&flg));
6156280154eSStefano Zampini     if (!flg) {
616*9566063dSJacob Faibussowitsch       PetscCall(PetscPrintf(PETSC_COMM_WORLD,"Error with Nest\n"));
617*9566063dSJacob Faibussowitsch       PetscCall(MatMatMult(NA,B,MAT_INITIAL_MATRIX,PETSC_DEFAULT,&T));
618*9566063dSJacob Faibussowitsch       PetscCall(MatAXPY(T,-1.0,X,SAME_NONZERO_PATTERN));
619*9566063dSJacob Faibussowitsch       PetscCall(MatView(T,NULL));
620*9566063dSJacob Faibussowitsch       PetscCall(MatDestroy(&T));
6216280154eSStefano Zampini     }
622*9566063dSJacob Faibussowitsch     PetscCall(MatDestroy(&NA));
6236280154eSStefano Zampini   }
6246280154eSStefano Zampini 
6256280154eSStefano Zampini   if (testtranspose) { /* test with Transpose */
6266280154eSStefano Zampini     Mat TA;
6276280154eSStefano Zampini 
628*9566063dSJacob Faibussowitsch     PetscCall(MatCreateTranspose(A,&TA));
629*9566063dSJacob Faibussowitsch     PetscCall(MatMatMult(TA,X,MAT_REUSE_MATRIX,PETSC_DEFAULT,&B));
630*9566063dSJacob Faibussowitsch     PetscCall(CheckLocal(B,X,aB,aX));
631*9566063dSJacob Faibussowitsch     PetscCall(MatMatMultEqual(TA,X,B,10,&flg));
6326280154eSStefano Zampini     if (!flg) {
633*9566063dSJacob Faibussowitsch       PetscCall(PetscPrintf(PETSC_COMM_WORLD,"Error with Transpose\n"));
634*9566063dSJacob Faibussowitsch       PetscCall(MatMatMult(TA,X,MAT_INITIAL_MATRIX,PETSC_DEFAULT,&T));
635*9566063dSJacob Faibussowitsch       PetscCall(MatAXPY(T,-1.0,B,SAME_NONZERO_PATTERN));
636*9566063dSJacob Faibussowitsch       PetscCall(MatView(T,NULL));
637*9566063dSJacob Faibussowitsch       PetscCall(MatDestroy(&T));
6386280154eSStefano Zampini     }
639*9566063dSJacob Faibussowitsch     PetscCall(MatDestroy(&TA));
6406280154eSStefano Zampini   }
6416280154eSStefano Zampini 
6423604c0aeSStefano Zampini   if (testhtranspose) { /* test with Hermitian Transpose */
6433604c0aeSStefano Zampini     Mat TA;
6443604c0aeSStefano Zampini 
645*9566063dSJacob Faibussowitsch     PetscCall(MatCreateHermitianTranspose(A,&TA));
646*9566063dSJacob Faibussowitsch     PetscCall(MatMatMult(TA,X,MAT_REUSE_MATRIX,PETSC_DEFAULT,&B));
647*9566063dSJacob Faibussowitsch     PetscCall(CheckLocal(B,X,aB,aX));
648*9566063dSJacob Faibussowitsch     PetscCall(MatMatMultEqual(TA,X,B,10,&flg));
6493604c0aeSStefano Zampini     if (!flg) {
650*9566063dSJacob Faibussowitsch       PetscCall(PetscPrintf(PETSC_COMM_WORLD,"Error with Transpose\n"));
651*9566063dSJacob Faibussowitsch       PetscCall(MatMatMult(TA,X,MAT_INITIAL_MATRIX,PETSC_DEFAULT,&T));
652*9566063dSJacob Faibussowitsch       PetscCall(MatAXPY(T,-1.0,B,SAME_NONZERO_PATTERN));
653*9566063dSJacob Faibussowitsch       PetscCall(MatView(T,NULL));
654*9566063dSJacob Faibussowitsch       PetscCall(MatDestroy(&T));
6553604c0aeSStefano Zampini     }
656*9566063dSJacob Faibussowitsch     PetscCall(MatDestroy(&TA));
6573604c0aeSStefano Zampini   }
6583604c0aeSStefano Zampini 
6596280154eSStefano Zampini   if (testtt) { /* test with Transpose(Transpose) */
6606280154eSStefano Zampini     Mat TA, TTA;
6616280154eSStefano Zampini 
662*9566063dSJacob Faibussowitsch     PetscCall(MatCreateTranspose(A,&TA));
663*9566063dSJacob Faibussowitsch     PetscCall(MatCreateTranspose(TA,&TTA));
664*9566063dSJacob Faibussowitsch     PetscCall(MatMatMult(TTA,B,MAT_REUSE_MATRIX,PETSC_DEFAULT,&X));
665*9566063dSJacob Faibussowitsch     PetscCall(CheckLocal(B,X,aB,aX));
666*9566063dSJacob Faibussowitsch     PetscCall(MatMatMultEqual(TTA,B,X,10,&flg));
6676280154eSStefano Zampini     if (!flg) {
668*9566063dSJacob Faibussowitsch       PetscCall(PetscPrintf(PETSC_COMM_WORLD,"Error with Transpose(Transpose)\n"));
669*9566063dSJacob Faibussowitsch       PetscCall(MatMatMult(TTA,B,MAT_INITIAL_MATRIX,PETSC_DEFAULT,&T));
670*9566063dSJacob Faibussowitsch       PetscCall(MatAXPY(T,-1.0,X,SAME_NONZERO_PATTERN));
671*9566063dSJacob Faibussowitsch       PetscCall(MatView(T,NULL));
672*9566063dSJacob Faibussowitsch       PetscCall(MatDestroy(&T));
6736280154eSStefano Zampini     }
674*9566063dSJacob Faibussowitsch     PetscCall(MatDestroy(&TA));
675*9566063dSJacob Faibussowitsch     PetscCall(MatDestroy(&TTA));
6766280154eSStefano Zampini   }
6776280154eSStefano Zampini 
6786280154eSStefano Zampini   if (testcircular) { /* test circular */
6796280154eSStefano Zampini     Mat AB;
6806280154eSStefano Zampini 
681*9566063dSJacob Faibussowitsch     PetscCall(MatMatMult(A,B,MAT_INITIAL_MATRIX,PETSC_DEFAULT,&AB));
682*9566063dSJacob Faibussowitsch     PetscCall(MatMatMult(A,B,MAT_REUSE_MATRIX,PETSC_DEFAULT,&X));
683*9566063dSJacob Faibussowitsch     PetscCall(CheckLocal(B,X,aB,aX));
6846280154eSStefano Zampini     if (M == N && N == K) {
685*9566063dSJacob Faibussowitsch       PetscCall(MatMatMult(A,X,MAT_REUSE_MATRIX,PETSC_DEFAULT,&B));
6866280154eSStefano Zampini     } else {
687*9566063dSJacob Faibussowitsch       PetscCall(MatTransposeMatMult(A,X,MAT_REUSE_MATRIX,PETSC_DEFAULT,&B));
6886280154eSStefano Zampini     }
689*9566063dSJacob Faibussowitsch     PetscCall(CheckLocal(B,X,aB,aX));
690*9566063dSJacob Faibussowitsch     PetscCall(MatDestroy(&AB));
6916280154eSStefano Zampini   }
6922b723ba2SStefano Zampini 
6932b723ba2SStefano Zampini   /* Test by Pierre Jolivet */
6942b723ba2SStefano Zampini   {
6952b723ba2SStefano Zampini     Mat C,D,D2,AtA;
696*9566063dSJacob Faibussowitsch     PetscCall(MatCreateNormal(A,&AtA));
697*9566063dSJacob Faibussowitsch     PetscCall(MatDuplicate(X,MAT_DO_NOT_COPY_VALUES,&C));
698*9566063dSJacob Faibussowitsch     PetscCall(MatDuplicate(B,MAT_DO_NOT_COPY_VALUES,&D));
699*9566063dSJacob Faibussowitsch     PetscCall(MatDuplicate(B,MAT_DO_NOT_COPY_VALUES,&D2));
700*9566063dSJacob Faibussowitsch     PetscCall(MatSetRandom(B,NULL));
701*9566063dSJacob Faibussowitsch     PetscCall(MatSetRandom(C,NULL));
702*9566063dSJacob Faibussowitsch     PetscCall(MatSetRandom(D,NULL));
703*9566063dSJacob Faibussowitsch     PetscCall(MatSetRandom(D2,NULL));
704*9566063dSJacob Faibussowitsch     PetscCall(MatProductCreateWithMat(A,B,NULL,C));
705*9566063dSJacob Faibussowitsch     PetscCall(MatProductSetType(C,MATPRODUCT_AB));
706*9566063dSJacob Faibussowitsch     PetscCall(MatProductSetFromOptions(C));
707*9566063dSJacob Faibussowitsch     PetscCall(MatProductSymbolic(C));
708*9566063dSJacob Faibussowitsch     PetscCall(MatProductCreateWithMat(A,C,NULL,D));
709*9566063dSJacob Faibussowitsch     PetscCall(MatProductSetType(D, MATPRODUCT_AtB));
710*9566063dSJacob Faibussowitsch     PetscCall(MatProductSetFromOptions(D));
711*9566063dSJacob Faibussowitsch     PetscCall(MatProductSymbolic(D));
712*9566063dSJacob Faibussowitsch     PetscCall(MatProductNumeric(C));
713*9566063dSJacob Faibussowitsch     PetscCall(MatProductNumeric(D));
714*9566063dSJacob Faibussowitsch     PetscCall(MatMatMultEqual(AtA,B,D,10,&flg));
7152b723ba2SStefano Zampini     if (!flg) {
716*9566063dSJacob Faibussowitsch       PetscCall(MatMatMult(AtA,C,MAT_INITIAL_MATRIX,PETSC_DEFAULT,&T));
717*9566063dSJacob Faibussowitsch       PetscCall(MatAXPY(T,-1.0,D,SAME_NONZERO_PATTERN));
718*9566063dSJacob Faibussowitsch       PetscCall(MatView(T,NULL));
719*9566063dSJacob Faibussowitsch       PetscCall(MatDestroy(&T));
7202b723ba2SStefano Zampini     }
721*9566063dSJacob Faibussowitsch     PetscCall(MatDestroy(&C));
722*9566063dSJacob Faibussowitsch     PetscCall(MatDestroy(&D));
723*9566063dSJacob Faibussowitsch     PetscCall(MatDestroy(&D2));
724*9566063dSJacob Faibussowitsch     PetscCall(MatDestroy(&AtA));
7252b723ba2SStefano Zampini   }
7262b723ba2SStefano Zampini 
727*9566063dSJacob Faibussowitsch   PetscCall(MatDestroy(&X));
728*9566063dSJacob Faibussowitsch   PetscCall(MatDestroy(&Bt));
729*9566063dSJacob Faibussowitsch   PetscCall(MatDestroy(&B));
730*9566063dSJacob Faibussowitsch   PetscCall(MatDestroy(&A));
731*9566063dSJacob Faibussowitsch   PetscCall(MatDestroy(&R));
732*9566063dSJacob Faibussowitsch   PetscCall(MatDestroy(&PtAP));
733*9566063dSJacob Faibussowitsch   PetscCall(MatDestroy(&RARt));
734*9566063dSJacob Faibussowitsch   PetscCall(PetscFree(dataX));
735*9566063dSJacob Faibussowitsch   PetscCall(PetscFree(dataB));
736*9566063dSJacob Faibussowitsch   PetscCall(PetscFree(dataR));
737*9566063dSJacob Faibussowitsch   PetscCall(PetscFree(dataBt));
738*9566063dSJacob Faibussowitsch   PetscCall(PetscFinalize());
739b122ec5aSJacob Faibussowitsch   return 0;
7406280154eSStefano Zampini }
7416280154eSStefano Zampini 
7426280154eSStefano Zampini /*TEST
7436280154eSStefano Zampini 
7446280154eSStefano Zampini   test:
7456280154eSStefano Zampini     suffix: 1
74675ab9b9fSStefano Zampini     args: -local {{0 1}} -testshellops
7476280154eSStefano Zampini 
7486280154eSStefano Zampini   test:
7496280154eSStefano Zampini     output_file: output/ex70_1.out
750456288a8SStefano Zampini     requires: cuda
751456288a8SStefano Zampini     suffix: 1_cuda
752686594dbSStefano Zampini     args: -local {{0 1}} -xgpu {{0 1}} -bgpu {{0 1}} -A_mat_type {{seqaijcusparse seqaij}} -testshellops {{0 1}}
753456288a8SStefano Zampini 
754456288a8SStefano Zampini   test:
755456288a8SStefano Zampini     output_file: output/ex70_1.out
7566280154eSStefano Zampini     nsize: 2
7576280154eSStefano Zampini     suffix: 1_par
75875ab9b9fSStefano Zampini     args: -local {{0 1}} -testmatmatt 0
7596280154eSStefano Zampini 
7606280154eSStefano Zampini   test:
761456288a8SStefano Zampini     output_file: output/ex70_1.out
762456288a8SStefano Zampini     requires: cuda
763456288a8SStefano Zampini     nsize: 2
764456288a8SStefano Zampini     suffix: 1_par_cuda
76575ab9b9fSStefano Zampini     args: -local {{0 1}} -xgpu {{0 1}} -bgpu {{0 1}} -A_mat_type {{mpiaijcusparse mpiaij}} -testnest 0 -testmatmatt 0 -matmatmult_Bbn 3
766456288a8SStefano Zampini 
767456288a8SStefano Zampini   test:
7686280154eSStefano Zampini     output_file: output/ex70_1.out
7696280154eSStefano Zampini     suffix: 2
7706280154eSStefano Zampini     nsize: 1
7716280154eSStefano Zampini     args: -M {{7 11}} -N {{12 9}} -K {{1 3}} -local {{0 1}}
7726280154eSStefano Zampini 
7738a311839SJunchao Zhang   testset:
774456288a8SStefano Zampini     requires: cuda
775456288a8SStefano Zampini     output_file: output/ex70_1.out
776456288a8SStefano Zampini     nsize: 1
777456288a8SStefano Zampini     args: -M 7 -N 9 -K 2 -local {{0 1}} -testnest 0 -A_mat_type {{seqdensecuda seqdense}} -xgpu {{0 1}} -bgpu {{0 1}}
7788a311839SJunchao Zhang     test:
7798a311839SJunchao Zhang       requires: !complex
7808a311839SJunchao Zhang       suffix: 2_cuda_real
7818a311839SJunchao Zhang     test:
7828a311839SJunchao Zhang       # complex+single gives a little bigger error in the MatDenseGetColumnVec test
7838a311839SJunchao Zhang       requires: complex !single
7848a311839SJunchao Zhang       suffix: 2_cuda_complex
785456288a8SStefano Zampini 
786456288a8SStefano Zampini   test:
7876280154eSStefano Zampini     output_file: output/ex70_1.out
7886280154eSStefano Zampini     suffix: 2_par
7896280154eSStefano Zampini     nsize: 2
79075ab9b9fSStefano Zampini     args: -M {{7 11}} -N {{12 9}} -K {{1 3}} -local {{0 1}} -testcircular -testmatmatt 0
7916280154eSStefano Zampini 
7926280154eSStefano Zampini   test:
793456288a8SStefano Zampini     requires: cuda
794456288a8SStefano Zampini     output_file: output/ex70_1.out
795456288a8SStefano Zampini     suffix: 2_par_cuda
796456288a8SStefano Zampini     nsize: 2
79775ab9b9fSStefano Zampini     args: -M 11 -N 9 -K 1 -local {{0 1}} -testcircular 0 -A_mat_type mpiaijcusparse -xgpu -bgpu -testnest 0 -testmatmatt 0
798456288a8SStefano Zampini 
799456288a8SStefano Zampini   test:
8006280154eSStefano Zampini     output_file: output/ex70_1.out
8016280154eSStefano Zampini     suffix: 3
802456288a8SStefano Zampini     nsize: {{1 3}}
80375ab9b9fSStefano Zampini     args: -M 13 -N 13 -K {{1 3}} -local {{0 1}} -A_mat_type sbaij -symm -testproj 0 -testmatmatt 0
8046280154eSStefano Zampini 
8056280154eSStefano Zampini   test:
8066280154eSStefano Zampini     output_file: output/ex70_1.out
8076280154eSStefano Zampini     suffix: 4
8086280154eSStefano Zampini     nsize: 1
8096280154eSStefano Zampini     args: -M 3 -N 3 -K 3 -local {{0 1}} -testcircular
8106280154eSStefano Zampini 
8116280154eSStefano Zampini   test:
8126280154eSStefano Zampini     output_file: output/ex70_1.out
8136280154eSStefano Zampini     suffix: 5
8146280154eSStefano Zampini     nsize: {{2 4}}
815a0638e9dSStefano Zampini     args: -M 3 -N 3 -K 3 -local {{0 1}} -testcircular -testmatmatt 0
8166280154eSStefano Zampini 
8176280154eSStefano Zampini   test:
8186280154eSStefano Zampini     output_file: output/ex70_1.out
8196280154eSStefano Zampini     suffix: 6
8206280154eSStefano Zampini     nsize: 1
82175ab9b9fSStefano Zampini     args: -M {{1 3}} -N {{2 5}} -K {{1 2}} -local {{0 1}} -testcircular
8226280154eSStefano Zampini 
8236280154eSStefano Zampini   test:
8246280154eSStefano Zampini     output_file: output/ex70_1.out
8256280154eSStefano Zampini     suffix: 7
8266280154eSStefano Zampini     nsize: 1
827456288a8SStefano Zampini     args: -M 13 -N 13 -K {{1 3}} -local {{0 1}} -A_mat_type dense -testnest -testcircular
8286718818eSStefano Zampini 
8296280154eSStefano Zampini TEST*/
830