1d24d4204SJose E. Roman 2d24d4204SJose E. Roman static char help[] = "Tests ScaLAPACK interface.\n\n"; 3d24d4204SJose E. Roman 4d24d4204SJose E. Roman #include <petscmat.h> 5d24d4204SJose E. Roman 6*d71ae5a4SJacob Faibussowitsch int main(int argc, char **args) 7*d71ae5a4SJacob Faibussowitsch { 8f7ec113fSDamian Marek Mat Cdense, Caij, B, C, Ct, Asub; 9d24d4204SJose E. Roman Vec d; 10d24d4204SJose E. Roman PetscInt i, j, M = 5, N, mb = 2, nb, nrows, ncols, mloc, nloc; 11d24d4204SJose E. Roman const PetscInt *rows, *cols; 12d24d4204SJose E. Roman IS isrows, iscols; 13d24d4204SJose E. Roman PetscScalar *v; 14f7ec113fSDamian Marek PetscMPIInt rank, color; 15d24d4204SJose E. Roman PetscReal Cnorm; 16d24d4204SJose E. Roman PetscBool flg, mats_view = PETSC_FALSE; 17f7ec113fSDamian Marek MPI_Comm subcomm; 18d24d4204SJose E. Roman 19327415f7SBarry Smith PetscFunctionBeginUser; 209566063dSJacob Faibussowitsch PetscCall(PetscInitialize(&argc, &args, (char *)0, help)); 219566063dSJacob Faibussowitsch PetscCallMPI(MPI_Comm_rank(PETSC_COMM_WORLD, &rank)); 229566063dSJacob Faibussowitsch PetscCall(PetscOptionsGetInt(NULL, NULL, "-M", &M, NULL)); 23d24d4204SJose E. Roman N = M; 249566063dSJacob Faibussowitsch PetscCall(PetscOptionsGetInt(NULL, NULL, "-N", &N, NULL)); 259566063dSJacob Faibussowitsch PetscCall(PetscOptionsGetInt(NULL, NULL, "-mb", &mb, NULL)); 26d24d4204SJose E. Roman nb = mb; 279566063dSJacob Faibussowitsch PetscCall(PetscOptionsGetInt(NULL, NULL, "-nb", &nb, NULL)); 289566063dSJacob Faibussowitsch PetscCall(PetscOptionsHasName(NULL, NULL, "-mats_view", &mats_view)); 29d24d4204SJose E. Roman 309566063dSJacob Faibussowitsch PetscCall(MatCreate(PETSC_COMM_WORLD, &C)); 319566063dSJacob Faibussowitsch PetscCall(MatSetType(C, MATSCALAPACK)); 32d24d4204SJose E. Roman mloc = PETSC_DECIDE; 339566063dSJacob Faibussowitsch PetscCall(PetscSplitOwnershipEqual(PETSC_COMM_WORLD, &mloc, &M)); 34d24d4204SJose E. Roman nloc = PETSC_DECIDE; 359566063dSJacob Faibussowitsch PetscCall(PetscSplitOwnershipEqual(PETSC_COMM_WORLD, &nloc, &N)); 369566063dSJacob Faibussowitsch PetscCall(MatSetSizes(C, mloc, nloc, M, N)); 379566063dSJacob Faibussowitsch PetscCall(MatScaLAPACKSetBlockSizes(C, mb, nb)); 389566063dSJacob Faibussowitsch PetscCall(MatSetFromOptions(C)); 399566063dSJacob Faibussowitsch PetscCall(MatSetUp(C)); 409566063dSJacob Faibussowitsch /*PetscCall(MatCreateScaLAPACK(PETSC_COMM_WORLD,mb,nb,M,N,0,0,&C)); */ 41d24d4204SJose E. Roman 429566063dSJacob Faibussowitsch PetscCall(MatGetOwnershipIS(C, &isrows, &iscols)); 439566063dSJacob Faibussowitsch PetscCall(ISGetLocalSize(isrows, &nrows)); 449566063dSJacob Faibussowitsch PetscCall(ISGetIndices(isrows, &rows)); 459566063dSJacob Faibussowitsch PetscCall(ISGetLocalSize(iscols, &ncols)); 469566063dSJacob Faibussowitsch PetscCall(ISGetIndices(iscols, &cols)); 479566063dSJacob Faibussowitsch PetscCall(PetscMalloc1(nrows * ncols, &v)); 48d24d4204SJose E. Roman for (i = 0; i < nrows; i++) { 49d24d4204SJose E. Roman for (j = 0; j < ncols; j++) v[i * ncols + j] = (PetscReal)(rows[i] + 1 + (cols[j] + 1) * 0.01); 50d24d4204SJose E. Roman } 519566063dSJacob Faibussowitsch PetscCall(MatSetValues(C, nrows, rows, ncols, cols, v, INSERT_VALUES)); 529566063dSJacob Faibussowitsch PetscCall(PetscFree(v)); 539566063dSJacob Faibussowitsch PetscCall(ISRestoreIndices(isrows, &rows)); 549566063dSJacob Faibussowitsch PetscCall(ISRestoreIndices(iscols, &cols)); 559566063dSJacob Faibussowitsch PetscCall(MatAssemblyBegin(C, MAT_FINAL_ASSEMBLY)); 569566063dSJacob Faibussowitsch PetscCall(MatAssemblyEnd(C, MAT_FINAL_ASSEMBLY)); 579566063dSJacob Faibussowitsch PetscCall(ISDestroy(&isrows)); 589566063dSJacob Faibussowitsch PetscCall(ISDestroy(&iscols)); 59d24d4204SJose E. Roman 60d24d4204SJose E. Roman /* Test MatView(), MatDuplicate() and out-of-place MatConvert() */ 619566063dSJacob Faibussowitsch PetscCall(MatDuplicate(C, MAT_COPY_VALUES, &B)); 62d24d4204SJose E. Roman if (mats_view) { 639566063dSJacob Faibussowitsch PetscCall(PetscPrintf(PETSC_COMM_WORLD, "Duplicated C:\n")); 649566063dSJacob Faibussowitsch PetscCall(MatView(B, PETSC_VIEWER_STDOUT_WORLD)); 65d24d4204SJose E. Roman } 669566063dSJacob Faibussowitsch PetscCall(MatDestroy(&B)); 679566063dSJacob Faibussowitsch PetscCall(MatConvert(C, MATDENSE, MAT_INITIAL_MATRIX, &Cdense)); 689566063dSJacob Faibussowitsch PetscCall(MatMultEqual(C, Cdense, 5, &flg)); 6928b400f6SJacob Faibussowitsch PetscCheck(flg, PETSC_COMM_WORLD, PETSC_ERR_PLIB, "Check fails: Cdense != C"); 70d24d4204SJose E. Roman 71d24d4204SJose E. Roman /* Test MatNorm() */ 729566063dSJacob Faibussowitsch PetscCall(MatNorm(C, NORM_1, &Cnorm)); 73d24d4204SJose E. Roman 74d24d4204SJose E. Roman /* Test MatTranspose(), MatZeroEntries() and MatGetDiagonal() */ 759566063dSJacob Faibussowitsch PetscCall(MatTranspose(C, MAT_INITIAL_MATRIX, &Ct)); 769566063dSJacob Faibussowitsch PetscCall(MatConjugate(Ct)); 77d24d4204SJose E. Roman if (mats_view) { 789566063dSJacob Faibussowitsch PetscCall(PetscPrintf(PETSC_COMM_WORLD, "C's Transpose Conjugate:\n")); 799566063dSJacob Faibussowitsch PetscCall(MatView(Ct, PETSC_VIEWER_STDOUT_WORLD)); 80d24d4204SJose E. Roman } 819566063dSJacob Faibussowitsch PetscCall(MatZeroEntries(Ct)); 829566063dSJacob Faibussowitsch if (M > N) PetscCall(MatCreateVecs(C, &d, NULL)); 839566063dSJacob Faibussowitsch else PetscCall(MatCreateVecs(C, NULL, &d)); 849566063dSJacob Faibussowitsch PetscCall(MatGetDiagonal(C, d)); 85d24d4204SJose E. Roman if (mats_view) { 869566063dSJacob Faibussowitsch PetscCall(PetscPrintf(PETSC_COMM_WORLD, "Diagonal of C:\n")); 879566063dSJacob Faibussowitsch PetscCall(VecView(d, PETSC_VIEWER_STDOUT_WORLD)); 88d24d4204SJose E. Roman } 89d24d4204SJose E. Roman if (M > N) { 909566063dSJacob Faibussowitsch PetscCall(MatDiagonalScale(C, NULL, d)); 91d24d4204SJose E. Roman } else { 929566063dSJacob Faibussowitsch PetscCall(MatDiagonalScale(C, d, NULL)); 93d24d4204SJose E. Roman } 94d24d4204SJose E. Roman if (mats_view) { 959566063dSJacob Faibussowitsch PetscCall(PetscPrintf(PETSC_COMM_WORLD, "Diagonal Scaled C:\n")); 969566063dSJacob Faibussowitsch PetscCall(MatView(C, PETSC_VIEWER_STDOUT_WORLD)); 97d24d4204SJose E. Roman } 98d24d4204SJose E. Roman 99d24d4204SJose E. Roman /* Test MatAXPY(), MatAYPX() and in-place MatConvert() */ 1009566063dSJacob Faibussowitsch PetscCall(MatCreate(PETSC_COMM_WORLD, &B)); 1019566063dSJacob Faibussowitsch PetscCall(MatSetType(B, MATSCALAPACK)); 1029566063dSJacob Faibussowitsch PetscCall(MatSetSizes(B, mloc, nloc, PETSC_DECIDE, PETSC_DECIDE)); 1039566063dSJacob Faibussowitsch PetscCall(MatScaLAPACKSetBlockSizes(B, mb, nb)); 1049566063dSJacob Faibussowitsch PetscCall(MatSetFromOptions(B)); 1059566063dSJacob Faibussowitsch PetscCall(MatSetUp(B)); 1069566063dSJacob Faibussowitsch /* PetscCall(MatCreateScaLAPACK(PETSC_COMM_WORLD,mb,nb,M,N,0,0,&B)); */ 1079566063dSJacob Faibussowitsch PetscCall(MatGetOwnershipIS(B, &isrows, &iscols)); 1089566063dSJacob Faibussowitsch PetscCall(ISGetLocalSize(isrows, &nrows)); 1099566063dSJacob Faibussowitsch PetscCall(ISGetIndices(isrows, &rows)); 1109566063dSJacob Faibussowitsch PetscCall(ISGetLocalSize(iscols, &ncols)); 1119566063dSJacob Faibussowitsch PetscCall(ISGetIndices(iscols, &cols)); 1129566063dSJacob Faibussowitsch PetscCall(PetscMalloc1(nrows * ncols, &v)); 113d24d4204SJose E. Roman for (i = 0; i < nrows; i++) { 114d24d4204SJose E. Roman for (j = 0; j < ncols; j++) v[i * ncols + j] = (PetscReal)(1000 * rows[i] + cols[j]); 115d24d4204SJose E. Roman } 1169566063dSJacob Faibussowitsch PetscCall(MatSetValues(B, nrows, rows, ncols, cols, v, INSERT_VALUES)); 1179566063dSJacob Faibussowitsch PetscCall(PetscFree(v)); 1189566063dSJacob Faibussowitsch PetscCall(ISRestoreIndices(isrows, &rows)); 1199566063dSJacob Faibussowitsch PetscCall(ISRestoreIndices(iscols, &cols)); 1209566063dSJacob Faibussowitsch PetscCall(MatAssemblyBegin(B, MAT_FINAL_ASSEMBLY)); 1219566063dSJacob Faibussowitsch PetscCall(MatAssemblyEnd(B, MAT_FINAL_ASSEMBLY)); 122d24d4204SJose E. Roman if (mats_view) { 1239566063dSJacob Faibussowitsch PetscCall(PetscPrintf(PETSC_COMM_WORLD, "B:\n")); 1249566063dSJacob Faibussowitsch PetscCall(MatView(B, PETSC_VIEWER_STDOUT_WORLD)); 125d24d4204SJose E. Roman } 1269566063dSJacob Faibussowitsch PetscCall(MatAXPY(B, 2.5, C, SAME_NONZERO_PATTERN)); 1279566063dSJacob Faibussowitsch PetscCall(MatAYPX(B, 3.75, C, SAME_NONZERO_PATTERN)); 1289566063dSJacob Faibussowitsch PetscCall(MatConvert(B, MATDENSE, MAT_INPLACE_MATRIX, &B)); 129d24d4204SJose E. Roman if (mats_view) { 1309566063dSJacob Faibussowitsch PetscCall(PetscPrintf(PETSC_COMM_WORLD, "B after MatAXPY and MatAYPX:\n")); 1319566063dSJacob Faibussowitsch PetscCall(MatView(B, PETSC_VIEWER_STDOUT_WORLD)); 132d24d4204SJose E. Roman } 1339566063dSJacob Faibussowitsch PetscCall(ISDestroy(&isrows)); 1349566063dSJacob Faibussowitsch PetscCall(ISDestroy(&iscols)); 1359566063dSJacob Faibussowitsch PetscCall(MatDestroy(&B)); 136d24d4204SJose E. Roman 137d24d4204SJose E. Roman /* Test MatMatTransposeMult(): B = C*C^T */ 1389566063dSJacob Faibussowitsch PetscCall(MatMatTransposeMult(C, C, MAT_INITIAL_MATRIX, PETSC_DEFAULT, &B)); 1399566063dSJacob Faibussowitsch PetscCall(MatScale(C, 2.0)); 1409566063dSJacob Faibussowitsch PetscCall(MatMatTransposeMult(C, C, MAT_REUSE_MATRIX, PETSC_DEFAULT, &B)); 1419566063dSJacob Faibussowitsch PetscCall(MatMatTransposeMultEqual(C, C, B, 10, &flg)); 14228b400f6SJacob Faibussowitsch PetscCheck(flg, PETSC_COMM_WORLD, PETSC_ERR_PLIB, "Check fails: B != C*C^T"); 143d24d4204SJose E. Roman 144d24d4204SJose E. Roman if (mats_view) { 1459566063dSJacob Faibussowitsch PetscCall(PetscPrintf(PETSC_COMM_WORLD, "C MatMatTransposeMult C:\n")); 1469566063dSJacob Faibussowitsch PetscCall(MatView(B, PETSC_VIEWER_STDOUT_WORLD)); 147d24d4204SJose E. Roman } 148d24d4204SJose E. Roman 149d24d4204SJose E. Roman /* Test MatMult() */ 1509566063dSJacob Faibussowitsch PetscCall(MatComputeOperator(C, MATAIJ, &Caij)); 1519566063dSJacob Faibussowitsch PetscCall(MatMultEqual(C, Caij, 5, &flg)); 15228b400f6SJacob Faibussowitsch PetscCheck(flg, PETSC_COMM_WORLD, PETSC_ERR_ARG_NOTSAMETYPE, "C != Caij. MatMultEqual() fails"); 1539566063dSJacob Faibussowitsch PetscCall(MatMultTransposeEqual(C, Caij, 5, &flg)); 15428b400f6SJacob Faibussowitsch PetscCheck(flg, PETSC_COMM_WORLD, PETSC_ERR_ARG_NOTSAMETYPE, "C != Caij. MatMultTransposeEqual() fails"); 155d24d4204SJose E. Roman 156d24d4204SJose E. Roman /* Test MatMultAdd() and MatMultTransposeAddEqual() */ 1579566063dSJacob Faibussowitsch PetscCall(MatMultAddEqual(C, Caij, 5, &flg)); 15828b400f6SJacob Faibussowitsch PetscCheck(flg, PETSC_COMM_WORLD, PETSC_ERR_ARG_NOTSAMETYPE, "C != Caij. MatMultAddEqual() fails"); 1599566063dSJacob Faibussowitsch PetscCall(MatMultTransposeAddEqual(C, Caij, 5, &flg)); 16028b400f6SJacob Faibussowitsch PetscCheck(flg, PETSC_COMM_WORLD, PETSC_ERR_ARG_NOTSAMETYPE, "C != Caij. MatMultTransposeAddEqual() fails"); 161d24d4204SJose E. Roman 162d24d4204SJose E. Roman /* Test MatMatMult() */ 1639566063dSJacob Faibussowitsch PetscCall(PetscOptionsHasName(NULL, NULL, "-test_matmatmult", &flg)); 164d24d4204SJose E. Roman if (flg) { 165d24d4204SJose E. Roman Mat CC, CCaij; 1669566063dSJacob Faibussowitsch PetscCall(MatMatMult(C, C, MAT_INITIAL_MATRIX, PETSC_DEFAULT, &CC)); 1679566063dSJacob Faibussowitsch PetscCall(MatMatMult(Caij, Caij, MAT_INITIAL_MATRIX, PETSC_DEFAULT, &CCaij)); 1689566063dSJacob Faibussowitsch PetscCall(MatMultEqual(CC, CCaij, 5, &flg)); 16928b400f6SJacob Faibussowitsch PetscCheck(flg, PETSC_COMM_WORLD, PETSC_ERR_ARG_NOTSAMETYPE, "CC != CCaij. MatMatMult() fails"); 1709566063dSJacob Faibussowitsch PetscCall(MatDestroy(&CCaij)); 1719566063dSJacob Faibussowitsch PetscCall(MatDestroy(&CC)); 172d24d4204SJose E. Roman } 173d24d4204SJose E. Roman 174f7ec113fSDamian Marek /* Test MatCreate() on subcomm */ 175f7ec113fSDamian Marek color = rank % 2; 1769566063dSJacob Faibussowitsch PetscCallMPI(MPI_Comm_split(PETSC_COMM_WORLD, color, 0, &subcomm)); 177f7ec113fSDamian Marek if (color == 0) { 1789566063dSJacob Faibussowitsch PetscCall(MatCreate(subcomm, &Asub)); 1799566063dSJacob Faibussowitsch PetscCall(MatSetType(Asub, MATSCALAPACK)); 180f7ec113fSDamian Marek mloc = PETSC_DECIDE; 1819566063dSJacob Faibussowitsch PetscCall(PetscSplitOwnershipEqual(subcomm, &mloc, &M)); 182f7ec113fSDamian Marek nloc = PETSC_DECIDE; 1839566063dSJacob Faibussowitsch PetscCall(PetscSplitOwnershipEqual(subcomm, &nloc, &N)); 1849566063dSJacob Faibussowitsch PetscCall(MatSetSizes(Asub, mloc, nloc, M, N)); 1859566063dSJacob Faibussowitsch PetscCall(MatScaLAPACKSetBlockSizes(Asub, mb, nb)); 1869566063dSJacob Faibussowitsch PetscCall(MatSetFromOptions(Asub)); 1879566063dSJacob Faibussowitsch PetscCall(MatSetUp(Asub)); 1889566063dSJacob Faibussowitsch PetscCall(MatDestroy(&Asub)); 189f7ec113fSDamian Marek } 190f7ec113fSDamian Marek 1919566063dSJacob Faibussowitsch PetscCall(MatDestroy(&Cdense)); 1929566063dSJacob Faibussowitsch PetscCall(MatDestroy(&Caij)); 1939566063dSJacob Faibussowitsch PetscCall(MatDestroy(&B)); 1949566063dSJacob Faibussowitsch PetscCall(MatDestroy(&C)); 1959566063dSJacob Faibussowitsch PetscCall(MatDestroy(&Ct)); 1969566063dSJacob Faibussowitsch PetscCall(VecDestroy(&d)); 1979566063dSJacob Faibussowitsch PetscCallMPI(MPI_Comm_free(&subcomm)); 1989566063dSJacob Faibussowitsch PetscCall(PetscFinalize()); 199b122ec5aSJacob Faibussowitsch return 0; 200d24d4204SJose E. Roman } 201d24d4204SJose E. Roman 202d24d4204SJose E. Roman /*TEST 203d24d4204SJose E. Roman 204d24d4204SJose E. Roman build: 205d24d4204SJose E. Roman requires: scalapack 206d24d4204SJose E. Roman 207d24d4204SJose E. Roman test: 208d24d4204SJose E. Roman nsize: 2 209d24d4204SJose E. Roman args: -mb 5 -nb 5 -M 12 -N 10 210d24d4204SJose E. Roman requires: scalapack 211d24d4204SJose E. Roman 212d24d4204SJose E. Roman test: 213d24d4204SJose E. Roman suffix: 2 214d24d4204SJose E. Roman nsize: 6 215d24d4204SJose E. Roman args: -mb 8 -nb 6 -M 20 -N 50 216d24d4204SJose E. Roman requires: scalapack 217d24d4204SJose E. Roman output_file: output/ex242_1.out 218d24d4204SJose E. Roman 219d24d4204SJose E. Roman test: 220d24d4204SJose E. Roman suffix: 3 221d24d4204SJose E. Roman nsize: 3 222d24d4204SJose E. Roman args: -mb 2 -nb 2 -M 20 -N 20 -test_matmatmult 223d24d4204SJose E. Roman requires: scalapack 224d24d4204SJose E. Roman output_file: output/ex242_1.out 225d24d4204SJose E. Roman 226d24d4204SJose E. Roman TEST*/ 227