impls/bnk/bnk.c

eb910715SAlp Dener#include <petsctaolinesearch.h>
eb910715SAlp Dener#include <../src/tao/bound/impls/bnk/bnk.h>
eb910715SAlp Dener#include <petscksp.h>
eb910715SAlp Dener
70a3f44bSAlp Denerstatic const char *BNK_INIT[64]   = {"constant", "direction", "interpolation"};
70a3f44bSAlp Denerstatic const char *BNK_UPDATE[64] = {"step", "reduction", "interpolation"};
70a3f44bSAlp Denerstatic const char *BNK_AS[64]     = {"none", "bertsekas"};
70a3f44bSAlp Dener
e031d6f5SAlp Dener/*------------------------------------------------------------*/
e031d6f5SAlp Dener
df278d8fSAlp Dener/* Routine for initializing the KSP solver, the BFGS preconditioner, and the initial trust radius estimation */
df278d8fSAlp Dener
9371c9d4SSatish BalayPetscErrorCode TaoBNKInitialize(Tao tao, PetscInt initType, PetscBool *needH) {
eb910715SAlp Dener  TAO_BNK          *bnk = (TAO_BNK *)tao->data;
eb910715SAlp Dener  PC                pc;
89da521bSAlp Dener  PetscReal         f_min, ftrial, prered, actred, kappa, sigma, resnorm;
eb910715SAlp Dener  PetscReal         tau, tau_1, tau_2, tau_max, tau_min, max_radius;
0ad3a497SAlp Dener  PetscBool         is_bfgs, is_jacobi, is_symmetric, sym_set;
c4b75bccSAlp Dener  PetscInt          n, N, nDiff;
eb910715SAlp Dener  PetscInt          i_max = 5;
eb910715SAlp Dener  PetscInt          j_max = 1;
eb910715SAlp Dener  PetscInt          i, j;
2e6e4ca1SStefano Zampini  PetscVoidFunction kspTR;
eb910715SAlp Dener
eb910715SAlp Dener  PetscFunctionBegin;
28017e9fSAlp Dener  /* Project the current point onto the feasible set */
9566063dSJacob Faibussowitsch  PetscCall(TaoComputeVariableBounds(tao));
9566063dSJacob Faibussowitsch  PetscCall(TaoSetVariableBounds(bnk->bncg, tao->XL, tao->XU));
1baa6e33SBarry Smith  if (tao->bounded) PetscCall(TaoLineSearchSetVariableBounds(tao->linesearch, tao->XL, tao->XU));
28017e9fSAlp Dener
28017e9fSAlp Dener  /* Project the initial point onto the feasible region */
9566063dSJacob Faibussowitsch  PetscCall(TaoBoundSolution(tao->solution, tao->XL, tao->XU, 0.0, &nDiff, tao->solution));
28017e9fSAlp Dener
28017e9fSAlp Dener  /* Check convergence criteria */
9566063dSJacob Faibussowitsch  PetscCall(TaoComputeObjectiveAndGradient(tao, tao->solution, &bnk->f, bnk->unprojected_gradient));
9566063dSJacob Faibussowitsch  PetscCall(TaoBNKEstimateActiveSet(tao, bnk->as_type));
9566063dSJacob Faibussowitsch  PetscCall(VecCopy(bnk->unprojected_gradient, tao->gradient));
9566063dSJacob Faibussowitsch  PetscCall(VecISSet(tao->gradient, bnk->active_idx, 0.0));
9566063dSJacob Faibussowitsch  PetscCall(TaoGradientNorm(tao, tao->gradient, NORM_2, &bnk->gnorm));
28017e9fSAlp Dener
c0f10754SAlp Dener  /* Test the initial point for convergence */
9566063dSJacob Faibussowitsch  PetscCall(VecFischer(tao->solution, bnk->unprojected_gradient, tao->XL, tao->XU, bnk->W));
9566063dSJacob Faibussowitsch  PetscCall(VecNorm(bnk->W, NORM_2, &resnorm));
3c859ba3SBarry Smith  PetscCheck(!PetscIsInfOrNanReal(bnk->f) && !PetscIsInfOrNanReal(resnorm), PetscObjectComm((PetscObject)tao), PETSC_ERR_USER, "User provided compute function generated Inf or NaN");
9566063dSJacob Faibussowitsch  PetscCall(TaoLogConvergenceHistory(tao, bnk->f, resnorm, 0.0, tao->ksp_its));
9566063dSJacob Faibussowitsch  PetscCall(TaoMonitor(tao, tao->niter, bnk->f, resnorm, 0.0, 1.0));
dbbe0bcdSBarry Smith  PetscUseTypeMethod(tao, convergencetest, tao->cnvP);
c0f10754SAlp Dener  if (tao->reason != TAO_CONTINUE_ITERATING) PetscFunctionReturn(0);
c0f10754SAlp Dener
e031d6f5SAlp Dener  /* Reset KSP stopping reason counters */
eb910715SAlp Dener  bnk->ksp_atol = 0;
eb910715SAlp Dener  bnk->ksp_rtol = 0;
eb910715SAlp Dener  bnk->ksp_dtol = 0;
eb910715SAlp Dener  bnk->ksp_ctol = 0;
eb910715SAlp Dener  bnk->ksp_negc = 0;
eb910715SAlp Dener  bnk->ksp_iter = 0;
eb910715SAlp Dener  bnk->ksp_othr = 0;
eb910715SAlp Dener
e031d6f5SAlp Dener  /* Reset accepted step type counters */
e031d6f5SAlp Dener  bnk->tot_cg_its = 0;
e031d6f5SAlp Dener  bnk->newt       = 0;
e031d6f5SAlp Dener  bnk->bfgs       = 0;
e031d6f5SAlp Dener  bnk->sgrad      = 0;
e031d6f5SAlp Dener  bnk->grad       = 0;
e031d6f5SAlp Dener
fed79b8eSAlp Dener  /* Initialize the Hessian perturbation */
fed79b8eSAlp Dener  bnk->pert = bnk->sval;
fed79b8eSAlp Dener
937a31a1SAlp Dener  /* Reset initial steplength to zero (this helps BNCG reset its direction internally) */
9566063dSJacob Faibussowitsch  PetscCall(VecSet(tao->stepdirection, 0.0));
937a31a1SAlp Dener
e031d6f5SAlp Dener  /* Allocate the vectors needed for the BFGS approximation */
9566063dSJacob Faibussowitsch  PetscCall(KSPGetPC(tao->ksp, &pc));
9566063dSJacob Faibussowitsch  PetscCall(PetscObjectTypeCompare((PetscObject)pc, PCLMVM, &is_bfgs));
9566063dSJacob Faibussowitsch  PetscCall(PetscObjectTypeCompare((PetscObject)pc, PCJACOBI, &is_jacobi));
b9ac7092SAlp Dener  if (is_bfgs) {
b9ac7092SAlp Dener    bnk->bfgs_pre = pc;
9566063dSJacob Faibussowitsch    PetscCall(PCLMVMGetMatLMVM(bnk->bfgs_pre, &bnk->M));
9566063dSJacob Faibussowitsch    PetscCall(VecGetLocalSize(tao->solution, &n));
9566063dSJacob Faibussowitsch    PetscCall(VecGetSize(tao->solution, &N));
9566063dSJacob Faibussowitsch    PetscCall(MatSetSizes(bnk->M, n, n, N, N));
9566063dSJacob Faibussowitsch    PetscCall(MatLMVMAllocate(bnk->M, tao->solution, bnk->unprojected_gradient));
9566063dSJacob Faibussowitsch    PetscCall(MatIsSymmetricKnown(bnk->M, &sym_set, &is_symmetric));
3c859ba3SBarry Smith    PetscCheck(sym_set && is_symmetric, PetscObjectComm((PetscObject)tao), PETSC_ERR_ARG_INCOMP, "LMVM matrix in the LMVM preconditioner must be symmetric.");
1baa6e33SBarry Smith  } else if (is_jacobi) PetscCall(PCJacobiSetUseAbs(pc, PETSC_TRUE));
e031d6f5SAlp Dener
e031d6f5SAlp Dener  /* Prepare the min/max vectors for safeguarding diagonal scales */
9566063dSJacob Faibussowitsch  PetscCall(VecSet(bnk->Diag_min, bnk->dmin));
9566063dSJacob Faibussowitsch  PetscCall(VecSet(bnk->Diag_max, bnk->dmax));
eb910715SAlp Dener
eb910715SAlp Dener  /* Initialize trust-region radius.  The initialization is only performed
eb910715SAlp Dener     when we are using Nash, Steihaug-Toint or the Generalized Lanczos method. */
c0f10754SAlp Dener  *needH = PETSC_TRUE;
9566063dSJacob Faibussowitsch  PetscCall(PetscObjectQueryFunction((PetscObject)tao->ksp, "KSPCGSetRadius_C", &kspTR));
2e6e4ca1SStefano Zampini  if (kspTR) {
62675beeSAlp Dener    switch (initType) {
eb910715SAlp Dener    case BNK_INIT_CONSTANT:
eb910715SAlp Dener      /* Use the initial radius specified */
c0f10754SAlp Dener      tao->trust = tao->trust0;
eb910715SAlp Dener      break;
eb910715SAlp Dener
eb910715SAlp Dener    case BNK_INIT_INTERPOLATION:
c0f10754SAlp Dener      /* Use interpolation based on the initial Hessian */
eb910715SAlp Dener      max_radius = 0.0;
08752603SAlp Dener      tao->trust = tao->trust0;
eb910715SAlp Dener      for (j = 0; j < j_max; ++j) {
0a4511e9SAlp Dener        f_min = bnk->f;
eb910715SAlp Dener        sigma = 0.0;
eb910715SAlp Dener
c0f10754SAlp Dener        if (*needH) {
62602cfbSAlp Dener          /* Compute the Hessian at the new step, and extract the inactive subsystem */
9566063dSJacob Faibussowitsch          PetscCall((*bnk->computehessian)(tao));
9566063dSJacob Faibussowitsch          PetscCall(TaoBNKEstimateActiveSet(tao, BNK_AS_NONE));
9566063dSJacob Faibussowitsch          PetscCall(MatDestroy(&bnk->H_inactive));
89da521bSAlp Dener          if (bnk->active_idx) {
9566063dSJacob Faibussowitsch            PetscCall(MatCreateSubMatrix(tao->hessian, bnk->inactive_idx, bnk->inactive_idx, MAT_INITIAL_MATRIX, &bnk->H_inactive));
28017e9fSAlp Dener          } else {
9566063dSJacob Faibussowitsch            PetscCall(PetscObjectReference((PetscObject)tao->hessian));
c5e9d94cSAlp Dener            bnk->H_inactive = tao->hessian;
28017e9fSAlp Dener          }
c0f10754SAlp Dener          *needH = PETSC_FALSE;
eb910715SAlp Dener        }
eb910715SAlp Dener
eb910715SAlp Dener        for (i = 0; i < i_max; ++i) {
62602cfbSAlp Dener          /* Take a steepest descent step and snap it to bounds */
9566063dSJacob Faibussowitsch          PetscCall(VecCopy(tao->solution, bnk->Xold));
9566063dSJacob Faibussowitsch          PetscCall(VecAXPY(tao->solution, -tao->trust / bnk->gnorm, tao->gradient));
9566063dSJacob Faibussowitsch          PetscCall(TaoBoundSolution(tao->solution, tao->XL, tao->XU, 0.0, &nDiff, tao->solution));
89da521bSAlp Dener          /* Compute the step we actually accepted */
9566063dSJacob Faibussowitsch          PetscCall(VecCopy(tao->solution, bnk->W));
9566063dSJacob Faibussowitsch          PetscCall(VecAXPY(bnk->W, -1.0, bnk->Xold));
62602cfbSAlp Dener          /* Compute the objective at the trial */
9566063dSJacob Faibussowitsch          PetscCall(TaoComputeObjective(tao, tao->solution, &ftrial));
3c859ba3SBarry Smith          PetscCheck(!PetscIsInfOrNanReal(bnk->f), PetscObjectComm((PetscObject)tao), PETSC_ERR_USER, "User provided compute function generated Inf or NaN");
9566063dSJacob Faibussowitsch          PetscCall(VecCopy(bnk->Xold, tao->solution));
eb910715SAlp Dener          if (PetscIsInfOrNanReal(ftrial)) {
eb910715SAlp Dener            tau = bnk->gamma1_i;
eb910715SAlp Dener          } else {
0a4511e9SAlp Dener            if (ftrial < f_min) {
0a4511e9SAlp Dener              f_min = ftrial;
eb910715SAlp Dener              sigma = -tao->trust / bnk->gnorm;
eb910715SAlp Dener            }
08752603SAlp Dener
770b7498SAlp Dener            /* Compute the predicted and actual reduction */
89da521bSAlp Dener            if (bnk->active_idx) {
9566063dSJacob Faibussowitsch              PetscCall(VecGetSubVector(bnk->W, bnk->inactive_idx, &bnk->X_inactive));
9566063dSJacob Faibussowitsch              PetscCall(VecGetSubVector(bnk->Xwork, bnk->inactive_idx, &bnk->inactive_work));
2ab2a32cSAlp Dener            } else {
08752603SAlp Dener              bnk->X_inactive    = bnk->W;
08752603SAlp Dener              bnk->inactive_work = bnk->Xwork;
2ab2a32cSAlp Dener            }
9566063dSJacob Faibussowitsch            PetscCall(MatMult(bnk->H_inactive, bnk->X_inactive, bnk->inactive_work));
9566063dSJacob Faibussowitsch            PetscCall(VecDot(bnk->X_inactive, bnk->inactive_work, &prered));
89da521bSAlp Dener            if (bnk->active_idx) {
9566063dSJacob Faibussowitsch              PetscCall(VecRestoreSubVector(bnk->W, bnk->inactive_idx, &bnk->X_inactive));
9566063dSJacob Faibussowitsch              PetscCall(VecRestoreSubVector(bnk->Xwork, bnk->inactive_idx, &bnk->inactive_work));
2ab2a32cSAlp Dener            }
eb910715SAlp Dener            prered = tao->trust * (bnk->gnorm - 0.5 * tao->trust * prered / (bnk->gnorm * bnk->gnorm));
eb910715SAlp Dener            actred = bnk->f - ftrial;
3105154fSTodd Munson            if ((PetscAbsScalar(actred) <= bnk->epsilon) && (PetscAbsScalar(prered) <= bnk->epsilon)) {
eb910715SAlp Dener              kappa = 1.0;
3105154fSTodd Munson            } else {
eb910715SAlp Dener              kappa = actred / prered;
eb910715SAlp Dener            }
eb910715SAlp Dener
eb910715SAlp Dener            tau_1   = bnk->theta_i * bnk->gnorm * tao->trust / (bnk->theta_i * bnk->gnorm * tao->trust + (1.0 - bnk->theta_i) * prered - actred);
eb910715SAlp Dener            tau_2   = bnk->theta_i * bnk->gnorm * tao->trust / (bnk->theta_i * bnk->gnorm * tao->trust - (1.0 + bnk->theta_i) * prered + actred);
eb910715SAlp Dener            tau_min = PetscMin(tau_1, tau_2);
eb910715SAlp Dener            tau_max = PetscMax(tau_1, tau_2);
eb910715SAlp Dener
18cfbf8eSSatish Balay            if (PetscAbsScalar(kappa - (PetscReal)1.0) <= bnk->mu1_i) {
eb910715SAlp Dener              /*  Great agreement */
eb910715SAlp Dener              max_radius = PetscMax(max_radius, tao->trust);
eb910715SAlp Dener
eb910715SAlp Dener              if (tau_max < 1.0) {
eb910715SAlp Dener                tau = bnk->gamma3_i;
3105154fSTodd Munson              } else if (tau_max > bnk->gamma4_i) {
eb910715SAlp Dener                tau = bnk->gamma4_i;
3105154fSTodd Munson              } else {
eb910715SAlp Dener                tau = tau_max;
eb910715SAlp Dener              }
18cfbf8eSSatish Balay            } else if (PetscAbsScalar(kappa - (PetscReal)1.0) <= bnk->mu2_i) {
eb910715SAlp Dener              /*  Good agreement */
eb910715SAlp Dener              max_radius = PetscMax(max_radius, tao->trust);
eb910715SAlp Dener
eb910715SAlp Dener              if (tau_max < bnk->gamma2_i) {
eb910715SAlp Dener                tau = bnk->gamma2_i;
eb910715SAlp Dener              } else if (tau_max > bnk->gamma3_i) {
eb910715SAlp Dener                tau = bnk->gamma3_i;
eb910715SAlp Dener              } else {
eb910715SAlp Dener                tau = tau_max;
eb910715SAlp Dener              }
8f8a4e06SAlp Dener            } else {
eb910715SAlp Dener              /*  Not good agreement */
eb910715SAlp Dener              if (tau_min > 1.0) {
eb910715SAlp Dener                tau = bnk->gamma2_i;
eb910715SAlp Dener              } else if (tau_max < bnk->gamma1_i) {
eb910715SAlp Dener                tau = bnk->gamma1_i;
eb910715SAlp Dener              } else if ((tau_min < bnk->gamma1_i) && (tau_max >= 1.0)) {
eb910715SAlp Dener                tau = bnk->gamma1_i;
3105154fSTodd Munson              } else if ((tau_1 >= bnk->gamma1_i) && (tau_1 < 1.0) && ((tau_2 < bnk->gamma1_i) || (tau_2 >= 1.0))) {
eb910715SAlp Dener                tau = tau_1;
3105154fSTodd Munson              } else if ((tau_2 >= bnk->gamma1_i) && (tau_2 < 1.0) && ((tau_1 < bnk->gamma1_i) || (tau_2 >= 1.0))) {
eb910715SAlp Dener                tau = tau_2;
eb910715SAlp Dener              } else {
eb910715SAlp Dener                tau = tau_max;
eb910715SAlp Dener              }
eb910715SAlp Dener            }
eb910715SAlp Dener          }
eb910715SAlp Dener          tao->trust = tau * tao->trust;
eb910715SAlp Dener        }
eb910715SAlp Dener
0a4511e9SAlp Dener        if (f_min < bnk->f) {
937a31a1SAlp Dener          /* We accidentally found a solution better than the initial, so accept it */
0a4511e9SAlp Dener          bnk->f = f_min;
9566063dSJacob Faibussowitsch          PetscCall(VecCopy(tao->solution, bnk->Xold));
9566063dSJacob Faibussowitsch          PetscCall(VecAXPY(tao->solution, sigma, tao->gradient));
9566063dSJacob Faibussowitsch          PetscCall(TaoBoundSolution(tao->solution, tao->XL, tao->XU, 0.0, &nDiff, tao->solution));
9566063dSJacob Faibussowitsch          PetscCall(VecCopy(tao->solution, tao->stepdirection));
9566063dSJacob Faibussowitsch          PetscCall(VecAXPY(tao->stepdirection, -1.0, bnk->Xold));
9566063dSJacob Faibussowitsch          PetscCall(TaoComputeGradient(tao, tao->solution, bnk->unprojected_gradient));
9566063dSJacob Faibussowitsch          PetscCall(TaoBNKEstimateActiveSet(tao, bnk->as_type));
9566063dSJacob Faibussowitsch          PetscCall(VecCopy(bnk->unprojected_gradient, tao->gradient));
9566063dSJacob Faibussowitsch          PetscCall(VecISSet(tao->gradient, bnk->active_idx, 0.0));
937a31a1SAlp Dener          /* Compute gradient at the new iterate and flip switch to compute the Hessian later */
9566063dSJacob Faibussowitsch          PetscCall(TaoGradientNorm(tao, tao->gradient, NORM_2, &bnk->gnorm));
c0f10754SAlp Dener          *needH = PETSC_TRUE;
937a31a1SAlp Dener          /* Test the new step for convergence */
9566063dSJacob Faibussowitsch          PetscCall(VecFischer(tao->solution, bnk->unprojected_gradient, tao->XL, tao->XU, bnk->W));
9566063dSJacob Faibussowitsch          PetscCall(VecNorm(bnk->W, NORM_2, &resnorm));
3c859ba3SBarry Smith          PetscCheck(!PetscIsInfOrNanReal(resnorm), PetscObjectComm((PetscObject)tao), PETSC_ERR_USER, "User provided compute function generated Inf or NaN");
9566063dSJacob Faibussowitsch          PetscCall(TaoLogConvergenceHistory(tao, bnk->f, resnorm, 0.0, tao->ksp_its));
9566063dSJacob Faibussowitsch          PetscCall(TaoMonitor(tao, tao->niter, bnk->f, resnorm, 0.0, 1.0));
dbbe0bcdSBarry Smith          PetscUseTypeMethod(tao, convergencetest, tao->cnvP);
eb910715SAlp Dener          if (tao->reason != TAO_CONTINUE_ITERATING) PetscFunctionReturn(0);
937a31a1SAlp Dener          /* active BNCG recycling early because we have a stepdirection computed */
9566063dSJacob Faibussowitsch          PetscCall(TaoSetRecycleHistory(bnk->bncg, PETSC_TRUE));
eb910715SAlp Dener        }
eb910715SAlp Dener      }
eb910715SAlp Dener      tao->trust = PetscMax(tao->trust, max_radius);
e031d6f5SAlp Dener
e031d6f5SAlp Dener      /* Ensure that the trust radius is within the limits */
e031d6f5SAlp Dener      tao->trust = PetscMax(tao->trust, bnk->min_radius);
e031d6f5SAlp Dener      tao->trust = PetscMin(tao->trust, bnk->max_radius);
eb910715SAlp Dener      break;
eb910715SAlp Dener
eb910715SAlp Dener    default:
eb910715SAlp Dener      /* Norm of the first direction will initialize radius */
eb910715SAlp Dener      tao->trust = 0.0;
eb910715SAlp Dener      break;
eb910715SAlp Dener    }
eb910715SAlp Dener  }
eb910715SAlp Dener  PetscFunctionReturn(0);
eb910715SAlp Dener}
eb910715SAlp Dener
df278d8fSAlp Dener/*------------------------------------------------------------*/
df278d8fSAlp Dener
e0ed867bSAlp Dener/* Routine for computing the exact Hessian and preparing the preconditioner at the new iterate */
62675beeSAlp Dener
9371c9d4SSatish BalayPetscErrorCode TaoBNKComputeHessian(Tao tao) {
62675beeSAlp Dener  TAO_BNK *bnk = (TAO_BNK *)tao->data;
62675beeSAlp Dener
62675beeSAlp Dener  PetscFunctionBegin;
62675beeSAlp Dener  /* Compute the Hessian */
9566063dSJacob Faibussowitsch  PetscCall(TaoComputeHessian(tao, tao->solution, tao->hessian, tao->hessian_pre));
62675beeSAlp Dener  /* Add a correction to the BFGS preconditioner */
1baa6e33SBarry Smith  if (bnk->M) PetscCall(MatLMVMUpdate(bnk->M, tao->solution, bnk->unprojected_gradient));
e0ed867bSAlp Dener  /* Prepare the reduced sub-matrices for the inactive set */
9566063dSJacob Faibussowitsch  PetscCall(MatDestroy(&bnk->Hpre_inactive));
9566063dSJacob Faibussowitsch  PetscCall(MatDestroy(&bnk->H_inactive));
f5766c09SAlp Dener  if (bnk->active_idx) {
9566063dSJacob Faibussowitsch    PetscCall(MatCreateSubMatrix(tao->hessian, bnk->inactive_idx, bnk->inactive_idx, MAT_INITIAL_MATRIX, &bnk->H_inactive));
e0ed867bSAlp Dener    if (tao->hessian == tao->hessian_pre) {
9566063dSJacob Faibussowitsch      PetscCall(PetscObjectReference((PetscObject)bnk->H_inactive));
e0ed867bSAlp Dener      bnk->Hpre_inactive = bnk->H_inactive;
e0ed867bSAlp Dener    } else {
9566063dSJacob Faibussowitsch      PetscCall(MatCreateSubMatrix(tao->hessian_pre, bnk->inactive_idx, bnk->inactive_idx, MAT_INITIAL_MATRIX, &bnk->Hpre_inactive));
e0ed867bSAlp Dener    }
1baa6e33SBarry Smith    if (bnk->bfgs_pre) PetscCall(PCLMVMSetIS(bnk->bfgs_pre, bnk->inactive_idx));
e0ed867bSAlp Dener  } else {
9566063dSJacob Faibussowitsch    PetscCall(PetscObjectReference((PetscObject)tao->hessian));
c5e9d94cSAlp Dener    bnk->H_inactive = tao->hessian;
e0ed867bSAlp Dener    if (tao->hessian == tao->hessian_pre) {
9566063dSJacob Faibussowitsch      PetscCall(PetscObjectReference((PetscObject)bnk->H_inactive));
e0ed867bSAlp Dener      bnk->Hpre_inactive = bnk->H_inactive;
e0ed867bSAlp Dener    } else {
9566063dSJacob Faibussowitsch      PetscCall(PetscObjectReference((PetscObject)tao->hessian_pre));
c5e9d94cSAlp Dener      bnk->Hpre_inactive = tao->hessian_pre;
e0ed867bSAlp Dener    }
1baa6e33SBarry Smith    if (bnk->bfgs_pre) PetscCall(PCLMVMClearIS(bnk->bfgs_pre));
e0ed867bSAlp Dener  }
62675beeSAlp Dener  PetscFunctionReturn(0);
62675beeSAlp Dener}
62675beeSAlp Dener
62675beeSAlp Dener/*------------------------------------------------------------*/
62675beeSAlp Dener
2f75a4aaSAlp Dener/* Routine for estimating the active set */
2f75a4aaSAlp Dener
9371c9d4SSatish BalayPetscErrorCode TaoBNKEstimateActiveSet(Tao tao, PetscInt asType) {
2f75a4aaSAlp Dener  TAO_BNK  *bnk = (TAO_BNK *)tao->data;
f4db9bf7SStefano Zampini  PetscBool hessComputed, diagExists, hadactive;
2f75a4aaSAlp Dener
2f75a4aaSAlp Dener  PetscFunctionBegin;
f4db9bf7SStefano Zampini  hadactive = bnk->active_idx ? PETSC_TRUE : PETSC_FALSE;
08752603SAlp Dener  switch (asType) {
2f75a4aaSAlp Dener  case BNK_AS_NONE:
9566063dSJacob Faibussowitsch    PetscCall(ISDestroy(&bnk->inactive_idx));
9566063dSJacob Faibussowitsch    PetscCall(VecWhichInactive(tao->XL, tao->solution, bnk->unprojected_gradient, tao->XU, PETSC_TRUE, &bnk->inactive_idx));
9566063dSJacob Faibussowitsch    PetscCall(ISDestroy(&bnk->active_idx));
9566063dSJacob Faibussowitsch    PetscCall(ISComplementVec(bnk->inactive_idx, tao->solution, &bnk->active_idx));
2f75a4aaSAlp Dener    break;
2f75a4aaSAlp Dener
2f75a4aaSAlp Dener  case BNK_AS_BERTSEKAS:
2f75a4aaSAlp Dener    /* Compute the trial step vector with which we will estimate the active set at the next iteration */
b9ac7092SAlp Dener    if (bnk->M) {
2f75a4aaSAlp Dener      /* If the BFGS preconditioner matrix is available, we will construct a trial step with it */
9566063dSJacob Faibussowitsch      PetscCall(MatSolve(bnk->M, bnk->unprojected_gradient, bnk->W));
2f75a4aaSAlp Dener    } else {
fc5ca067SStefano Zampini      hessComputed = diagExists = PETSC_FALSE;
48a46eb9SPierre Jolivet      if (tao->hessian) PetscCall(MatAssembled(tao->hessian, &hessComputed));
48a46eb9SPierre Jolivet      if (hessComputed) PetscCall(MatHasOperation(tao->hessian, MATOP_GET_DIAGONAL, &diagExists));
fc5ca067SStefano Zampini      if (diagExists) {
9b6ef848SAlp Dener        /* BFGS preconditioner doesn't exist so let's invert the absolute diagonal of the Hessian instead onto the gradient */
9566063dSJacob Faibussowitsch        PetscCall(MatGetDiagonal(tao->hessian, bnk->Xwork));
9566063dSJacob Faibussowitsch        PetscCall(VecAbs(bnk->Xwork));
9566063dSJacob Faibussowitsch        PetscCall(VecMedian(bnk->Diag_min, bnk->Xwork, bnk->Diag_max, bnk->Xwork));
9566063dSJacob Faibussowitsch        PetscCall(VecReciprocal(bnk->Xwork));
9566063dSJacob Faibussowitsch        PetscCall(VecPointwiseMult(bnk->W, bnk->Xwork, bnk->unprojected_gradient));
61be54a6SAlp Dener      } else {
c4b75bccSAlp Dener        /* If the Hessian or its diagonal does not exist, we will simply use gradient step */
9566063dSJacob Faibussowitsch        PetscCall(VecCopy(bnk->unprojected_gradient, bnk->W));
61be54a6SAlp Dener      }
2f75a4aaSAlp Dener    }
9566063dSJacob Faibussowitsch    PetscCall(VecScale(bnk->W, -1.0));
9371c9d4SSatish Balay    PetscCall(TaoEstimateActiveBounds(tao->solution, tao->XL, tao->XU, bnk->unprojected_gradient, bnk->W, bnk->Xwork, bnk->as_step, &bnk->as_tol, &bnk->active_lower, &bnk->active_upper, &bnk->active_fixed, &bnk->active_idx, &bnk->inactive_idx));
c4b75bccSAlp Dener    break;
2f75a4aaSAlp Dener
9371c9d4SSatish Balay  default: break;
2f75a4aaSAlp Dener  }
f4db9bf7SStefano Zampini  bnk->resetksp = (PetscBool)(bnk->active_idx || hadactive); /* inactive Hessian size may have changed, need to reset operators */
2f75a4aaSAlp Dener  PetscFunctionReturn(0);
2f75a4aaSAlp Dener}
2f75a4aaSAlp Dener
2f75a4aaSAlp Dener/*------------------------------------------------------------*/
2f75a4aaSAlp Dener
2f75a4aaSAlp Dener/* Routine for bounding the step direction */
2f75a4aaSAlp Dener
9371c9d4SSatish BalayPetscErrorCode TaoBNKBoundStep(Tao tao, PetscInt asType, Vec step) {
2f75a4aaSAlp Dener  TAO_BNK *bnk = (TAO_BNK *)tao->data;
2f75a4aaSAlp Dener
2f75a4aaSAlp Dener  PetscFunctionBegin;
a1318120SAlp Dener  switch (asType) {
9371c9d4SSatish Balay  case BNK_AS_NONE: PetscCall(VecISSet(step, bnk->active_idx, 0.0)); break;
2f75a4aaSAlp Dener
9371c9d4SSatish Balay  case BNK_AS_BERTSEKAS: PetscCall(TaoBoundStep(tao->solution, tao->XL, tao->XU, bnk->active_lower, bnk->active_upper, bnk->active_fixed, 1.0, step)); break;
2f75a4aaSAlp Dener
9371c9d4SSatish Balay  default: break;
2f75a4aaSAlp Dener  }
2f75a4aaSAlp Dener  PetscFunctionReturn(0);
2f75a4aaSAlp Dener}
2f75a4aaSAlp Dener
e031d6f5SAlp Dener/*------------------------------------------------------------*/
e031d6f5SAlp Dener
e031d6f5SAlp Dener/* Routine for taking a finite number of BNCG iterations to
e031d6f5SAlp Dener   accelerate Newton convergence.
e031d6f5SAlp Dener
e031d6f5SAlp Dener   In practice, this approach simply trades off Hessian evaluations
e031d6f5SAlp Dener   for more gradient evaluations.
e031d6f5SAlp Dener*/
e031d6f5SAlp Dener
9371c9d4SSatish BalayPetscErrorCode TaoBNKTakeCGSteps(Tao tao, PetscBool *terminate) {
c0f10754SAlp Dener  TAO_BNK *bnk = (TAO_BNK *)tao->data;
c0f10754SAlp Dener
c0f10754SAlp Dener  PetscFunctionBegin;
c0f10754SAlp Dener  *terminate = PETSC_FALSE;
c0f10754SAlp Dener  if (bnk->max_cg_its > 0) {
c4b75bccSAlp Dener    /* Copy the current function value (important vectors are already shared) */
c0f10754SAlp Dener    bnk->bncg_ctx->f = bnk->f;
c0f10754SAlp Dener    /* Take some small finite number of BNCG iterations */
9566063dSJacob Faibussowitsch    PetscCall(TaoSolve(bnk->bncg));
c0f10754SAlp Dener    /* Add the number of gradient and function evaluations to the total */
c0f10754SAlp Dener    tao->nfuncs += bnk->bncg->nfuncs;
c0f10754SAlp Dener    tao->nfuncgrads += bnk->bncg->nfuncgrads;
c0f10754SAlp Dener    tao->ngrads += bnk->bncg->ngrads;
c0f10754SAlp Dener    tao->nhess += bnk->bncg->nhess;
e031d6f5SAlp Dener    bnk->tot_cg_its += bnk->bncg->niter;
c4b75bccSAlp Dener    /* Extract the BNCG function value out and save it into BNK */
c0f10754SAlp Dener    bnk->f = bnk->bncg_ctx->f;
c0f10754SAlp Dener    if (bnk->bncg->reason == TAO_CONVERGED_GATOL || bnk->bncg->reason == TAO_CONVERGED_GRTOL || bnk->bncg->reason == TAO_CONVERGED_GTTOL || bnk->bncg->reason == TAO_CONVERGED_MINF) {
c0f10754SAlp Dener      *terminate = PETSC_TRUE;
61be54a6SAlp Dener    } else {
9566063dSJacob Faibussowitsch      PetscCall(TaoBNKEstimateActiveSet(tao, bnk->as_type));
c0f10754SAlp Dener    }
c0f10754SAlp Dener  }
c0f10754SAlp Dener  PetscFunctionReturn(0);
c0f10754SAlp Dener}
c0f10754SAlp Dener
2f75a4aaSAlp Dener/*------------------------------------------------------------*/
2f75a4aaSAlp Dener
c0f10754SAlp Dener/* Routine for computing the Newton step. */
df278d8fSAlp Dener
9371c9d4SSatish BalayPetscErrorCode TaoBNKComputeStep(Tao tao, PetscBool shift, KSPConvergedReason *ksp_reason, PetscInt *step_type) {
eb910715SAlp Dener  TAO_BNK          *bnk         = (TAO_BNK *)tao->data;
eb910715SAlp Dener  PetscInt          bfgsUpdates = 0;
eb910715SAlp Dener  PetscInt          kspits;
bddd1ffdSAlp Dener  PetscBool         is_lmvm;
2e6e4ca1SStefano Zampini  PetscVoidFunction kspTR;
eb910715SAlp Dener
eb910715SAlp Dener  PetscFunctionBegin;
89da521bSAlp Dener  /* If there are no inactive variables left, save some computation and return an adjusted zero step
89da521bSAlp Dener     that has (l-x) and (u-x) for lower and upper bounded variables. */
89da521bSAlp Dener  if (!bnk->inactive_idx) {
9566063dSJacob Faibussowitsch    PetscCall(VecSet(tao->stepdirection, 0.0));
9566063dSJacob Faibussowitsch    PetscCall(TaoBNKBoundStep(tao, bnk->as_type, tao->stepdirection));
89da521bSAlp Dener    PetscFunctionReturn(0);
89da521bSAlp Dener  }
89da521bSAlp Dener
62675beeSAlp Dener  /* Shift the reduced Hessian matrix */
e831869dSStefano Zampini  if (shift && bnk->pert > 0) {
9566063dSJacob Faibussowitsch    PetscCall(PetscObjectTypeCompare((PetscObject)tao->hessian, MATLMVM, &is_lmvm));
f7bf01afSAlp Dener    if (is_lmvm) {
9566063dSJacob Faibussowitsch      PetscCall(MatShift(tao->hessian, bnk->pert));
f7bf01afSAlp Dener    } else {
9566063dSJacob Faibussowitsch      PetscCall(MatShift(bnk->H_inactive, bnk->pert));
48a46eb9SPierre Jolivet      if (bnk->H_inactive != bnk->Hpre_inactive) PetscCall(MatShift(bnk->Hpre_inactive, bnk->pert));
62675beeSAlp Dener    }
f7bf01afSAlp Dener  }
62675beeSAlp Dener
eb910715SAlp Dener  /* Solve the Newton system of equations */
937a31a1SAlp Dener  tao->ksp_its = 0;
9566063dSJacob Faibussowitsch  PetscCall(VecSet(tao->stepdirection, 0.0));
f4db9bf7SStefano Zampini  if (bnk->resetksp) {
9566063dSJacob Faibussowitsch    PetscCall(KSPReset(tao->ksp));
9566063dSJacob Faibussowitsch    PetscCall(KSPResetFromOptions(tao->ksp));
f4db9bf7SStefano Zampini    bnk->resetksp = PETSC_FALSE;
f4db9bf7SStefano Zampini  }
9566063dSJacob Faibussowitsch  PetscCall(KSPSetOperators(tao->ksp, bnk->H_inactive, bnk->Hpre_inactive));
9566063dSJacob Faibussowitsch  PetscCall(VecCopy(bnk->unprojected_gradient, bnk->Gwork));
89da521bSAlp Dener  if (bnk->active_idx) {
9566063dSJacob Faibussowitsch    PetscCall(VecGetSubVector(bnk->Gwork, bnk->inactive_idx, &bnk->G_inactive));
9566063dSJacob Faibussowitsch    PetscCall(VecGetSubVector(tao->stepdirection, bnk->inactive_idx, &bnk->X_inactive));
5e9b73cbSAlp Dener  } else {
5e9b73cbSAlp Dener    bnk->G_inactive = bnk->unprojected_gradient;
5e9b73cbSAlp Dener    bnk->X_inactive = tao->stepdirection;
28017e9fSAlp Dener  }
9566063dSJacob Faibussowitsch  PetscCall(KSPCGSetRadius(tao->ksp, tao->trust));
9566063dSJacob Faibussowitsch  PetscCall(KSPSolve(tao->ksp, bnk->G_inactive, bnk->X_inactive));
9566063dSJacob Faibussowitsch  PetscCall(KSPGetIterationNumber(tao->ksp, &kspits));
eb910715SAlp Dener  tao->ksp_its += kspits;
eb910715SAlp Dener  tao->ksp_tot_its += kspits;
f4db9bf7SStefano Zampini  PetscCall(PetscObjectQueryFunction((PetscObject)tao->ksp, "KSPCGGetNormD_C", &kspTR));
f4db9bf7SStefano Zampini  if (kspTR) {
9566063dSJacob Faibussowitsch    PetscCall(KSPCGGetNormD(tao->ksp, &bnk->dnorm));
eb910715SAlp Dener
eb910715SAlp Dener    if (0.0 == tao->trust) {
eb910715SAlp Dener      /* Radius was uninitialized; use the norm of the direction */
080d2917SAlp Dener      if (bnk->dnorm > 0.0) {
080d2917SAlp Dener        tao->trust = bnk->dnorm;
eb910715SAlp Dener
eb910715SAlp Dener        /* Modify the radius if it is too large or small */
eb910715SAlp Dener        tao->trust = PetscMax(tao->trust, bnk->min_radius);
eb910715SAlp Dener        tao->trust = PetscMin(tao->trust, bnk->max_radius);
eb910715SAlp Dener      } else {
eb910715SAlp Dener        /* The direction was bad; set radius to default value and re-solve
eb910715SAlp Dener           the trust-region subproblem to get a direction */
eb910715SAlp Dener        tao->trust = tao->trust0;
eb910715SAlp Dener
eb910715SAlp Dener        /* Modify the radius if it is too large or small */
eb910715SAlp Dener        tao->trust = PetscMax(tao->trust, bnk->min_radius);
eb910715SAlp Dener        tao->trust = PetscMin(tao->trust, bnk->max_radius);
eb910715SAlp Dener
9566063dSJacob Faibussowitsch        PetscCall(KSPCGSetRadius(tao->ksp, tao->trust));
9566063dSJacob Faibussowitsch        PetscCall(KSPSolve(tao->ksp, bnk->G_inactive, bnk->X_inactive));
9566063dSJacob Faibussowitsch        PetscCall(KSPGetIterationNumber(tao->ksp, &kspits));
eb910715SAlp Dener        tao->ksp_its += kspits;
eb910715SAlp Dener        tao->ksp_tot_its += kspits;
9566063dSJacob Faibussowitsch        PetscCall(KSPCGGetNormD(tao->ksp, &bnk->dnorm));
eb910715SAlp Dener
3c859ba3SBarry Smith        PetscCheck(bnk->dnorm != 0.0, PetscObjectComm((PetscObject)tao), PETSC_ERR_PLIB, "Initial direction zero");
eb910715SAlp Dener      }
eb910715SAlp Dener    }
eb910715SAlp Dener  }
5e9b73cbSAlp Dener  /* Restore sub vectors back */
89da521bSAlp Dener  if (bnk->active_idx) {
9566063dSJacob Faibussowitsch    PetscCall(VecRestoreSubVector(bnk->Gwork, bnk->inactive_idx, &bnk->G_inactive));
9566063dSJacob Faibussowitsch    PetscCall(VecRestoreSubVector(tao->stepdirection, bnk->inactive_idx, &bnk->X_inactive));
5e9b73cbSAlp Dener  }
770b7498SAlp Dener  /* Make sure the safeguarded fall-back step is zero for actively bounded variables */
9566063dSJacob Faibussowitsch  PetscCall(VecScale(tao->stepdirection, -1.0));
9566063dSJacob Faibussowitsch  PetscCall(TaoBNKBoundStep(tao, bnk->as_type, tao->stepdirection));
770b7498SAlp Dener
770b7498SAlp Dener  /* Record convergence reasons */
9566063dSJacob Faibussowitsch  PetscCall(KSPGetConvergedReason(tao->ksp, ksp_reason));
e465cd6fSAlp Dener  if (KSP_CONVERGED_ATOL == *ksp_reason) {
770b7498SAlp Dener    ++bnk->ksp_atol;
e465cd6fSAlp Dener  } else if (KSP_CONVERGED_RTOL == *ksp_reason) {
770b7498SAlp Dener    ++bnk->ksp_rtol;
e465cd6fSAlp Dener  } else if (KSP_CONVERGED_CG_CONSTRAINED == *ksp_reason) {
770b7498SAlp Dener    ++bnk->ksp_ctol;
e465cd6fSAlp Dener  } else if (KSP_CONVERGED_CG_NEG_CURVE == *ksp_reason) {
770b7498SAlp Dener    ++bnk->ksp_negc;
e465cd6fSAlp Dener  } else if (KSP_DIVERGED_DTOL == *ksp_reason) {
770b7498SAlp Dener    ++bnk->ksp_dtol;
e465cd6fSAlp Dener  } else if (KSP_DIVERGED_ITS == *ksp_reason) {
770b7498SAlp Dener    ++bnk->ksp_iter;
770b7498SAlp Dener  } else {
770b7498SAlp Dener    ++bnk->ksp_othr;
770b7498SAlp Dener  }
fed79b8eSAlp Dener
fed79b8eSAlp Dener  /* Make sure the BFGS preconditioner is healthy */
b9ac7092SAlp Dener  if (bnk->M) {
9566063dSJacob Faibussowitsch    PetscCall(MatLMVMGetUpdateCount(bnk->M, &bfgsUpdates));
b2d8c577SAlp Dener    if ((KSP_DIVERGED_INDEFINITE_PC == *ksp_reason) && (bfgsUpdates > 0)) {
fed79b8eSAlp Dener      /* Preconditioner is numerically indefinite; reset the approximation. */
9566063dSJacob Faibussowitsch      PetscCall(MatLMVMReset(bnk->M, PETSC_FALSE));
9566063dSJacob Faibussowitsch      PetscCall(MatLMVMUpdate(bnk->M, tao->solution, bnk->unprojected_gradient));
eb910715SAlp Dener    }
fed79b8eSAlp Dener  }
6b591159SAlp Dener  *step_type = BNK_NEWTON;
e465cd6fSAlp Dener  PetscFunctionReturn(0);
e465cd6fSAlp Dener}
eb910715SAlp Dener
62675beeSAlp Dener/*------------------------------------------------------------*/
62675beeSAlp Dener
5e9b73cbSAlp Dener/* Routine for recomputing the predicted reduction for a given step vector */
5e9b73cbSAlp Dener
9371c9d4SSatish BalayPetscErrorCode TaoBNKRecomputePred(Tao tao, Vec S, PetscReal *prered) {
5e9b73cbSAlp Dener  TAO_BNK *bnk = (TAO_BNK *)tao->data;
5e9b73cbSAlp Dener
5e9b73cbSAlp Dener  PetscFunctionBegin;
5e9b73cbSAlp Dener  /* Extract subvectors associated with the inactive set */
89da521bSAlp Dener  if (bnk->active_idx) {
9566063dSJacob Faibussowitsch    PetscCall(VecGetSubVector(tao->stepdirection, bnk->inactive_idx, &bnk->X_inactive));
9566063dSJacob Faibussowitsch    PetscCall(VecGetSubVector(bnk->Xwork, bnk->inactive_idx, &bnk->inactive_work));
9566063dSJacob Faibussowitsch    PetscCall(VecGetSubVector(bnk->Gwork, bnk->inactive_idx, &bnk->G_inactive));
5e9b73cbSAlp Dener  } else {
5e9b73cbSAlp Dener    bnk->X_inactive    = tao->stepdirection;
5e9b73cbSAlp Dener    bnk->inactive_work = bnk->Xwork;
5e9b73cbSAlp Dener    bnk->G_inactive    = bnk->Gwork;
5e9b73cbSAlp Dener  }
5e9b73cbSAlp Dener  /* Recompute the predicted decrease based on the quadratic model */
9566063dSJacob Faibussowitsch  PetscCall(MatMult(bnk->H_inactive, bnk->X_inactive, bnk->inactive_work));
9566063dSJacob Faibussowitsch  PetscCall(VecAYPX(bnk->inactive_work, -0.5, bnk->G_inactive));
9566063dSJacob Faibussowitsch  PetscCall(VecDot(bnk->inactive_work, bnk->X_inactive, prered));
5e9b73cbSAlp Dener  /* Restore the sub vectors */
89da521bSAlp Dener  if (bnk->active_idx) {
9566063dSJacob Faibussowitsch    PetscCall(VecRestoreSubVector(tao->stepdirection, bnk->inactive_idx, &bnk->X_inactive));
9566063dSJacob Faibussowitsch    PetscCall(VecRestoreSubVector(bnk->Xwork, bnk->inactive_idx, &bnk->inactive_work));
9566063dSJacob Faibussowitsch    PetscCall(VecRestoreSubVector(bnk->Gwork, bnk->inactive_idx, &bnk->G_inactive));
5e9b73cbSAlp Dener  }
5e9b73cbSAlp Dener  PetscFunctionReturn(0);
5e9b73cbSAlp Dener}
5e9b73cbSAlp Dener
5e9b73cbSAlp Dener/*------------------------------------------------------------*/
5e9b73cbSAlp Dener
62675beeSAlp Dener/* Routine for ensuring that the Newton step is a descent direction.
62675beeSAlp Dener
62675beeSAlp Dener   The step direction falls back onto BFGS, scaled gradient and gradient steps
62675beeSAlp Dener   in the event that the Newton step fails the test.
62675beeSAlp Dener*/
62675beeSAlp Dener
9371c9d4SSatish BalayPetscErrorCode TaoBNKSafeguardStep(Tao tao, KSPConvergedReason ksp_reason, PetscInt *stepType) {
e465cd6fSAlp Dener  TAO_BNK  *bnk = (TAO_BNK *)tao->data;
b2d8c577SAlp Dener  PetscReal gdx, e_min;
e465cd6fSAlp Dener  PetscInt  bfgsUpdates;
e465cd6fSAlp Dener
e465cd6fSAlp Dener  PetscFunctionBegin;
6b591159SAlp Dener  switch (*stepType) {
6b591159SAlp Dener  case BNK_NEWTON:
9566063dSJacob Faibussowitsch    PetscCall(VecDot(tao->stepdirection, tao->gradient, &gdx));
eb910715SAlp Dener    if ((gdx >= 0.0) || PetscIsInfOrNanReal(gdx)) {
eb910715SAlp Dener      /* Newton step is not descent or direction produced Inf or NaN
eb910715SAlp Dener        Update the perturbation for next time */
eb910715SAlp Dener      if (bnk->pert <= 0.0) {
2e6e4ca1SStefano Zampini        PetscBool is_gltr;
2e6e4ca1SStefano Zampini
eb910715SAlp Dener        /* Initialize the perturbation */
eb910715SAlp Dener        bnk->pert = PetscMin(bnk->imax, PetscMax(bnk->imin, bnk->imfac * bnk->gnorm));
9566063dSJacob Faibussowitsch        PetscCall(PetscObjectTypeCompare((PetscObject)(tao->ksp), KSPGLTR, &is_gltr));
2e6e4ca1SStefano Zampini        if (is_gltr) {
9566063dSJacob Faibussowitsch          PetscCall(KSPGLTRGetMinEig(tao->ksp, &e_min));
eb910715SAlp Dener          bnk->pert = PetscMax(bnk->pert, -e_min);
eb910715SAlp Dener        }
eb910715SAlp Dener      } else {
eb910715SAlp Dener        /* Increase the perturbation */
eb910715SAlp Dener        bnk->pert = PetscMin(bnk->pmax, PetscMax(bnk->pgfac * bnk->pert, bnk->pmgfac * bnk->gnorm));
eb910715SAlp Dener      }
eb910715SAlp Dener
0ad3a497SAlp Dener      if (!bnk->M) {
eb910715SAlp Dener        /* We don't have the bfgs matrix around and updated
eb910715SAlp Dener          Must use gradient direction in this case */
9566063dSJacob Faibussowitsch        PetscCall(VecCopy(tao->gradient, tao->stepdirection));
eb910715SAlp Dener        *stepType = BNK_GRADIENT;
eb910715SAlp Dener      } else {
eb910715SAlp Dener        /* Attempt to use the BFGS direction */
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(bnk->M, bnk->unprojected_gradient, tao->stepdirection));
eb910715SAlp Dener
8d5ead36SAlp Dener        /* Check for success (descent direction)
8d5ead36SAlp Dener          NOTE: Negative gdx here means not a descent direction because
8d5ead36SAlp Dener          the fall-back step is missing a negative sign. */
9566063dSJacob Faibussowitsch        PetscCall(VecDot(tao->gradient, tao->stepdirection, &gdx));
3105154fSTodd Munson        if ((gdx <= 0.0) || PetscIsInfOrNanReal(gdx)) {
eb910715SAlp Dener          /* BFGS direction is not descent or direction produced not a number
eb910715SAlp Dener            We can assert bfgsUpdates > 1 in this case because
eb910715SAlp Dener            the first solve produces the scaled gradient direction,
eb910715SAlp Dener            which is guaranteed to be descent */
eb910715SAlp Dener
eb910715SAlp Dener          /* Use steepest descent direction (scaled) */
9566063dSJacob Faibussowitsch          PetscCall(MatLMVMReset(bnk->M, PETSC_FALSE));
9566063dSJacob Faibussowitsch          PetscCall(MatLMVMUpdate(bnk->M, tao->solution, bnk->unprojected_gradient));
9566063dSJacob Faibussowitsch          PetscCall(MatSolve(bnk->M, bnk->unprojected_gradient, tao->stepdirection));
eb910715SAlp Dener
eb910715SAlp Dener          *stepType = BNK_SCALED_GRADIENT;
eb910715SAlp Dener        } else {
9566063dSJacob Faibussowitsch          PetscCall(MatLMVMGetUpdateCount(bnk->M, &bfgsUpdates));
eb910715SAlp Dener          if (1 == bfgsUpdates) {
eb910715SAlp Dener            /* The first BFGS direction is always the scaled gradient */
eb910715SAlp Dener            *stepType = BNK_SCALED_GRADIENT;
eb910715SAlp Dener          } else {
eb910715SAlp Dener            *stepType = BNK_BFGS;
eb910715SAlp Dener          }
eb910715SAlp Dener        }
eb910715SAlp Dener      }
8d5ead36SAlp Dener      /* Make sure the safeguarded fall-back step is zero for actively bounded variables */
9566063dSJacob Faibussowitsch      PetscCall(VecScale(tao->stepdirection, -1.0));
9566063dSJacob Faibussowitsch      PetscCall(TaoBNKBoundStep(tao, bnk->as_type, tao->stepdirection));
eb910715SAlp Dener    } else {
eb910715SAlp Dener      /* Computed Newton step is descent */
eb910715SAlp Dener      switch (ksp_reason) {
eb910715SAlp Dener      case KSP_DIVERGED_NANORINF:
eb910715SAlp Dener      case KSP_DIVERGED_BREAKDOWN:
eb910715SAlp Dener      case KSP_DIVERGED_INDEFINITE_MAT:
eb910715SAlp Dener      case KSP_DIVERGED_INDEFINITE_PC:
eb910715SAlp Dener      case KSP_CONVERGED_CG_NEG_CURVE:
eb910715SAlp Dener        /* Matrix or preconditioner is indefinite; increase perturbation */
eb910715SAlp Dener        if (bnk->pert <= 0.0) {
2e6e4ca1SStefano Zampini          PetscBool is_gltr;
2e6e4ca1SStefano Zampini
eb910715SAlp Dener          /* Initialize the perturbation */
eb910715SAlp Dener          bnk->pert = PetscMin(bnk->imax, PetscMax(bnk->imin, bnk->imfac * bnk->gnorm));
9566063dSJacob Faibussowitsch          PetscCall(PetscObjectTypeCompare((PetscObject)(tao->ksp), KSPGLTR, &is_gltr));
2e6e4ca1SStefano Zampini          if (is_gltr) {
9566063dSJacob Faibussowitsch            PetscCall(KSPGLTRGetMinEig(tao->ksp, &e_min));
eb910715SAlp Dener            bnk->pert = PetscMax(bnk->pert, -e_min);
eb910715SAlp Dener          }
eb910715SAlp Dener        } else {
eb910715SAlp Dener          /* Increase the perturbation */
eb910715SAlp Dener          bnk->pert = PetscMin(bnk->pmax, PetscMax(bnk->pgfac * bnk->pert, bnk->pmgfac * bnk->gnorm));
eb910715SAlp Dener        }
eb910715SAlp Dener        break;
eb910715SAlp Dener
eb910715SAlp Dener      default:
eb910715SAlp Dener        /* Newton step computation is good; decrease perturbation */
eb910715SAlp Dener        bnk->pert = PetscMin(bnk->psfac * bnk->pert, bnk->pmsfac * bnk->gnorm);
ad540459SPierre Jolivet        if (bnk->pert < bnk->pmin) bnk->pert = 0.0;
eb910715SAlp Dener        break;
eb910715SAlp Dener      }
fed79b8eSAlp Dener      *stepType = BNK_NEWTON;
eb910715SAlp Dener    }
6b591159SAlp Dener    break;
6b591159SAlp Dener
6b591159SAlp Dener  case BNK_BFGS:
6b591159SAlp Dener    /* Check for success (descent direction) */
9566063dSJacob Faibussowitsch    PetscCall(VecDot(tao->stepdirection, tao->gradient, &gdx));
6b591159SAlp Dener    if (gdx >= 0 || PetscIsInfOrNanReal(gdx)) {
6b591159SAlp Dener      /* Step is not descent or solve was not successful
6b591159SAlp Dener         Use steepest descent direction (scaled) */
9566063dSJacob Faibussowitsch      PetscCall(MatLMVMReset(bnk->M, PETSC_FALSE));
9566063dSJacob Faibussowitsch      PetscCall(MatLMVMUpdate(bnk->M, tao->solution, bnk->unprojected_gradient));
9566063dSJacob Faibussowitsch      PetscCall(MatSolve(bnk->M, tao->gradient, tao->stepdirection));
9566063dSJacob Faibussowitsch      PetscCall(VecScale(tao->stepdirection, -1.0));
9566063dSJacob Faibussowitsch      PetscCall(TaoBNKBoundStep(tao, bnk->as_type, tao->stepdirection));
6b591159SAlp Dener      *stepType = BNK_SCALED_GRADIENT;
6b591159SAlp Dener    } else {
6b591159SAlp Dener      *stepType = BNK_BFGS;
6b591159SAlp Dener    }
6b591159SAlp Dener    break;
6b591159SAlp Dener
9371c9d4SSatish Balay  case BNK_SCALED_GRADIENT: break;
6b591159SAlp Dener
9371c9d4SSatish Balay  default: break;
6b591159SAlp Dener  }
6b591159SAlp Dener
eb910715SAlp Dener  PetscFunctionReturn(0);
eb910715SAlp Dener}
eb910715SAlp Dener
df278d8fSAlp Dener/*------------------------------------------------------------*/
df278d8fSAlp Dener
df278d8fSAlp Dener/* Routine for performing a bound-projected More-Thuente line search.
df278d8fSAlp Dener
df278d8fSAlp Dener  Includes fallbacks to BFGS, scaled gradient, and unscaled gradient steps if the
df278d8fSAlp Dener  Newton step does not produce a valid step length.
df278d8fSAlp Dener*/
df278d8fSAlp Dener
9371c9d4SSatish BalayPetscErrorCode TaoBNKPerformLineSearch(Tao tao, PetscInt *stepType, PetscReal *steplen, TaoLineSearchConvergedReason *reason) {
c14b763aSAlp Dener  TAO_BNK                     *bnk = (TAO_BNK *)tao->data;
c14b763aSAlp Dener  TaoLineSearchConvergedReason ls_reason;
b2d8c577SAlp Dener  PetscReal                    e_min, gdx;
c14b763aSAlp Dener  PetscInt                     bfgsUpdates;
c14b763aSAlp Dener
c14b763aSAlp Dener  PetscFunctionBegin;
c14b763aSAlp Dener  /* Perform the linesearch */
9566063dSJacob Faibussowitsch  PetscCall(TaoLineSearchApply(tao->linesearch, tao->solution, &bnk->f, bnk->unprojected_gradient, tao->stepdirection, steplen, &ls_reason));
9566063dSJacob Faibussowitsch  PetscCall(TaoAddLineSearchCounts(tao));
c14b763aSAlp Dener
b2d8c577SAlp Dener  while (ls_reason != TAOLINESEARCH_SUCCESS && ls_reason != TAOLINESEARCH_SUCCESS_USER && *stepType != BNK_SCALED_GRADIENT && *stepType != BNK_GRADIENT) {
c14b763aSAlp Dener    /* Linesearch failed, revert solution */
c14b763aSAlp Dener    bnk->f = bnk->fold;
9566063dSJacob Faibussowitsch    PetscCall(VecCopy(bnk->Xold, tao->solution));
9566063dSJacob Faibussowitsch    PetscCall(VecCopy(bnk->unprojected_gradient_old, bnk->unprojected_gradient));
c14b763aSAlp Dener
937a31a1SAlp Dener    switch (*stepType) {
c14b763aSAlp Dener    case BNK_NEWTON:
8d5ead36SAlp Dener      /* Failed to obtain acceptable iterate with Newton step
c14b763aSAlp Dener         Update the perturbation for next time */
c14b763aSAlp Dener      if (bnk->pert <= 0.0) {
2e6e4ca1SStefano Zampini        PetscBool is_gltr;
2e6e4ca1SStefano Zampini
c14b763aSAlp Dener        /* Initialize the perturbation */
c14b763aSAlp Dener        bnk->pert = PetscMin(bnk->imax, PetscMax(bnk->imin, bnk->imfac * bnk->gnorm));
9566063dSJacob Faibussowitsch        PetscCall(PetscObjectTypeCompare((PetscObject)(tao->ksp), KSPGLTR, &is_gltr));
2e6e4ca1SStefano Zampini        if (is_gltr) {
9566063dSJacob Faibussowitsch          PetscCall(KSPGLTRGetMinEig(tao->ksp, &e_min));
c14b763aSAlp Dener          bnk->pert = PetscMax(bnk->pert, -e_min);
c14b763aSAlp Dener        }
c14b763aSAlp Dener      } else {
c14b763aSAlp Dener        /* Increase the perturbation */
c14b763aSAlp Dener        bnk->pert = PetscMin(bnk->pmax, PetscMax(bnk->pgfac * bnk->pert, bnk->pmgfac * bnk->gnorm));
c14b763aSAlp Dener      }
c14b763aSAlp Dener
0ad3a497SAlp Dener      if (!bnk->M) {
c14b763aSAlp Dener        /* We don't have the bfgs matrix around and being updated
c14b763aSAlp Dener           Must use gradient direction in this case */
9566063dSJacob Faibussowitsch        PetscCall(VecCopy(bnk->unprojected_gradient, tao->stepdirection));
937a31a1SAlp Dener        *stepType = BNK_GRADIENT;
c14b763aSAlp Dener      } else {
c14b763aSAlp Dener        /* Attempt to use the BFGS direction */
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(bnk->M, bnk->unprojected_gradient, tao->stepdirection));
8d5ead36SAlp Dener        /* Check for success (descent direction)
8d5ead36SAlp Dener           NOTE: Negative gdx means not a descent direction because the step here is missing a negative sign. */
9566063dSJacob Faibussowitsch        PetscCall(VecDot(tao->gradient, tao->stepdirection, &gdx));
3105154fSTodd Munson        if ((gdx <= 0.0) || PetscIsInfOrNanReal(gdx)) {
c14b763aSAlp Dener          /* BFGS direction is not descent or direction produced not a number
c14b763aSAlp Dener             We can assert bfgsUpdates > 1 in this case
c14b763aSAlp Dener             Use steepest descent direction (scaled) */
9566063dSJacob Faibussowitsch          PetscCall(MatLMVMReset(bnk->M, PETSC_FALSE));
9566063dSJacob Faibussowitsch          PetscCall(MatLMVMUpdate(bnk->M, tao->solution, bnk->unprojected_gradient));
9566063dSJacob Faibussowitsch          PetscCall(MatSolve(bnk->M, bnk->unprojected_gradient, tao->stepdirection));
c14b763aSAlp Dener
c14b763aSAlp Dener          bfgsUpdates = 1;
937a31a1SAlp Dener          *stepType   = BNK_SCALED_GRADIENT;
c14b763aSAlp Dener        } else {
9566063dSJacob Faibussowitsch          PetscCall(MatLMVMGetUpdateCount(bnk->M, &bfgsUpdates));
c14b763aSAlp Dener          if (1 == bfgsUpdates) {
c14b763aSAlp Dener            /* The first BFGS direction is always the scaled gradient */
937a31a1SAlp Dener            *stepType = BNK_SCALED_GRADIENT;
c14b763aSAlp Dener          } else {
937a31a1SAlp Dener            *stepType = BNK_BFGS;
c14b763aSAlp Dener          }
c14b763aSAlp Dener        }
c14b763aSAlp Dener      }
c14b763aSAlp Dener      break;
c14b763aSAlp Dener
c14b763aSAlp Dener    case BNK_BFGS:
c14b763aSAlp Dener      /* Can only enter if pc_type == BNK_PC_BFGS
c14b763aSAlp Dener         Failed to obtain acceptable iterate with BFGS step
c14b763aSAlp Dener         Attempt to use the scaled gradient direction */
9566063dSJacob Faibussowitsch      PetscCall(MatLMVMReset(bnk->M, PETSC_FALSE));
9566063dSJacob Faibussowitsch      PetscCall(MatLMVMUpdate(bnk->M, tao->solution, bnk->unprojected_gradient));
9566063dSJacob Faibussowitsch      PetscCall(MatSolve(bnk->M, bnk->unprojected_gradient, tao->stepdirection));
c14b763aSAlp Dener
c14b763aSAlp Dener      bfgsUpdates = 1;
937a31a1SAlp Dener      *stepType   = BNK_SCALED_GRADIENT;
c14b763aSAlp Dener      break;
c14b763aSAlp Dener    }
8d5ead36SAlp Dener    /* Make sure the safeguarded fall-back step is zero for actively bounded variables */
9566063dSJacob Faibussowitsch    PetscCall(VecScale(tao->stepdirection, -1.0));
9566063dSJacob Faibussowitsch    PetscCall(TaoBNKBoundStep(tao, bnk->as_type, tao->stepdirection));
c14b763aSAlp Dener
8d5ead36SAlp Dener    /* Perform one last line search with the fall-back step */
9566063dSJacob Faibussowitsch    PetscCall(TaoLineSearchApply(tao->linesearch, tao->solution, &bnk->f, bnk->unprojected_gradient, tao->stepdirection, steplen, &ls_reason));
9566063dSJacob Faibussowitsch    PetscCall(TaoAddLineSearchCounts(tao));
c14b763aSAlp Dener  }
c14b763aSAlp Dener  *reason = ls_reason;
c14b763aSAlp Dener  PetscFunctionReturn(0);
c14b763aSAlp Dener}
c14b763aSAlp Dener
df278d8fSAlp Dener/*------------------------------------------------------------*/
df278d8fSAlp Dener
df278d8fSAlp Dener/* Routine for updating the trust radius.
df278d8fSAlp Dener
df278d8fSAlp Dener  Function features three different update methods:
df278d8fSAlp Dener  1) Line-search step length based
df278d8fSAlp Dener  2) Predicted decrease on the CG quadratic model
df278d8fSAlp Dener  3) Interpolation
df278d8fSAlp Dener*/
df278d8fSAlp Dener
9371c9d4SSatish BalayPetscErrorCode TaoBNKUpdateTrustRadius(Tao tao, PetscReal prered, PetscReal actred, PetscInt updateType, PetscInt stepType, PetscBool *accept) {
080d2917SAlp Dener  TAO_BNK *bnk = (TAO_BNK *)tao->data;
080d2917SAlp Dener
b1c2d0e3SAlp Dener  PetscReal step, kappa;
080d2917SAlp Dener  PetscReal gdx, tau_1, tau_2, tau_min, tau_max;
080d2917SAlp Dener
080d2917SAlp Dener  PetscFunctionBegin;
080d2917SAlp Dener  /* Update trust region radius */
080d2917SAlp Dener  *accept = PETSC_FALSE;
28017e9fSAlp Dener  switch (updateType) {
080d2917SAlp Dener  case BNK_UPDATE_STEP:
c14b763aSAlp Dener    *accept = PETSC_TRUE; /* always accept here because line search succeeded */
080d2917SAlp Dener    if (stepType == BNK_NEWTON) {
9566063dSJacob Faibussowitsch      PetscCall(TaoLineSearchGetStepLength(tao->linesearch, &step));
080d2917SAlp Dener      if (step < bnk->nu1) {
080d2917SAlp Dener        /* Very bad step taken; reduce radius */
080d2917SAlp Dener        tao->trust = bnk->omega1 * PetscMin(bnk->dnorm, tao->trust);
080d2917SAlp Dener      } else if (step < bnk->nu2) {
080d2917SAlp Dener        /* Reasonably bad step taken; reduce radius */
080d2917SAlp Dener        tao->trust = bnk->omega2 * PetscMin(bnk->dnorm, tao->trust);
080d2917SAlp Dener      } else if (step < bnk->nu3) {
080d2917SAlp Dener        /*  Reasonable step was taken; leave radius alone */
080d2917SAlp Dener        if (bnk->omega3 < 1.0) {
080d2917SAlp Dener          tao->trust = bnk->omega3 * PetscMin(bnk->dnorm, tao->trust);
080d2917SAlp Dener        } else if (bnk->omega3 > 1.0) {
080d2917SAlp Dener          tao->trust = PetscMax(bnk->omega3 * bnk->dnorm, tao->trust);
080d2917SAlp Dener        }
080d2917SAlp Dener      } else if (step < bnk->nu4) {
080d2917SAlp Dener        /*  Full step taken; increase the radius */
080d2917SAlp Dener        tao->trust = PetscMax(bnk->omega4 * bnk->dnorm, tao->trust);
080d2917SAlp Dener      } else {
080d2917SAlp Dener        /*  More than full step taken; increase the radius */
080d2917SAlp Dener        tao->trust = PetscMax(bnk->omega5 * bnk->dnorm, tao->trust);
080d2917SAlp Dener      }
080d2917SAlp Dener    } else {
080d2917SAlp Dener      /*  Newton step was not good; reduce the radius */
080d2917SAlp Dener      tao->trust = bnk->omega1 * PetscMin(bnk->dnorm, tao->trust);
080d2917SAlp Dener    }
080d2917SAlp Dener    break;
080d2917SAlp Dener
080d2917SAlp Dener  case BNK_UPDATE_REDUCTION:
080d2917SAlp Dener    if (stepType == BNK_NEWTON) {
e0ed867bSAlp Dener      if ((prered < 0.0) || PetscIsInfOrNanReal(prered)) {
fed79b8eSAlp Dener        /* The predicted reduction has the wrong sign.  This cannot
fed79b8eSAlp Dener           happen in infinite precision arithmetic.  Step should
fed79b8eSAlp Dener           be rejected! */
080d2917SAlp Dener        tao->trust = bnk->alpha1 * PetscMin(tao->trust, bnk->dnorm);
3105154fSTodd Munson      } else {
b1c2d0e3SAlp Dener        if (PetscIsInfOrNanReal(actred)) {
080d2917SAlp Dener          tao->trust = bnk->alpha1 * PetscMin(tao->trust, bnk->dnorm);
080d2917SAlp Dener        } else {
3105154fSTodd Munson          if ((PetscAbsScalar(actred) <= PetscMax(1.0, PetscAbsScalar(bnk->f)) * bnk->epsilon) && (PetscAbsScalar(prered) <= PetscMax(1.0, PetscAbsScalar(bnk->f)) * bnk->epsilon)) {
080d2917SAlp Dener            kappa = 1.0;
3105154fSTodd Munson          } else {
080d2917SAlp Dener            kappa = actred / prered;
080d2917SAlp Dener          }
fed79b8eSAlp Dener          /* Accept or reject the step and update radius */
080d2917SAlp Dener          if (kappa < bnk->eta1) {
fed79b8eSAlp Dener            /* Reject the step */
080d2917SAlp Dener            tao->trust = bnk->alpha1 * PetscMin(tao->trust, bnk->dnorm);
3105154fSTodd Munson          } else {
fed79b8eSAlp Dener            /* Accept the step */
c133c014SAlp Dener            *accept = PETSC_TRUE;
c133c014SAlp Dener            /* Update the trust region radius only if the computed step is at the trust radius boundary */
8d5ead36SAlp Dener            if (bnk->dnorm == tao->trust) {
080d2917SAlp Dener              if (kappa < bnk->eta2) {
080d2917SAlp Dener                /* Marginal bad step */
c133c014SAlp Dener                tao->trust = bnk->alpha2 * tao->trust;
3105154fSTodd Munson              } else if (kappa < bnk->eta3) {
fed79b8eSAlp Dener                /* Reasonable step */
fed79b8eSAlp Dener                tao->trust = bnk->alpha3 * tao->trust;
3105154fSTodd Munson              } else if (kappa < bnk->eta4) {
080d2917SAlp Dener                /* Good step */
c133c014SAlp Dener                tao->trust = bnk->alpha4 * tao->trust;
3105154fSTodd Munson              } else {
080d2917SAlp Dener                /* Very good step */
c133c014SAlp Dener                tao->trust = bnk->alpha5 * tao->trust;
080d2917SAlp Dener              }
c133c014SAlp Dener            }
080d2917SAlp Dener          }
080d2917SAlp Dener        }
080d2917SAlp Dener      }
080d2917SAlp Dener    } else {
080d2917SAlp Dener      /*  Newton step was not good; reduce the radius */
080d2917SAlp Dener      tao->trust = bnk->alpha1 * PetscMin(bnk->dnorm, tao->trust);
080d2917SAlp Dener    }
080d2917SAlp Dener    break;
080d2917SAlp Dener
080d2917SAlp Dener  default:
080d2917SAlp Dener    if (stepType == BNK_NEWTON) {
b1c2d0e3SAlp Dener      if (prered < 0.0) {
080d2917SAlp Dener        /*  The predicted reduction has the wrong sign.  This cannot */
080d2917SAlp Dener        /*  happen in infinite precision arithmetic.  Step should */
080d2917SAlp Dener        /*  be rejected! */
080d2917SAlp Dener        tao->trust = bnk->gamma1 * PetscMin(tao->trust, bnk->dnorm);
080d2917SAlp Dener      } else {
b1c2d0e3SAlp Dener        if (PetscIsInfOrNanReal(actred)) {
080d2917SAlp Dener          tao->trust = bnk->gamma1 * PetscMin(tao->trust, bnk->dnorm);
080d2917SAlp Dener        } else {
080d2917SAlp Dener          if ((PetscAbsScalar(actred) <= bnk->epsilon) && (PetscAbsScalar(prered) <= bnk->epsilon)) {
080d2917SAlp Dener            kappa = 1.0;
080d2917SAlp Dener          } else {
080d2917SAlp Dener            kappa = actred / prered;
080d2917SAlp Dener          }
080d2917SAlp Dener
9566063dSJacob Faibussowitsch          PetscCall(VecDot(tao->gradient, tao->stepdirection, &gdx));
080d2917SAlp Dener          tau_1   = bnk->theta * gdx / (bnk->theta * gdx - (1.0 - bnk->theta) * prered + actred);
080d2917SAlp Dener          tau_2   = bnk->theta * gdx / (bnk->theta * gdx + (1.0 + bnk->theta) * prered - actred);
080d2917SAlp Dener          tau_min = PetscMin(tau_1, tau_2);
080d2917SAlp Dener          tau_max = PetscMax(tau_1, tau_2);
080d2917SAlp Dener
080d2917SAlp Dener          if (kappa >= 1.0 - bnk->mu1) {
080d2917SAlp Dener            /*  Great agreement */
080d2917SAlp Dener            *accept = PETSC_TRUE;
080d2917SAlp Dener            if (tau_max < 1.0) {
080d2917SAlp Dener              tao->trust = PetscMax(tao->trust, bnk->gamma3 * bnk->dnorm);
080d2917SAlp Dener            } else if (tau_max > bnk->gamma4) {
080d2917SAlp Dener              tao->trust = PetscMax(tao->trust, bnk->gamma4 * bnk->dnorm);
080d2917SAlp Dener            } else {
080d2917SAlp Dener              tao->trust = PetscMax(tao->trust, tau_max * bnk->dnorm);
080d2917SAlp Dener            }
080d2917SAlp Dener          } else if (kappa >= 1.0 - bnk->mu2) {
080d2917SAlp Dener            /*  Good agreement */
080d2917SAlp Dener            *accept = PETSC_TRUE;
080d2917SAlp Dener            if (tau_max < bnk->gamma2) {
080d2917SAlp Dener              tao->trust = bnk->gamma2 * PetscMin(tao->trust, bnk->dnorm);
080d2917SAlp Dener            } else if (tau_max > bnk->gamma3) {
080d2917SAlp Dener              tao->trust = PetscMax(tao->trust, bnk->gamma3 * bnk->dnorm);
080d2917SAlp Dener            } else if (tau_max < 1.0) {
080d2917SAlp Dener              tao->trust = tau_max * PetscMin(tao->trust, bnk->dnorm);
080d2917SAlp Dener            } else {
080d2917SAlp Dener              tao->trust = PetscMax(tao->trust, tau_max * bnk->dnorm);
080d2917SAlp Dener            }
080d2917SAlp Dener          } else {
080d2917SAlp Dener            /*  Not good agreement */
080d2917SAlp Dener            if (tau_min > 1.0) {
080d2917SAlp Dener              tao->trust = bnk->gamma2 * PetscMin(tao->trust, bnk->dnorm);
080d2917SAlp Dener            } else if (tau_max < bnk->gamma1) {
080d2917SAlp Dener              tao->trust = bnk->gamma1 * PetscMin(tao->trust, bnk->dnorm);
080d2917SAlp Dener            } else if ((tau_min < bnk->gamma1) && (tau_max >= 1.0)) {
080d2917SAlp Dener              tao->trust = bnk->gamma1 * PetscMin(tao->trust, bnk->dnorm);
080d2917SAlp Dener            } else if ((tau_1 >= bnk->gamma1) && (tau_1 < 1.0) && ((tau_2 < bnk->gamma1) || (tau_2 >= 1.0))) {
080d2917SAlp Dener              tao->trust = tau_1 * PetscMin(tao->trust, bnk->dnorm);
080d2917SAlp Dener            } else if ((tau_2 >= bnk->gamma1) && (tau_2 < 1.0) && ((tau_1 < bnk->gamma1) || (tau_2 >= 1.0))) {
080d2917SAlp Dener              tao->trust = tau_2 * PetscMin(tao->trust, bnk->dnorm);
080d2917SAlp Dener            } else {
080d2917SAlp Dener              tao->trust = tau_max * PetscMin(tao->trust, bnk->dnorm);
080d2917SAlp Dener            }
080d2917SAlp Dener          }
080d2917SAlp Dener        }
080d2917SAlp Dener      }
080d2917SAlp Dener    } else {
080d2917SAlp Dener      /*  Newton step was not good; reduce the radius */
080d2917SAlp Dener      tao->trust = bnk->gamma1 * PetscMin(bnk->dnorm, tao->trust);
080d2917SAlp Dener    }
28017e9fSAlp Dener    break;
080d2917SAlp Dener  }
c133c014SAlp Dener  /* Make sure the radius does not violate min and max settings */
c133c014SAlp Dener  tao->trust = PetscMin(tao->trust, bnk->max_radius);
fed79b8eSAlp Dener  tao->trust = PetscMax(tao->trust, bnk->min_radius);
080d2917SAlp Dener  PetscFunctionReturn(0);
080d2917SAlp Dener}
080d2917SAlp Dener
eb910715SAlp Dener/* ---------------------------------------------------------- */
df278d8fSAlp Dener
9371c9d4SSatish BalayPetscErrorCode TaoBNKAddStepCounts(Tao tao, PetscInt stepType) {
62675beeSAlp Dener  TAO_BNK *bnk = (TAO_BNK *)tao->data;
62675beeSAlp Dener
62675beeSAlp Dener  PetscFunctionBegin;
62675beeSAlp Dener  switch (stepType) {
9371c9d4SSatish Balay  case BNK_NEWTON: ++bnk->newt; break;
9371c9d4SSatish Balay  case BNK_BFGS: ++bnk->bfgs; break;
9371c9d4SSatish Balay  case BNK_SCALED_GRADIENT: ++bnk->sgrad; break;
9371c9d4SSatish Balay  case BNK_GRADIENT: ++bnk->grad; break;
9371c9d4SSatish Balay  default: break;
62675beeSAlp Dener  }
62675beeSAlp Dener  PetscFunctionReturn(0);
62675beeSAlp Dener}
62675beeSAlp Dener
62675beeSAlp Dener/* ---------------------------------------------------------- */
62675beeSAlp Dener
9371c9d4SSatish BalayPetscErrorCode TaoSetUp_BNK(Tao tao) {
eb910715SAlp Dener  TAO_BNK *bnk = (TAO_BNK *)tao->data;
e031d6f5SAlp Dener  PetscInt i;
eb910715SAlp Dener
eb910715SAlp Dener  PetscFunctionBegin;
48a46eb9SPierre Jolivet  if (!tao->gradient) PetscCall(VecDuplicate(tao->solution, &tao->gradient));
48a46eb9SPierre Jolivet  if (!tao->stepdirection) PetscCall(VecDuplicate(tao->solution, &tao->stepdirection));
48a46eb9SPierre Jolivet  if (!bnk->W) PetscCall(VecDuplicate(tao->solution, &bnk->W));
48a46eb9SPierre Jolivet  if (!bnk->Xold) PetscCall(VecDuplicate(tao->solution, &bnk->Xold));
48a46eb9SPierre Jolivet  if (!bnk->Gold) PetscCall(VecDuplicate(tao->solution, &bnk->Gold));
48a46eb9SPierre Jolivet  if (!bnk->Xwork) PetscCall(VecDuplicate(tao->solution, &bnk->Xwork));
48a46eb9SPierre Jolivet  if (!bnk->Gwork) PetscCall(VecDuplicate(tao->solution, &bnk->Gwork));
48a46eb9SPierre Jolivet  if (!bnk->unprojected_gradient) PetscCall(VecDuplicate(tao->solution, &bnk->unprojected_gradient));
48a46eb9SPierre Jolivet  if (!bnk->unprojected_gradient_old) PetscCall(VecDuplicate(tao->solution, &bnk->unprojected_gradient_old));
48a46eb9SPierre Jolivet  if (!bnk->Diag_min) PetscCall(VecDuplicate(tao->solution, &bnk->Diag_min));
48a46eb9SPierre Jolivet  if (!bnk->Diag_max) PetscCall(VecDuplicate(tao->solution, &bnk->Diag_max));
e031d6f5SAlp Dener  if (bnk->max_cg_its > 0) {
c4b75bccSAlp Dener    /* Ensure that the important common vectors are shared between BNK and embedded BNCG */
c4b75bccSAlp Dener    bnk->bncg_ctx = (TAO_BNCG *)bnk->bncg->data;
9566063dSJacob Faibussowitsch    PetscCall(PetscObjectReference((PetscObject)(bnk->unprojected_gradient_old)));
9566063dSJacob Faibussowitsch    PetscCall(VecDestroy(&bnk->bncg_ctx->unprojected_gradient_old));
89da521bSAlp Dener    bnk->bncg_ctx->unprojected_gradient_old = bnk->unprojected_gradient_old;
9566063dSJacob Faibussowitsch    PetscCall(PetscObjectReference((PetscObject)(bnk->unprojected_gradient)));
9566063dSJacob Faibussowitsch    PetscCall(VecDestroy(&bnk->bncg_ctx->unprojected_gradient));
c4b75bccSAlp Dener    bnk->bncg_ctx->unprojected_gradient = bnk->unprojected_gradient;
9566063dSJacob Faibussowitsch    PetscCall(PetscObjectReference((PetscObject)(bnk->Gold)));
9566063dSJacob Faibussowitsch    PetscCall(VecDestroy(&bnk->bncg_ctx->G_old));
c4b75bccSAlp Dener    bnk->bncg_ctx->G_old = bnk->Gold;
9566063dSJacob Faibussowitsch    PetscCall(PetscObjectReference((PetscObject)(tao->gradient)));
9566063dSJacob Faibussowitsch    PetscCall(VecDestroy(&bnk->bncg->gradient));
c4b75bccSAlp Dener    bnk->bncg->gradient = tao->gradient;
9566063dSJacob Faibussowitsch    PetscCall(PetscObjectReference((PetscObject)(tao->stepdirection)));
9566063dSJacob Faibussowitsch    PetscCall(VecDestroy(&bnk->bncg->stepdirection));
c4b75bccSAlp Dener    bnk->bncg->stepdirection = tao->stepdirection;
9566063dSJacob Faibussowitsch    PetscCall(TaoSetSolution(bnk->bncg, tao->solution));
c4b75bccSAlp Dener    /* Copy over some settings from BNK into BNCG */
9566063dSJacob Faibussowitsch    PetscCall(TaoSetMaximumIterations(bnk->bncg, bnk->max_cg_its));
9566063dSJacob Faibussowitsch    PetscCall(TaoSetTolerances(bnk->bncg, tao->gatol, tao->grtol, tao->gttol));
9566063dSJacob Faibussowitsch    PetscCall(TaoSetFunctionLowerBound(bnk->bncg, tao->fmin));
9566063dSJacob Faibussowitsch    PetscCall(TaoSetConvergenceTest(bnk->bncg, tao->ops->convergencetest, tao->cnvP));
9566063dSJacob Faibussowitsch    PetscCall(TaoSetObjective(bnk->bncg, tao->ops->computeobjective, tao->user_objP));
9566063dSJacob Faibussowitsch    PetscCall(TaoSetGradient(bnk->bncg, NULL, tao->ops->computegradient, tao->user_gradP));
9566063dSJacob Faibussowitsch    PetscCall(TaoSetObjectiveAndGradient(bnk->bncg, NULL, tao->ops->computeobjectiveandgradient, tao->user_objgradP));
9566063dSJacob Faibussowitsch    PetscCall(PetscObjectCopyFortranFunctionPointers((PetscObject)tao, (PetscObject)(bnk->bncg)));
c4b75bccSAlp Dener    for (i = 0; i < tao->numbermonitors; ++i) {
9566063dSJacob Faibussowitsch      PetscCall(TaoSetMonitor(bnk->bncg, tao->monitor[i], tao->monitorcontext[i], tao->monitordestroy[i]));
9566063dSJacob Faibussowitsch      PetscCall(PetscObjectReference((PetscObject)(tao->monitorcontext[i])));
e031d6f5SAlp Dener    }
e031d6f5SAlp Dener  }
83c8fe1dSLisandro Dalcin  bnk->X_inactive    = NULL;
83c8fe1dSLisandro Dalcin  bnk->G_inactive    = NULL;
83c8fe1dSLisandro Dalcin  bnk->inactive_work = NULL;
83c8fe1dSLisandro Dalcin  bnk->active_work   = NULL;
83c8fe1dSLisandro Dalcin  bnk->inactive_idx  = NULL;
83c8fe1dSLisandro Dalcin  bnk->active_idx    = NULL;
83c8fe1dSLisandro Dalcin  bnk->active_lower  = NULL;
83c8fe1dSLisandro Dalcin  bnk->active_upper  = NULL;
83c8fe1dSLisandro Dalcin  bnk->active_fixed  = NULL;
83c8fe1dSLisandro Dalcin  bnk->M             = NULL;
83c8fe1dSLisandro Dalcin  bnk->H_inactive    = NULL;
83c8fe1dSLisandro Dalcin  bnk->Hpre_inactive = NULL;
eb910715SAlp Dener  PetscFunctionReturn(0);
eb910715SAlp Dener}
eb910715SAlp Dener
eb910715SAlp Dener/*------------------------------------------------------------*/
df278d8fSAlp Dener
9371c9d4SSatish BalayPetscErrorCode TaoDestroy_BNK(Tao tao) {
eb910715SAlp Dener  TAO_BNK *bnk = (TAO_BNK *)tao->data;
eb910715SAlp Dener
eb910715SAlp Dener  PetscFunctionBegin;
9566063dSJacob Faibussowitsch  PetscCall(VecDestroy(&bnk->W));
9566063dSJacob Faibussowitsch  PetscCall(VecDestroy(&bnk->Xold));
9566063dSJacob Faibussowitsch  PetscCall(VecDestroy(&bnk->Gold));
9566063dSJacob Faibussowitsch  PetscCall(VecDestroy(&bnk->Xwork));
9566063dSJacob Faibussowitsch  PetscCall(VecDestroy(&bnk->Gwork));
9566063dSJacob Faibussowitsch  PetscCall(VecDestroy(&bnk->unprojected_gradient));
9566063dSJacob Faibussowitsch  PetscCall(VecDestroy(&bnk->unprojected_gradient_old));
9566063dSJacob Faibussowitsch  PetscCall(VecDestroy(&bnk->Diag_min));
9566063dSJacob Faibussowitsch  PetscCall(VecDestroy(&bnk->Diag_max));
9566063dSJacob Faibussowitsch  PetscCall(ISDestroy(&bnk->active_lower));
9566063dSJacob Faibussowitsch  PetscCall(ISDestroy(&bnk->active_upper));
9566063dSJacob Faibussowitsch  PetscCall(ISDestroy(&bnk->active_fixed));
9566063dSJacob Faibussowitsch  PetscCall(ISDestroy(&bnk->active_idx));
9566063dSJacob Faibussowitsch  PetscCall(ISDestroy(&bnk->inactive_idx));
9566063dSJacob Faibussowitsch  PetscCall(MatDestroy(&bnk->Hpre_inactive));
9566063dSJacob Faibussowitsch  PetscCall(MatDestroy(&bnk->H_inactive));
9566063dSJacob Faibussowitsch  PetscCall(TaoDestroy(&bnk->bncg));
a958fbfcSStefano Zampini  PetscCall(KSPDestroy(&tao->ksp));
9566063dSJacob Faibussowitsch  PetscCall(PetscFree(tao->data));
eb910715SAlp Dener  PetscFunctionReturn(0);
eb910715SAlp Dener}
eb910715SAlp Dener
eb910715SAlp Dener/*------------------------------------------------------------*/
df278d8fSAlp Dener
9371c9d4SSatish BalayPetscErrorCode TaoSetFromOptions_BNK(Tao tao, PetscOptionItems *PetscOptionsObject) {
eb910715SAlp Dener  TAO_BNK *bnk = (TAO_BNK *)tao->data;
eb910715SAlp Dener
eb910715SAlp Dener  PetscFunctionBegin;
d0609cedSBarry Smith  PetscOptionsHeadBegin(PetscOptionsObject, "Newton-Krylov method for bound constrained optimization");
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsEList("-tao_bnk_init_type", "radius initialization type", "", BNK_INIT, BNK_INIT_TYPES, BNK_INIT[bnk->init_type], &bnk->init_type, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsEList("-tao_bnk_update_type", "radius update type", "", BNK_UPDATE, BNK_UPDATE_TYPES, BNK_UPDATE[bnk->update_type], &bnk->update_type, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsEList("-tao_bnk_as_type", "active set estimation method", "", BNK_AS, BNK_AS_TYPES, BNK_AS[bnk->as_type], &bnk->as_type, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_sval", "(developer) Hessian perturbation starting value", "", bnk->sval, &bnk->sval, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_imin", "(developer) minimum initial Hessian perturbation", "", bnk->imin, &bnk->imin, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_imax", "(developer) maximum initial Hessian perturbation", "", bnk->imax, &bnk->imax, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_imfac", "(developer) initial merit factor for Hessian perturbation", "", bnk->imfac, &bnk->imfac, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_pmin", "(developer) minimum Hessian perturbation", "", bnk->pmin, &bnk->pmin, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_pmax", "(developer) maximum Hessian perturbation", "", bnk->pmax, &bnk->pmax, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_pgfac", "(developer) Hessian perturbation growth factor", "", bnk->pgfac, &bnk->pgfac, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_psfac", "(developer) Hessian perturbation shrink factor", "", bnk->psfac, &bnk->psfac, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_pmgfac", "(developer) merit growth factor for Hessian perturbation", "", bnk->pmgfac, &bnk->pmgfac, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_pmsfac", "(developer) merit shrink factor for Hessian perturbation", "", bnk->pmsfac, &bnk->pmsfac, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_eta1", "(developer) threshold for rejecting step (-tao_bnk_update_type reduction)", "", bnk->eta1, &bnk->eta1, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_eta2", "(developer) threshold for accepting marginal step (-tao_bnk_update_type reduction)", "", bnk->eta2, &bnk->eta2, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_eta3", "(developer) threshold for accepting reasonable step (-tao_bnk_update_type reduction)", "", bnk->eta3, &bnk->eta3, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_eta4", "(developer) threshold for accepting good step (-tao_bnk_update_type reduction)", "", bnk->eta4, &bnk->eta4, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_alpha1", "(developer) radius reduction factor for rejected step (-tao_bnk_update_type reduction)", "", bnk->alpha1, &bnk->alpha1, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_alpha2", "(developer) radius reduction factor for marginally accepted bad step (-tao_bnk_update_type reduction)", "", bnk->alpha2, &bnk->alpha2, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_alpha3", "(developer) radius increase factor for reasonable accepted step (-tao_bnk_update_type reduction)", "", bnk->alpha3, &bnk->alpha3, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_alpha4", "(developer) radius increase factor for good accepted step (-tao_bnk_update_type reduction)", "", bnk->alpha4, &bnk->alpha4, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_alpha5", "(developer) radius increase factor for very good accepted step (-tao_bnk_update_type reduction)", "", bnk->alpha5, &bnk->alpha5, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_nu1", "(developer) threshold for small line-search step length (-tao_bnk_update_type step)", "", bnk->nu1, &bnk->nu1, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_nu2", "(developer) threshold for reasonable line-search step length (-tao_bnk_update_type step)", "", bnk->nu2, &bnk->nu2, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_nu3", "(developer) threshold for large line-search step length (-tao_bnk_update_type step)", "", bnk->nu3, &bnk->nu3, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_nu4", "(developer) threshold for very large line-search step length (-tao_bnk_update_type step)", "", bnk->nu4, &bnk->nu4, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_omega1", "(developer) radius reduction factor for very small line-search step length (-tao_bnk_update_type step)", "", bnk->omega1, &bnk->omega1, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_omega2", "(developer) radius reduction factor for small line-search step length (-tao_bnk_update_type step)", "", bnk->omega2, &bnk->omega2, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_omega3", "(developer) radius factor for decent line-search step length (-tao_bnk_update_type step)", "", bnk->omega3, &bnk->omega3, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_omega4", "(developer) radius increase factor for large line-search step length (-tao_bnk_update_type step)", "", bnk->omega4, &bnk->omega4, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_omega5", "(developer) radius increase factor for very large line-search step length (-tao_bnk_update_type step)", "", bnk->omega5, &bnk->omega5, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_mu1_i", "(developer) threshold for accepting very good step (-tao_bnk_init_type interpolation)", "", bnk->mu1_i, &bnk->mu1_i, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_mu2_i", "(developer) threshold for accepting good step (-tao_bnk_init_type interpolation)", "", bnk->mu2_i, &bnk->mu2_i, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_gamma1_i", "(developer) radius reduction factor for rejected very bad step (-tao_bnk_init_type interpolation)", "", bnk->gamma1_i, &bnk->gamma1_i, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_gamma2_i", "(developer) radius reduction factor for rejected bad step (-tao_bnk_init_type interpolation)", "", bnk->gamma2_i, &bnk->gamma2_i, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_gamma3_i", "(developer) radius increase factor for accepted good step (-tao_bnk_init_type interpolation)", "", bnk->gamma3_i, &bnk->gamma3_i, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_gamma4_i", "(developer) radius increase factor for accepted very good step (-tao_bnk_init_type interpolation)", "", bnk->gamma4_i, &bnk->gamma4_i, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_theta_i", "(developer) trust region interpolation factor (-tao_bnk_init_type interpolation)", "", bnk->theta_i, &bnk->theta_i, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_mu1", "(developer) threshold for accepting very good step (-tao_bnk_update_type interpolation)", "", bnk->mu1, &bnk->mu1, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_mu2", "(developer) threshold for accepting good step (-tao_bnk_update_type interpolation)", "", bnk->mu2, &bnk->mu2, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_gamma1", "(developer) radius reduction factor for rejected very bad step (-tao_bnk_update_type interpolation)", "", bnk->gamma1, &bnk->gamma1, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_gamma2", "(developer) radius reduction factor for rejected bad step (-tao_bnk_update_type interpolation)", "", bnk->gamma2, &bnk->gamma2, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_gamma3", "(developer) radius increase factor for accepted good step (-tao_bnk_update_type interpolation)", "", bnk->gamma3, &bnk->gamma3, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_gamma4", "(developer) radius increase factor for accepted very good step (-tao_bnk_update_type interpolation)", "", bnk->gamma4, &bnk->gamma4, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_theta", "(developer) trust region interpolation factor (-tao_bnk_update_type interpolation)", "", bnk->theta, &bnk->theta, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_min_radius", "(developer) lower bound on initial radius", "", bnk->min_radius, &bnk->min_radius, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_max_radius", "(developer) upper bound on radius", "", bnk->max_radius, &bnk->max_radius, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_epsilon", "(developer) tolerance used when computing actual and predicted reduction", "", bnk->epsilon, &bnk->epsilon, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_as_tol", "(developer) initial tolerance used when estimating actively bounded variables", "", bnk->as_tol, &bnk->as_tol, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bnk_as_step", "(developer) step length used when estimating actively bounded variables", "", bnk->as_step, &bnk->as_step, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsInt("-tao_bnk_max_cg_its", "number of BNCG iterations to take for each Newton step", "", bnk->max_cg_its, &bnk->max_cg_its, NULL));
d0609cedSBarry Smith  PetscOptionsHeadEnd();
8ebe3e4eSStefano Zampini
9566063dSJacob Faibussowitsch  PetscCall(TaoSetOptionsPrefix(bnk->bncg, ((PetscObject)(tao))->prefix));
9566063dSJacob Faibussowitsch  PetscCall(TaoAppendOptionsPrefix(bnk->bncg, "tao_bnk_cg_"));
9566063dSJacob Faibussowitsch  PetscCall(TaoSetFromOptions(bnk->bncg));
8ebe3e4eSStefano Zampini
9566063dSJacob Faibussowitsch  PetscCall(KSPSetOptionsPrefix(tao->ksp, ((PetscObject)(tao))->prefix));
9566063dSJacob Faibussowitsch  PetscCall(KSPAppendOptionsPrefix(tao->ksp, "tao_bnk_"));
9566063dSJacob Faibussowitsch  PetscCall(KSPSetFromOptions(tao->ksp));
eb910715SAlp Dener  PetscFunctionReturn(0);
eb910715SAlp Dener}
eb910715SAlp Dener
eb910715SAlp Dener/*------------------------------------------------------------*/
df278d8fSAlp Dener
9371c9d4SSatish BalayPetscErrorCode TaoView_BNK(Tao tao, PetscViewer viewer) {
eb910715SAlp Dener  TAO_BNK  *bnk = (TAO_BNK *)tao->data;
eb910715SAlp Dener  PetscInt  nrejects;
eb910715SAlp Dener  PetscBool isascii;
eb910715SAlp Dener
eb910715SAlp Dener  PetscFunctionBegin;
9566063dSJacob Faibussowitsch  PetscCall(PetscObjectTypeCompare((PetscObject)viewer, PETSCVIEWERASCII, &isascii));
eb910715SAlp Dener  if (isascii) {
9566063dSJacob Faibussowitsch    PetscCall(PetscViewerASCIIPushTab(viewer));
b9ac7092SAlp Dener    if (bnk->M) {
9566063dSJacob Faibussowitsch      PetscCall(MatLMVMGetRejectCount(bnk->M, &nrejects));
63a3b9bcSJacob Faibussowitsch      PetscCall(PetscViewerASCIIPrintf(viewer, "Rejected BFGS updates: %" PetscInt_FMT "\n", nrejects));
eb910715SAlp Dener    }
63a3b9bcSJacob Faibussowitsch    PetscCall(PetscViewerASCIIPrintf(viewer, "CG steps: %" PetscInt_FMT "\n", bnk->tot_cg_its));
63a3b9bcSJacob Faibussowitsch    PetscCall(PetscViewerASCIIPrintf(viewer, "Newton steps: %" PetscInt_FMT "\n", bnk->newt));
48a46eb9SPierre Jolivet    if (bnk->M) PetscCall(PetscViewerASCIIPrintf(viewer, "BFGS steps: %" PetscInt_FMT "\n", bnk->bfgs));
63a3b9bcSJacob Faibussowitsch    PetscCall(PetscViewerASCIIPrintf(viewer, "Scaled gradient steps: %" PetscInt_FMT "\n", bnk->sgrad));
63a3b9bcSJacob Faibussowitsch    PetscCall(PetscViewerASCIIPrintf(viewer, "Gradient steps: %" PetscInt_FMT "\n", bnk->grad));
9566063dSJacob Faibussowitsch    PetscCall(PetscViewerASCIIPrintf(viewer, "KSP termination reasons:\n"));
63a3b9bcSJacob Faibussowitsch    PetscCall(PetscViewerASCIIPrintf(viewer, "  atol: %" PetscInt_FMT "\n", bnk->ksp_atol));
63a3b9bcSJacob Faibussowitsch    PetscCall(PetscViewerASCIIPrintf(viewer, "  rtol: %" PetscInt_FMT "\n", bnk->ksp_rtol));
63a3b9bcSJacob Faibussowitsch    PetscCall(PetscViewerASCIIPrintf(viewer, "  ctol: %" PetscInt_FMT "\n", bnk->ksp_ctol));
63a3b9bcSJacob Faibussowitsch    PetscCall(PetscViewerASCIIPrintf(viewer, "  negc: %" PetscInt_FMT "\n", bnk->ksp_negc));
63a3b9bcSJacob Faibussowitsch    PetscCall(PetscViewerASCIIPrintf(viewer, "  dtol: %" PetscInt_FMT "\n", bnk->ksp_dtol));
63a3b9bcSJacob Faibussowitsch    PetscCall(PetscViewerASCIIPrintf(viewer, "  iter: %" PetscInt_FMT "\n", bnk->ksp_iter));
63a3b9bcSJacob Faibussowitsch    PetscCall(PetscViewerASCIIPrintf(viewer, "  othr: %" PetscInt_FMT "\n", bnk->ksp_othr));
9566063dSJacob Faibussowitsch    PetscCall(PetscViewerASCIIPopTab(viewer));
eb910715SAlp Dener  }
eb910715SAlp Dener  PetscFunctionReturn(0);
eb910715SAlp Dener}
eb910715SAlp Dener
eb910715SAlp Dener/* ---------------------------------------------------------- */
df278d8fSAlp Dener
eb910715SAlp Dener/*MC
eb910715SAlp Dener  TAOBNK - Shared base-type for Bounded Newton-Krylov type algorithms.
66ed3702SAlp Dener  At each iteration, the BNK methods solve the symmetric
eb910715SAlp Dener  system of equations to obtain the step diretion dk:
eb910715SAlp Dener              Hk dk = -gk
2b97c8d8SAlp Dener  for free variables only. The step can be globalized either through
2b97c8d8SAlp Dener  trust-region methods, or a line search, or a heuristic mixture of both.
eb910715SAlp Dener
eb910715SAlp Dener    Options Database Keys:
9fa2b5dcSStefano Zampini+ -tao_bnk_max_cg_its - maximum number of bounded conjugate-gradient iterations taken in each Newton loop
9fa2b5dcSStefano Zampini. -tao_bnk_init_type - trust radius initialization method ("constant", "direction", "interpolation")
9fa2b5dcSStefano Zampini. -tao_bnk_update_type - trust radius update method ("step", "direction", "interpolation")
9fa2b5dcSStefano Zampini. -tao_bnk_as_type - active-set estimation method ("none", "bertsekas")
9fa2b5dcSStefano Zampini. -tao_bnk_as_tol - (developer) initial tolerance used in estimating bounded active variables (-as_type bertsekas)
9fa2b5dcSStefano Zampini. -tao_bnk_as_step - (developer) trial step length used in estimating bounded active variables (-as_type bertsekas)
9fa2b5dcSStefano Zampini. -tao_bnk_sval - (developer) Hessian perturbation starting value
9fa2b5dcSStefano Zampini. -tao_bnk_imin - (developer) minimum initial Hessian perturbation
9fa2b5dcSStefano Zampini. -tao_bnk_imax - (developer) maximum initial Hessian perturbation
9fa2b5dcSStefano Zampini. -tao_bnk_pmin - (developer) minimum Hessian perturbation
9fa2b5dcSStefano Zampini. -tao_bnk_pmax - (developer) aximum Hessian perturbation
9fa2b5dcSStefano Zampini. -tao_bnk_pgfac - (developer) Hessian perturbation growth factor
9fa2b5dcSStefano Zampini. -tao_bnk_psfac - (developer) Hessian perturbation shrink factor
9fa2b5dcSStefano Zampini. -tao_bnk_imfac - (developer) initial merit factor for Hessian perturbation
9fa2b5dcSStefano Zampini. -tao_bnk_pmgfac - (developer) merit growth factor for Hessian perturbation
9fa2b5dcSStefano Zampini. -tao_bnk_pmsfac - (developer) merit shrink factor for Hessian perturbation
9fa2b5dcSStefano Zampini. -tao_bnk_eta1 - (developer) threshold for rejecting step (-update_type reduction)
9fa2b5dcSStefano Zampini. -tao_bnk_eta2 - (developer) threshold for accepting marginal step (-update_type reduction)
9fa2b5dcSStefano Zampini. -tao_bnk_eta3 - (developer) threshold for accepting reasonable step (-update_type reduction)
9fa2b5dcSStefano Zampini. -tao_bnk_eta4 - (developer) threshold for accepting good step (-update_type reduction)
9fa2b5dcSStefano Zampini. -tao_bnk_alpha1 - (developer) radius reduction factor for rejected step (-update_type reduction)
9fa2b5dcSStefano Zampini. -tao_bnk_alpha2 - (developer) radius reduction factor for marginally accepted bad step (-update_type reduction)
9fa2b5dcSStefano Zampini. -tao_bnk_alpha3 - (developer) radius increase factor for reasonable accepted step (-update_type reduction)
9fa2b5dcSStefano Zampini. -tao_bnk_alpha4 - (developer) radius increase factor for good accepted step (-update_type reduction)
9fa2b5dcSStefano Zampini. -tao_bnk_alpha5 - (developer) radius increase factor for very good accepted step (-update_type reduction)
9fa2b5dcSStefano Zampini. -tao_bnk_epsilon - (developer) tolerance for small pred/actual ratios that trigger automatic step acceptance (-update_type reduction)
9fa2b5dcSStefano Zampini. -tao_bnk_mu1 - (developer) threshold for accepting very good step (-update_type interpolation)
9fa2b5dcSStefano Zampini. -tao_bnk_mu2 - (developer) threshold for accepting good step (-update_type interpolation)
9fa2b5dcSStefano Zampini. -tao_bnk_gamma1 - (developer) radius reduction factor for rejected very bad step (-update_type interpolation)
9fa2b5dcSStefano Zampini. -tao_bnk_gamma2 - (developer) radius reduction factor for rejected bad step (-update_type interpolation)
9fa2b5dcSStefano Zampini. -tao_bnk_gamma3 - (developer) radius increase factor for accepted good step (-update_type interpolation)
9fa2b5dcSStefano Zampini. -tao_bnk_gamma4 - (developer) radius increase factor for accepted very good step (-update_type interpolation)
9fa2b5dcSStefano Zampini. -tao_bnk_theta - (developer) trust region interpolation factor (-update_type interpolation)
9fa2b5dcSStefano Zampini. -tao_bnk_nu1 - (developer) threshold for small line-search step length (-update_type step)
9fa2b5dcSStefano Zampini. -tao_bnk_nu2 - (developer) threshold for reasonable line-search step length (-update_type step)
9fa2b5dcSStefano Zampini. -tao_bnk_nu3 - (developer) threshold for large line-search step length (-update_type step)
9fa2b5dcSStefano Zampini. -tao_bnk_nu4 - (developer) threshold for very large line-search step length (-update_type step)
9fa2b5dcSStefano Zampini. -tao_bnk_omega1 - (developer) radius reduction factor for very small line-search step length (-update_type step)
9fa2b5dcSStefano Zampini. -tao_bnk_omega2 - (developer) radius reduction factor for small line-search step length (-update_type step)
9fa2b5dcSStefano Zampini. -tao_bnk_omega3 - (developer) radius factor for decent line-search step length (-update_type step)
9fa2b5dcSStefano Zampini. -tao_bnk_omega4 - (developer) radius increase factor for large line-search step length (-update_type step)
9fa2b5dcSStefano Zampini. -tao_bnk_omega5 - (developer) radius increase factor for very large line-search step length (-update_type step)
9fa2b5dcSStefano Zampini. -tao_bnk_mu1_i -  (developer) threshold for accepting very good step (-init_type interpolation)
9fa2b5dcSStefano Zampini. -tao_bnk_mu2_i -  (developer) threshold for accepting good step (-init_type interpolation)
9fa2b5dcSStefano Zampini. -tao_bnk_gamma1_i - (developer) radius reduction factor for rejected very bad step (-init_type interpolation)
9fa2b5dcSStefano Zampini. -tao_bnk_gamma2_i - (developer) radius reduction factor for rejected bad step (-init_type interpolation)
9fa2b5dcSStefano Zampini. -tao_bnk_gamma3_i - (developer) radius increase factor for accepted good step (-init_type interpolation)
9fa2b5dcSStefano Zampini. -tao_bnk_gamma4_i - (developer) radius increase factor for accepted very good step (-init_type interpolation)
9fa2b5dcSStefano Zampini- -tao_bnk_theta_i - (developer) trust region interpolation factor (-init_type interpolation)
eb910715SAlp Dener
eb910715SAlp Dener  Level: beginner
eb910715SAlp DenerM*/
eb910715SAlp Dener
9371c9d4SSatish BalayPetscErrorCode TaoCreate_BNK(Tao tao) {
eb910715SAlp Dener  TAO_BNK *bnk;
b9ac7092SAlp Dener  PC       pc;
eb910715SAlp Dener
eb910715SAlp Dener  PetscFunctionBegin;
*4dfa11a4SJacob Faibussowitsch  PetscCall(PetscNew(&bnk));
eb910715SAlp Dener
eb910715SAlp Dener  tao->ops->setup          = TaoSetUp_BNK;
eb910715SAlp Dener  tao->ops->view           = TaoView_BNK;
eb910715SAlp Dener  tao->ops->setfromoptions = TaoSetFromOptions_BNK;
eb910715SAlp Dener  tao->ops->destroy        = TaoDestroy_BNK;
eb910715SAlp Dener
eb910715SAlp Dener  /*  Override default settings (unless already changed) */
eb910715SAlp Dener  if (!tao->max_it_changed) tao->max_it = 50;
eb910715SAlp Dener  if (!tao->trust0_changed) tao->trust0 = 100.0;
eb910715SAlp Dener
eb910715SAlp Dener  tao->data = (void *)bnk;
eb910715SAlp Dener
66ed3702SAlp Dener  /*  Hessian shifting parameters */
e0ed867bSAlp Dener  bnk->computehessian = TaoBNKComputeHessian;
e0ed867bSAlp Dener  bnk->computestep    = TaoBNKComputeStep;
e0ed867bSAlp Dener
eb910715SAlp Dener  bnk->sval  = 0.0;
eb910715SAlp Dener  bnk->imin  = 1.0e-4;
eb910715SAlp Dener  bnk->imax  = 1.0e+2;
eb910715SAlp Dener  bnk->imfac = 1.0e-1;
eb910715SAlp Dener
eb910715SAlp Dener  bnk->pmin   = 1.0e-12;
eb910715SAlp Dener  bnk->pmax   = 1.0e+2;
eb910715SAlp Dener  bnk->pgfac  = 1.0e+1;
eb910715SAlp Dener  bnk->psfac  = 4.0e-1;
eb910715SAlp Dener  bnk->pmgfac = 1.0e-1;
eb910715SAlp Dener  bnk->pmsfac = 1.0e-1;
eb910715SAlp Dener
eb910715SAlp Dener  /*  Default values for trust-region radius update based on steplength */
eb910715SAlp Dener  bnk->nu1 = 0.25;
eb910715SAlp Dener  bnk->nu2 = 0.50;
eb910715SAlp Dener  bnk->nu3 = 1.00;
eb910715SAlp Dener  bnk->nu4 = 1.25;
eb910715SAlp Dener
eb910715SAlp Dener  bnk->omega1 = 0.25;
eb910715SAlp Dener  bnk->omega2 = 0.50;
eb910715SAlp Dener  bnk->omega3 = 1.00;
eb910715SAlp Dener  bnk->omega4 = 2.00;
eb910715SAlp Dener  bnk->omega5 = 4.00;
eb910715SAlp Dener
eb910715SAlp Dener  /*  Default values for trust-region radius update based on reduction */
eb910715SAlp Dener  bnk->eta1 = 1.0e-4;
eb910715SAlp Dener  bnk->eta2 = 0.25;
eb910715SAlp Dener  bnk->eta3 = 0.50;
eb910715SAlp Dener  bnk->eta4 = 0.90;
eb910715SAlp Dener
eb910715SAlp Dener  bnk->alpha1 = 0.25;
eb910715SAlp Dener  bnk->alpha2 = 0.50;
eb910715SAlp Dener  bnk->alpha3 = 1.00;
eb910715SAlp Dener  bnk->alpha4 = 2.00;
eb910715SAlp Dener  bnk->alpha5 = 4.00;
eb910715SAlp Dener
eb910715SAlp Dener  /*  Default values for trust-region radius update based on interpolation */
eb910715SAlp Dener  bnk->mu1 = 0.10;
eb910715SAlp Dener  bnk->mu2 = 0.50;
eb910715SAlp Dener
eb910715SAlp Dener  bnk->gamma1 = 0.25;
eb910715SAlp Dener  bnk->gamma2 = 0.50;
eb910715SAlp Dener  bnk->gamma3 = 2.00;
eb910715SAlp Dener  bnk->gamma4 = 4.00;
eb910715SAlp Dener
eb910715SAlp Dener  bnk->theta = 0.05;
eb910715SAlp Dener
eb910715SAlp Dener  /*  Default values for trust region initialization based on interpolation */
eb910715SAlp Dener  bnk->mu1_i = 0.35;
eb910715SAlp Dener  bnk->mu2_i = 0.50;
eb910715SAlp Dener
eb910715SAlp Dener  bnk->gamma1_i = 0.0625;
eb910715SAlp Dener  bnk->gamma2_i = 0.5;
eb910715SAlp Dener  bnk->gamma3_i = 2.0;
eb910715SAlp Dener  bnk->gamma4_i = 5.0;
eb910715SAlp Dener
eb910715SAlp Dener  bnk->theta_i = 0.25;
eb910715SAlp Dener
eb910715SAlp Dener  /*  Remaining parameters */
c0f10754SAlp Dener  bnk->max_cg_its = 0;
eb910715SAlp Dener  bnk->min_radius = 1.0e-10;
eb910715SAlp Dener  bnk->max_radius = 1.0e10;
770b7498SAlp Dener  bnk->epsilon    = PetscPowReal(PETSC_MACHINE_EPSILON, 2.0 / 3.0);
0a4511e9SAlp Dener  bnk->as_tol     = 1.0e-3;
0a4511e9SAlp Dener  bnk->as_step    = 1.0e-3;
62675beeSAlp Dener  bnk->dmin       = 1.0e-6;
62675beeSAlp Dener  bnk->dmax       = 1.0e6;
eb910715SAlp Dener
83c8fe1dSLisandro Dalcin  bnk->M           = NULL;
83c8fe1dSLisandro Dalcin  bnk->bfgs_pre    = NULL;
eb910715SAlp Dener  bnk->init_type   = BNK_INIT_INTERPOLATION;
7b1c7716SAlp Dener  bnk->update_type = BNK_UPDATE_REDUCTION;
2f75a4aaSAlp Dener  bnk->as_type     = BNK_AS_BERTSEKAS;
eb910715SAlp Dener
e031d6f5SAlp Dener  /* Create the embedded BNCG solver */
9566063dSJacob Faibussowitsch  PetscCall(TaoCreate(PetscObjectComm((PetscObject)tao), &bnk->bncg));
9566063dSJacob Faibussowitsch  PetscCall(PetscObjectIncrementTabLevel((PetscObject)bnk->bncg, (PetscObject)tao, 1));
9566063dSJacob Faibussowitsch  PetscCall(TaoSetType(bnk->bncg, TAOBNCG));
e031d6f5SAlp Dener
c0f10754SAlp Dener  /* Create the line search */
9566063dSJacob Faibussowitsch  PetscCall(TaoLineSearchCreate(((PetscObject)tao)->comm, &tao->linesearch));
9566063dSJacob Faibussowitsch  PetscCall(PetscObjectIncrementTabLevel((PetscObject)tao->linesearch, (PetscObject)tao, 1));
f4db9bf7SStefano Zampini  PetscCall(TaoLineSearchSetType(tao->linesearch, TAOLINESEARCHMT));
9566063dSJacob Faibussowitsch  PetscCall(TaoLineSearchUseTaoRoutines(tao->linesearch, tao));
eb910715SAlp Dener
eb910715SAlp Dener  /*  Set linear solver to default for symmetric matrices */
9566063dSJacob Faibussowitsch  PetscCall(KSPCreate(((PetscObject)tao)->comm, &tao->ksp));
9566063dSJacob Faibussowitsch  PetscCall(PetscObjectIncrementTabLevel((PetscObject)tao->ksp, (PetscObject)tao, 1));
9566063dSJacob Faibussowitsch  PetscCall(KSPSetType(tao->ksp, KSPSTCG));
9566063dSJacob Faibussowitsch  PetscCall(KSPGetPC(tao->ksp, &pc));
9566063dSJacob Faibussowitsch  PetscCall(PCSetType(pc, PCLMVM));
eb910715SAlp Dener  PetscFunctionReturn(0);
eb910715SAlp Dener}