impls/bncg/bncg.c

ac9112b8SAlp Dener#include <petsctaolinesearch.h>
414d97d3SAlp Dener#include <../src/tao/bound/impls/bncg/bncg.h> /*I "petsctao.h" I*/
50b47da0SAdam Denchfield#include <petscksp.h>
ac9112b8SAlp Dener
*d6e07cdcSHong Zhangconst char *const TaoBNCGTypes[] = {"gd", "pcgd", "hs", "fr", "prp", "prp_plus", "dy", "hz", "dk", "kd", "ssml_bfgs", "ssml_dfp", "ssml_brdn", "TAOBNCGType", "TAO_BNCG_", NULL};
ac9112b8SAlp Dener
61be54a6SAlp Dener#define CG_AS_NONE      0
61be54a6SAlp Dener#define CG_AS_BERTSEKAS 1
61be54a6SAlp Dener#define CG_AS_SIZE      2
ac9112b8SAlp Dener
61be54a6SAlp Denerstatic const char *CG_AS_TYPE[64] = {"none", "bertsekas"};
ac9112b8SAlp Dener
d71ae5a4SJacob FaibussowitschPetscErrorCode TaoBNCGEstimateActiveSet(Tao tao, PetscInt asType)
d71ae5a4SJacob Faibussowitsch{
61be54a6SAlp Dener  TAO_BNCG *cg = (TAO_BNCG *)tao->data;
61be54a6SAlp Dener
61be54a6SAlp Dener  PetscFunctionBegin;
9566063dSJacob Faibussowitsch  PetscCall(ISDestroy(&cg->inactive_old));
61be54a6SAlp Dener  if (cg->inactive_idx) {
9566063dSJacob Faibussowitsch    PetscCall(ISDuplicate(cg->inactive_idx, &cg->inactive_old));
9566063dSJacob Faibussowitsch    PetscCall(ISCopy(cg->inactive_idx, cg->inactive_old));
61be54a6SAlp Dener  }
61be54a6SAlp Dener  switch (asType) {
61be54a6SAlp Dener  case CG_AS_NONE:
9566063dSJacob Faibussowitsch    PetscCall(ISDestroy(&cg->inactive_idx));
9566063dSJacob Faibussowitsch    PetscCall(VecWhichInactive(tao->XL, tao->solution, cg->unprojected_gradient, tao->XU, PETSC_TRUE, &cg->inactive_idx));
9566063dSJacob Faibussowitsch    PetscCall(ISDestroy(&cg->active_idx));
9566063dSJacob Faibussowitsch    PetscCall(ISComplementVec(cg->inactive_idx, tao->solution, &cg->active_idx));
61be54a6SAlp Dener    break;
61be54a6SAlp Dener
61be54a6SAlp Dener  case CG_AS_BERTSEKAS:
61be54a6SAlp Dener    /* Use gradient descent to estimate the active set */
9566063dSJacob Faibussowitsch    PetscCall(VecCopy(cg->unprojected_gradient, cg->W));
9566063dSJacob Faibussowitsch    PetscCall(VecScale(cg->W, -1.0));
9371c9d4SSatish Balay    PetscCall(TaoEstimateActiveBounds(tao->solution, tao->XL, tao->XU, cg->unprojected_gradient, cg->W, cg->work, cg->as_step, &cg->as_tol, &cg->active_lower, &cg->active_upper, &cg->active_fixed, &cg->active_idx, &cg->inactive_idx));
c4b75bccSAlp Dener    break;
d71ae5a4SJacob Faibussowitsch  default:
d71ae5a4SJacob Faibussowitsch    break;
61be54a6SAlp Dener  }
3ba16761SJacob Faibussowitsch  PetscFunctionReturn(PETSC_SUCCESS);
61be54a6SAlp Dener}
61be54a6SAlp Dener
d71ae5a4SJacob FaibussowitschPetscErrorCode TaoBNCGBoundStep(Tao tao, PetscInt asType, Vec step)
d71ae5a4SJacob Faibussowitsch{
61be54a6SAlp Dener  TAO_BNCG *cg = (TAO_BNCG *)tao->data;
61be54a6SAlp Dener
61be54a6SAlp Dener  PetscFunctionBegin;
a1318120SAlp Dener  switch (asType) {
d71ae5a4SJacob Faibussowitsch  case CG_AS_NONE:
d71ae5a4SJacob Faibussowitsch    PetscCall(VecISSet(step, cg->active_idx, 0.0));
d71ae5a4SJacob Faibussowitsch    break;
61be54a6SAlp Dener
d71ae5a4SJacob Faibussowitsch  case CG_AS_BERTSEKAS:
d71ae5a4SJacob Faibussowitsch    PetscCall(TaoBoundStep(tao->solution, tao->XL, tao->XU, cg->active_lower, cg->active_upper, cg->active_fixed, 1.0, step));
d71ae5a4SJacob Faibussowitsch    break;
61be54a6SAlp Dener
d71ae5a4SJacob Faibussowitsch  default:
d71ae5a4SJacob Faibussowitsch    break;
61be54a6SAlp Dener  }
3ba16761SJacob Faibussowitsch  PetscFunctionReturn(PETSC_SUCCESS);
61be54a6SAlp Dener}
61be54a6SAlp Dener
d71ae5a4SJacob Faibussowitschstatic PetscErrorCode TaoSolve_BNCG(Tao tao)
d71ae5a4SJacob Faibussowitsch{
ac9112b8SAlp Dener  TAO_BNCG *cg   = (TAO_BNCG *)tao->data;
484c7b14SAdam Denchfield  PetscReal step = 1.0, gnorm, gnorm2, resnorm;
c4b75bccSAlp Dener  PetscInt  nDiff;
ac9112b8SAlp Dener
ac9112b8SAlp Dener  PetscFunctionBegin;
ac9112b8SAlp Dener  /*   Project the current point onto the feasible set */
9566063dSJacob Faibussowitsch  PetscCall(TaoComputeVariableBounds(tao));
9566063dSJacob Faibussowitsch  PetscCall(TaoLineSearchSetVariableBounds(tao->linesearch, tao->XL, tao->XU));
ac9112b8SAlp Dener
c8bcdf1eSAdam Denchfield  /* Project the initial point onto the feasible region */
9566063dSJacob Faibussowitsch  PetscCall(TaoBoundSolution(tao->solution, tao->XL, tao->XU, 0.0, &nDiff, tao->solution));
484c7b14SAdam Denchfield
48a46eb9SPierre Jolivet  if (nDiff > 0 || !tao->recycle) PetscCall(TaoComputeObjectiveAndGradient(tao, tao->solution, &cg->f, cg->unprojected_gradient));
9566063dSJacob Faibussowitsch  PetscCall(VecNorm(cg->unprojected_gradient, NORM_2, &gnorm));
3c859ba3SBarry Smith  PetscCheck(!PetscIsInfOrNanReal(cg->f) && !PetscIsInfOrNanReal(gnorm), PetscObjectComm((PetscObject)tao), PETSC_ERR_USER, "User provided compute function generated Inf or NaN");
ac9112b8SAlp Dener
61be54a6SAlp Dener  /* Estimate the active set and compute the projected gradient */
9566063dSJacob Faibussowitsch  PetscCall(TaoBNCGEstimateActiveSet(tao, cg->as_type));
61be54a6SAlp Dener
ac9112b8SAlp Dener  /* Project the gradient and calculate the norm */
9566063dSJacob Faibussowitsch  PetscCall(VecCopy(cg->unprojected_gradient, tao->gradient));
9566063dSJacob Faibussowitsch  PetscCall(VecISSet(tao->gradient, cg->active_idx, 0.0));
9566063dSJacob Faibussowitsch  PetscCall(VecNorm(tao->gradient, NORM_2, &gnorm));
ac9112b8SAlp Dener  gnorm2 = gnorm * gnorm;
ac9112b8SAlp Dener
c8bcdf1eSAdam Denchfield  /* Initialize counters */
e031d6f5SAlp Dener  tao->niter   = 0;
50b47da0SAdam Denchfield  cg->ls_fails = cg->descent_error = 0;
c8bcdf1eSAdam Denchfield  cg->resets                       = -1;
484c7b14SAdam Denchfield  cg->skipped_updates = cg->pure_gd_steps = 0;
c8bcdf1eSAdam Denchfield  cg->iter_quad                           = 0;
c8bcdf1eSAdam Denchfield
c8bcdf1eSAdam Denchfield  /* Convergence test at the starting point. */
ac9112b8SAlp Dener  tao->reason = TAO_CONTINUE_ITERATING;
484c7b14SAdam Denchfield
9566063dSJacob Faibussowitsch  PetscCall(VecFischer(tao->solution, cg->unprojected_gradient, tao->XL, tao->XU, cg->W));
9566063dSJacob Faibussowitsch  PetscCall(VecNorm(cg->W, NORM_2, &resnorm));
3c859ba3SBarry Smith  PetscCheck(!PetscIsInfOrNanReal(resnorm), PetscObjectComm((PetscObject)tao), PETSC_ERR_USER, "User provided compute function generated Inf or NaN");
9566063dSJacob Faibussowitsch  PetscCall(TaoLogConvergenceHistory(tao, cg->f, resnorm, 0.0, tao->ksp_its));
9566063dSJacob Faibussowitsch  PetscCall(TaoMonitor(tao, tao->niter, cg->f, resnorm, 0.0, step));
dbbe0bcdSBarry Smith  PetscUseTypeMethod(tao, convergencetest, tao->cnvP);
3ba16761SJacob Faibussowitsch  if (tao->reason != TAO_CONTINUE_ITERATING) PetscFunctionReturn(PETSC_SUCCESS);
484c7b14SAdam Denchfield  /* Calculate initial direction. */
414d97d3SAlp Dener  if (!tao->recycle) {
484c7b14SAdam Denchfield    /* We are not recycling a solution/history from a past TaoSolve */
9566063dSJacob Faibussowitsch    PetscCall(TaoBNCGResetUpdate(tao, gnorm2));
ac9112b8SAlp Dener  }
c8bcdf1eSAdam Denchfield  /* Initial gradient descent step. Scaling by 1.0 also does a decent job for some problems. */
c8bcdf1eSAdam Denchfield  while (1) {
e1e80dc8SAlp Dener    /* Call general purpose update function */
e1e80dc8SAlp Dener    if (tao->ops->update) {
dbbe0bcdSBarry Smith      PetscUseTypeMethod(tao, update, tao->niter, tao->user_update);
7494f0b1SStefano Zampini      PetscCall(TaoComputeObjectiveAndGradient(tao, tao->solution, &cg->f, cg->unprojected_gradient));
e1e80dc8SAlp Dener    }
9566063dSJacob Faibussowitsch    PetscCall(TaoBNCGConductIteration(tao, gnorm));
3ba16761SJacob Faibussowitsch    if (tao->reason != TAO_CONTINUE_ITERATING) PetscFunctionReturn(PETSC_SUCCESS);
ac9112b8SAlp Dener  }
ac9112b8SAlp Dener}
ac9112b8SAlp Dener
d71ae5a4SJacob Faibussowitschstatic PetscErrorCode TaoSetUp_BNCG(Tao tao)
d71ae5a4SJacob Faibussowitsch{
ac9112b8SAlp Dener  TAO_BNCG *cg = (TAO_BNCG *)tao->data;
ac9112b8SAlp Dener
ac9112b8SAlp Dener  PetscFunctionBegin;
48a46eb9SPierre Jolivet  if (!tao->gradient) PetscCall(VecDuplicate(tao->solution, &tao->gradient));
48a46eb9SPierre Jolivet  if (!tao->stepdirection) PetscCall(VecDuplicate(tao->solution, &tao->stepdirection));
48a46eb9SPierre Jolivet  if (!cg->W) PetscCall(VecDuplicate(tao->solution, &cg->W));
48a46eb9SPierre Jolivet  if (!cg->work) PetscCall(VecDuplicate(tao->solution, &cg->work));
48a46eb9SPierre Jolivet  if (!cg->sk) PetscCall(VecDuplicate(tao->solution, &cg->sk));
48a46eb9SPierre Jolivet  if (!cg->yk) PetscCall(VecDuplicate(tao->gradient, &cg->yk));
48a46eb9SPierre Jolivet  if (!cg->X_old) PetscCall(VecDuplicate(tao->solution, &cg->X_old));
48a46eb9SPierre Jolivet  if (!cg->G_old) PetscCall(VecDuplicate(tao->gradient, &cg->G_old));
c8bcdf1eSAdam Denchfield  if (cg->diag_scaling) {
9566063dSJacob Faibussowitsch    PetscCall(VecDuplicate(tao->solution, &cg->d_work));
9566063dSJacob Faibussowitsch    PetscCall(VecDuplicate(tao->solution, &cg->y_work));
9566063dSJacob Faibussowitsch    PetscCall(VecDuplicate(tao->solution, &cg->g_work));
c4b75bccSAlp Dener  }
48a46eb9SPierre Jolivet  if (!cg->unprojected_gradient) PetscCall(VecDuplicate(tao->gradient, &cg->unprojected_gradient));
48a46eb9SPierre Jolivet  if (!cg->unprojected_gradient_old) PetscCall(VecDuplicate(tao->gradient, &cg->unprojected_gradient_old));
9566063dSJacob Faibussowitsch  PetscCall(MatLMVMAllocate(cg->B, cg->sk, cg->yk));
1baa6e33SBarry Smith  if (cg->pc) PetscCall(MatLMVMSetJ0(cg->B, cg->pc));
3ba16761SJacob Faibussowitsch  PetscFunctionReturn(PETSC_SUCCESS);
ac9112b8SAlp Dener}
ac9112b8SAlp Dener
d71ae5a4SJacob Faibussowitschstatic PetscErrorCode TaoDestroy_BNCG(Tao tao)
d71ae5a4SJacob Faibussowitsch{
ac9112b8SAlp Dener  TAO_BNCG *cg = (TAO_BNCG *)tao->data;
ac9112b8SAlp Dener
ac9112b8SAlp Dener  PetscFunctionBegin;
ac9112b8SAlp Dener  if (tao->setupcalled) {
9566063dSJacob Faibussowitsch    PetscCall(VecDestroy(&cg->W));
9566063dSJacob Faibussowitsch    PetscCall(VecDestroy(&cg->work));
9566063dSJacob Faibussowitsch    PetscCall(VecDestroy(&cg->X_old));
9566063dSJacob Faibussowitsch    PetscCall(VecDestroy(&cg->G_old));
9566063dSJacob Faibussowitsch    PetscCall(VecDestroy(&cg->unprojected_gradient));
9566063dSJacob Faibussowitsch    PetscCall(VecDestroy(&cg->unprojected_gradient_old));
9566063dSJacob Faibussowitsch    PetscCall(VecDestroy(&cg->g_work));
9566063dSJacob Faibussowitsch    PetscCall(VecDestroy(&cg->d_work));
9566063dSJacob Faibussowitsch    PetscCall(VecDestroy(&cg->y_work));
9566063dSJacob Faibussowitsch    PetscCall(VecDestroy(&cg->sk));
9566063dSJacob Faibussowitsch    PetscCall(VecDestroy(&cg->yk));
ac9112b8SAlp Dener  }
9566063dSJacob Faibussowitsch  PetscCall(ISDestroy(&cg->active_lower));
9566063dSJacob Faibussowitsch  PetscCall(ISDestroy(&cg->active_upper));
9566063dSJacob Faibussowitsch  PetscCall(ISDestroy(&cg->active_fixed));
9566063dSJacob Faibussowitsch  PetscCall(ISDestroy(&cg->active_idx));
9566063dSJacob Faibussowitsch  PetscCall(ISDestroy(&cg->inactive_idx));
9566063dSJacob Faibussowitsch  PetscCall(ISDestroy(&cg->inactive_old));
9566063dSJacob Faibussowitsch  PetscCall(ISDestroy(&cg->new_inactives));
9566063dSJacob Faibussowitsch  PetscCall(MatDestroy(&cg->B));
48a46eb9SPierre Jolivet  if (cg->pc) PetscCall(MatDestroy(&cg->pc));
9566063dSJacob Faibussowitsch  PetscCall(PetscFree(tao->data));
3ba16761SJacob Faibussowitsch  PetscFunctionReturn(PETSC_SUCCESS);
ac9112b8SAlp Dener}
ac9112b8SAlp Dener
d71ae5a4SJacob Faibussowitschstatic PetscErrorCode TaoSetFromOptions_BNCG(Tao tao, PetscOptionItems *PetscOptionsObject)
d71ae5a4SJacob Faibussowitsch{
ac9112b8SAlp Dener  TAO_BNCG *cg = (TAO_BNCG *)tao->data;
ac9112b8SAlp Dener
ac9112b8SAlp Dener  PetscFunctionBegin;
d0609cedSBarry Smith  PetscOptionsHeadBegin(PetscOptionsObject, "Nonlinear Conjugate Gradient method for unconstrained optimization");
*d6e07cdcSHong Zhang  PetscCall(PetscOptionsEnum("-tao_bncg_type", "CG update formula", "TaoBNCGTypes", TaoBNCGTypes, (PetscEnum)cg->cg_type, (PetscEnum *)&cg->cg_type, NULL));
*d6e07cdcSHong Zhang  if (cg->cg_type != TAO_BNCG_SSML_BFGS) cg->alpha = -1.0; /* Setting defaults for non-BFGS methods. User can change it below. */
*d6e07cdcSHong Zhang  if (TAO_BNCG_GD == cg->cg_type) {
*d6e07cdcSHong Zhang    cg->cg_type = TAO_BNCG_PCGD;
484c7b14SAdam Denchfield    /* Set scaling equal to none or, at best, scalar scaling. */
484c7b14SAdam Denchfield    cg->unscaled_restart = PETSC_TRUE;
484c7b14SAdam Denchfield    cg->diag_scaling     = PETSC_FALSE;
484c7b14SAdam Denchfield  }
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bncg_hz_eta", "(developer) cutoff tolerance for HZ", "", cg->hz_eta, &cg->hz_eta, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bncg_eps", "(developer) cutoff value for restarts", "", cg->epsilon, &cg->epsilon, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bncg_dk_eta", "(developer) cutoff tolerance for DK", "", cg->dk_eta, &cg->dk_eta, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bncg_xi", "(developer) Parameter in the KD method", "", cg->xi, &cg->xi, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bncg_theta", "(developer) update parameter for the Broyden method", "", cg->theta, &cg->theta, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bncg_hz_theta", "(developer) parameter for the HZ (2006) method", "", cg->hz_theta, &cg->hz_theta, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bncg_alpha", "(developer) parameter for the scalar scaling", "", cg->alpha, &cg->alpha, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bncg_bfgs_scale", "(developer) update parameter for bfgs/brdn CG methods", "", cg->bfgs_scale, &cg->bfgs_scale, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bncg_dfp_scale", "(developer) update parameter for bfgs/brdn CG methods", "", cg->dfp_scale, &cg->dfp_scale, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsBool("-tao_bncg_diag_scaling", "Enable diagonal Broyden-like preconditioning", "", cg->diag_scaling, &cg->diag_scaling, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsBool("-tao_bncg_dynamic_restart", "(developer) use dynamic restarts as in HZ, DK, KD", "", cg->use_dynamic_restart, &cg->use_dynamic_restart, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsBool("-tao_bncg_unscaled_restart", "(developer) use unscaled gradient restarts", "", cg->unscaled_restart, &cg->unscaled_restart, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bncg_zeta", "(developer) Free parameter for the Kou-Dai method", "", cg->zeta, &cg->zeta, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsInt("-tao_bncg_min_quad", "(developer) Number of iterations with approximate quadratic behavior needed for restart", "", cg->min_quad, &cg->min_quad, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsInt("-tao_bncg_min_restart_num", "(developer) Number of iterations between restarts (times dimension)", "", cg->min_restart_num, &cg->min_restart_num, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsBool("-tao_bncg_spaced_restart", "(developer) Enable regular steepest descent restarting every fixed number of iterations", "", cg->spaced_restart, &cg->spaced_restart, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsBool("-tao_bncg_no_scaling", "Disable all scaling except in restarts", "", cg->no_scaling, &cg->no_scaling, NULL));
484c7b14SAdam Denchfield  if (cg->no_scaling) {
484c7b14SAdam Denchfield    cg->diag_scaling = PETSC_FALSE;
484c7b14SAdam Denchfield    cg->alpha        = -1.0;
484c7b14SAdam Denchfield  }
*d6e07cdcSHong Zhang  if (cg->alpha == -1.0 && cg->cg_type == TAO_BNCG_KD && !cg->diag_scaling) { /* Some more default options that appear to be good. */
484c7b14SAdam Denchfield    cg->neg_xi = PETSC_TRUE;
484c7b14SAdam Denchfield  }
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsBool("-tao_bncg_neg_xi", "(developer) Use negative xi when it might be a smaller descent direction than necessary", "", cg->neg_xi, &cg->neg_xi, NULL));
*d6e07cdcSHong Zhang  PetscCall(PetscOptionsEList("-tao_bncg_as_type", "active set estimation method", "", CG_AS_TYPE, CG_AS_SIZE, CG_AS_TYPE[cg->as_type], &cg->as_type, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bncg_as_tol", "(developer) initial tolerance used when estimating actively bounded variables", "", cg->as_tol, &cg->as_tol, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bncg_as_step", "(developer) step length used when estimating actively bounded variables", "", cg->as_step, &cg->as_step, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bncg_delta_min", "(developer) minimum scaling factor used for scaled gradient restarts", "", cg->delta_min, &cg->delta_min, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bncg_delta_max", "(developer) maximum scaling factor used for scaled gradient restarts", "", cg->delta_max, &cg->delta_max, NULL));
50b47da0SAdam Denchfield
d0609cedSBarry Smith  PetscOptionsHeadEnd();
9566063dSJacob Faibussowitsch  PetscCall(MatSetOptionsPrefix(cg->B, ((PetscObject)tao)->prefix));
9566063dSJacob Faibussowitsch  PetscCall(MatAppendOptionsPrefix(cg->B, "tao_bncg_"));
9566063dSJacob Faibussowitsch  PetscCall(MatSetFromOptions(cg->B));
3ba16761SJacob Faibussowitsch  PetscFunctionReturn(PETSC_SUCCESS);
ac9112b8SAlp Dener}
ac9112b8SAlp Dener
d71ae5a4SJacob Faibussowitschstatic PetscErrorCode TaoView_BNCG(Tao tao, PetscViewer viewer)
d71ae5a4SJacob Faibussowitsch{
ac9112b8SAlp Dener  PetscBool isascii;
ac9112b8SAlp Dener  TAO_BNCG *cg = (TAO_BNCG *)tao->data;
ac9112b8SAlp Dener
ac9112b8SAlp Dener  PetscFunctionBegin;
9566063dSJacob Faibussowitsch  PetscCall(PetscObjectTypeCompare((PetscObject)viewer, PETSCVIEWERASCII, &isascii));
ac9112b8SAlp Dener  if (isascii) {
9566063dSJacob Faibussowitsch    PetscCall(PetscViewerASCIIPushTab(viewer));
*d6e07cdcSHong Zhang    PetscCall(PetscViewerASCIIPrintf(viewer, "CG Type: %s\n", TaoBNCGTypes[cg->cg_type]));
63a3b9bcSJacob Faibussowitsch    PetscCall(PetscViewerASCIIPrintf(viewer, "Skipped Stepdirection Updates: %" PetscInt_FMT "\n", cg->skipped_updates));
63a3b9bcSJacob Faibussowitsch    PetscCall(PetscViewerASCIIPrintf(viewer, "Scaled gradient steps: %" PetscInt_FMT "\n", cg->resets));
63a3b9bcSJacob Faibussowitsch    PetscCall(PetscViewerASCIIPrintf(viewer, "Pure gradient steps: %" PetscInt_FMT "\n", cg->pure_gd_steps));
63a3b9bcSJacob Faibussowitsch    PetscCall(PetscViewerASCIIPrintf(viewer, "Not a descent direction: %" PetscInt_FMT "\n", cg->descent_error));
63a3b9bcSJacob Faibussowitsch    PetscCall(PetscViewerASCIIPrintf(viewer, "Line search fails: %" PetscInt_FMT "\n", cg->ls_fails));
484c7b14SAdam Denchfield    if (cg->diag_scaling) {
9566063dSJacob Faibussowitsch      PetscCall(PetscObjectTypeCompare((PetscObject)viewer, PETSCVIEWERASCII, &isascii));
484c7b14SAdam Denchfield      if (isascii) {
9566063dSJacob Faibussowitsch        PetscCall(PetscViewerPushFormat(viewer, PETSC_VIEWER_ASCII_INFO));
9566063dSJacob Faibussowitsch        PetscCall(MatView(cg->B, viewer));
9566063dSJacob Faibussowitsch        PetscCall(PetscViewerPopFormat(viewer));
484c7b14SAdam Denchfield      }
484c7b14SAdam Denchfield    }
9566063dSJacob Faibussowitsch    PetscCall(PetscViewerASCIIPopTab(viewer));
ac9112b8SAlp Dener  }
3ba16761SJacob Faibussowitsch  PetscFunctionReturn(PETSC_SUCCESS);
ac9112b8SAlp Dener}
ac9112b8SAlp Dener
d71ae5a4SJacob FaibussowitschPetscErrorCode TaoBNCGComputeScalarScaling(PetscReal yty, PetscReal yts, PetscReal sts, PetscReal *scale, PetscReal alpha)
d71ae5a4SJacob Faibussowitsch{
c8bcdf1eSAdam Denchfield  PetscReal a, b, c, sig1, sig2;
c8bcdf1eSAdam Denchfield
c8bcdf1eSAdam Denchfield  PetscFunctionBegin;
c8bcdf1eSAdam Denchfield  *scale = 0.0;
8ebe3e4eSStefano Zampini  if (1.0 == alpha) *scale = yts / yty;
8ebe3e4eSStefano Zampini  else if (0.0 == alpha) *scale = sts / yts;
50b47da0SAdam Denchfield  else if (-1.0 == alpha) *scale = 1.0;
c8bcdf1eSAdam Denchfield  else {
c8bcdf1eSAdam Denchfield    a = yty;
c8bcdf1eSAdam Denchfield    b = yts;
c8bcdf1eSAdam Denchfield    c = sts;
c8bcdf1eSAdam Denchfield    a *= alpha;
c8bcdf1eSAdam Denchfield    b *= -(2.0 * alpha - 1.0);
c8bcdf1eSAdam Denchfield    c *= alpha - 1.0;
c8bcdf1eSAdam Denchfield    sig1 = (-b + PetscSqrtReal(b * b - 4.0 * a * c)) / (2.0 * a);
c8bcdf1eSAdam Denchfield    sig2 = (-b - PetscSqrtReal(b * b - 4.0 * a * c)) / (2.0 * a);
c8bcdf1eSAdam Denchfield    /* accept the positive root as the scalar */
8ebe3e4eSStefano Zampini    if (sig1 > 0.0) *scale = sig1;
8ebe3e4eSStefano Zampini    else if (sig2 > 0.0) *scale = sig2;
8ebe3e4eSStefano Zampini    else SETERRQ(PETSC_COMM_SELF, PETSC_ERR_CONV_FAILED, "Cannot find positive scalar");
c8bcdf1eSAdam Denchfield  }
3ba16761SJacob Faibussowitsch  PetscFunctionReturn(PETSC_SUCCESS);
c8bcdf1eSAdam Denchfield}
c8bcdf1eSAdam Denchfield
ac9112b8SAlp Dener/*MC
ac9112b8SAlp Dener  TAOBNCG - Bound-constrained Nonlinear Conjugate Gradient method.
ac9112b8SAlp Dener
ac9112b8SAlp Dener  Options Database Keys:
50b47da0SAdam Denchfield+ -tao_bncg_recycle - enable recycling the latest calculated gradient vector in subsequent TaoSolve() calls (currently disabled)
c4b75bccSAlp Dener. -tao_bncg_eta <r> - restart tolerance
61be54a6SAlp Dener. -tao_bncg_type <taocg_type> - cg formula
c4b75bccSAlp Dener. -tao_bncg_as_type <none,bertsekas> - active set estimation method
c4b75bccSAlp Dener. -tao_bncg_as_tol <r> - tolerance used in Bertsekas active-set estimation
c4b75bccSAlp Dener. -tao_bncg_as_step <r> - trial step length used in Bertsekas active-set estimation
50b47da0SAdam Denchfield. -tao_bncg_eps <r> - cutoff used for determining whether or not we restart based on steplength each iteration, as well as determining whether or not we continue using the last stepdirection. Defaults to machine precision.
50b47da0SAdam Denchfield. -tao_bncg_theta <r> - convex combination parameter for the Broyden method
50b47da0SAdam Denchfield. -tao_bncg_hz_eta <r> - cutoff tolerance for the beta term in the HZ, DK methods
50b47da0SAdam Denchfield. -tao_bncg_dk_eta <r> - cutoff tolerance for the beta term in the HZ, DK methods
50b47da0SAdam Denchfield. -tao_bncg_xi <r> - Multiplicative constant of the gamma term in the KD method
50b47da0SAdam Denchfield. -tao_bncg_hz_theta <r> - Multiplicative constant of the theta term for the HZ method
50b47da0SAdam Denchfield. -tao_bncg_bfgs_scale <r> - Scaling parameter of the bfgs contribution to the scalar Broyden method
50b47da0SAdam Denchfield. -tao_bncg_dfp_scale <r> - Scaling parameter of the dfp contribution to the scalar Broyden method
50b47da0SAdam Denchfield. -tao_bncg_diag_scaling <b> - Whether or not to use diagonal initialization/preconditioning for the CG methods. Default True.
50b47da0SAdam Denchfield. -tao_bncg_dynamic_restart <b> - use dynamic restart strategy in the HZ, DK, KD methods
50b47da0SAdam Denchfield. -tao_bncg_unscaled_restart <b> - whether or not to scale the gradient when doing gradient descent restarts
50b47da0SAdam Denchfield. -tao_bncg_zeta <r> - Scaling parameter in the KD method
484c7b14SAdam Denchfield. -tao_bncg_delta_min <r> - Minimum bound for rescaling during restarted gradient descent steps
484c7b14SAdam Denchfield. -tao_bncg_delta_max <r> - Maximum bound for rescaling during restarted gradient descent steps
50b47da0SAdam Denchfield. -tao_bncg_min_quad <i> - Number of quadratic-like steps in a row necessary to do a dynamic restart
50b47da0SAdam Denchfield. -tao_bncg_min_restart_num <i> - This number, x, makes sure there is a gradient descent step every x*n iterations, where n is the dimension of the problem
50b47da0SAdam Denchfield. -tao_bncg_spaced_restart <b> - whether or not to do gradient descent steps every x*n iterations
484c7b14SAdam Denchfield. -tao_bncg_no_scaling <b> - If true, eliminates all scaling, including defaults.
3850be85SAlp Dener- -tao_bncg_neg_xi <b> - Whether or not to use negative xi in the KD method under certain conditions
ac9112b8SAlp Dener
ac9112b8SAlp Dener  Notes:
ac9112b8SAlp Dener    CG formulas are:
3850be85SAlp Dener+ "gd" - Gradient Descent
3850be85SAlp Dener. "fr" - Fletcher-Reeves
3850be85SAlp Dener. "pr" - Polak-Ribiere-Polyak
3850be85SAlp Dener. "prp" - Polak-Ribiere-Plus
3850be85SAlp Dener. "hs" - Hestenes-Steifel
3850be85SAlp Dener. "dy" - Dai-Yuan
3850be85SAlp Dener. "ssml_bfgs" - Self-Scaling Memoryless BFGS
3850be85SAlp Dener. "ssml_dfp"  - Self-Scaling Memoryless DFP
3850be85SAlp Dener. "ssml_brdn" - Self-Scaling Memoryless Broyden
3850be85SAlp Dener. "hz" - Hager-Zhang (CG_DESCENT 5.3)
3850be85SAlp Dener. "dk" - Dai-Kou (2013)
3850be85SAlp Dener- "kd" - Kou-Dai (2015)
9abc5736SPatrick Sanan
ac9112b8SAlp Dener  Level: beginner
ac9112b8SAlp DenerM*/
ac9112b8SAlp Dener
d71ae5a4SJacob FaibussowitschPETSC_EXTERN PetscErrorCode TaoCreate_BNCG(Tao tao)
d71ae5a4SJacob Faibussowitsch{
ac9112b8SAlp Dener  TAO_BNCG   *cg;
ac9112b8SAlp Dener  const char *morethuente_type = TAOLINESEARCHMT;
ac9112b8SAlp Dener
ac9112b8SAlp Dener  PetscFunctionBegin;
ac9112b8SAlp Dener  tao->ops->setup          = TaoSetUp_BNCG;
ac9112b8SAlp Dener  tao->ops->solve          = TaoSolve_BNCG;
ac9112b8SAlp Dener  tao->ops->view           = TaoView_BNCG;
ac9112b8SAlp Dener  tao->ops->setfromoptions = TaoSetFromOptions_BNCG;
ac9112b8SAlp Dener  tao->ops->destroy        = TaoDestroy_BNCG;
ac9112b8SAlp Dener
ac9112b8SAlp Dener  /* Override default settings (unless already changed) */
ac9112b8SAlp Dener  if (!tao->max_it_changed) tao->max_it = 2000;
ac9112b8SAlp Dener  if (!tao->max_funcs_changed) tao->max_funcs = 4000;
ac9112b8SAlp Dener
ac9112b8SAlp Dener  /*  Note: nondefault values should be used for nonlinear conjugate gradient  */
ac9112b8SAlp Dener  /*  method.  In particular, gtol should be less that 0.5; the value used in  */
ac9112b8SAlp Dener  /*  Nocedal and Wright is 0.10.  We use the default values for the  */
ac9112b8SAlp Dener  /*  linesearch because it seems to work better. */
9566063dSJacob Faibussowitsch  PetscCall(TaoLineSearchCreate(((PetscObject)tao)->comm, &tao->linesearch));
9566063dSJacob Faibussowitsch  PetscCall(PetscObjectIncrementTabLevel((PetscObject)tao->linesearch, (PetscObject)tao, 1));
9566063dSJacob Faibussowitsch  PetscCall(TaoLineSearchSetType(tao->linesearch, morethuente_type));
9566063dSJacob Faibussowitsch  PetscCall(TaoLineSearchUseTaoRoutines(tao->linesearch, tao));
ac9112b8SAlp Dener
4dfa11a4SJacob Faibussowitsch  PetscCall(PetscNew(&cg));
ac9112b8SAlp Dener  tao->data = (void *)cg;
9566063dSJacob Faibussowitsch  PetscCall(KSPInitializePackage());
9566063dSJacob Faibussowitsch  PetscCall(MatCreate(PetscObjectComm((PetscObject)tao), &cg->B));
9566063dSJacob Faibussowitsch  PetscCall(PetscObjectIncrementTabLevel((PetscObject)cg->B, (PetscObject)tao, 1));
9566063dSJacob Faibussowitsch  PetscCall(MatSetType(cg->B, MATLMVMDIAGBROYDEN));
50b47da0SAdam Denchfield
484c7b14SAdam Denchfield  cg->pc = NULL;
484c7b14SAdam Denchfield
50b47da0SAdam Denchfield  cg->dk_eta           = 0.5;
50b47da0SAdam Denchfield  cg->hz_eta           = 0.4;
c8bcdf1eSAdam Denchfield  cg->dynamic_restart  = PETSC_FALSE;
c8bcdf1eSAdam Denchfield  cg->unscaled_restart = PETSC_FALSE;
484c7b14SAdam Denchfield  cg->no_scaling       = PETSC_FALSE;
484c7b14SAdam Denchfield  cg->delta_min        = 1e-7;
484c7b14SAdam Denchfield  cg->delta_max        = 100;
c8bcdf1eSAdam Denchfield  cg->theta            = 1.0;
c8bcdf1eSAdam Denchfield  cg->hz_theta         = 1.0;
c8bcdf1eSAdam Denchfield  cg->dfp_scale        = 1.0;
c8bcdf1eSAdam Denchfield  cg->bfgs_scale       = 1.0;
50b47da0SAdam Denchfield  cg->zeta             = 0.1;
50b47da0SAdam Denchfield  cg->min_quad         = 6;
c8bcdf1eSAdam Denchfield  cg->min_restart_num  = 6; /* As in CG_DESCENT and KD2015*/
c8bcdf1eSAdam Denchfield  cg->xi               = 1.0;
50b47da0SAdam Denchfield  cg->neg_xi           = PETSC_TRUE;
c8bcdf1eSAdam Denchfield  cg->spaced_restart   = PETSC_FALSE;
c8bcdf1eSAdam Denchfield  cg->tol_quad         = 1e-8;
61be54a6SAlp Dener  cg->as_step          = 0.001;
61be54a6SAlp Dener  cg->as_tol           = 0.001;
50b47da0SAdam Denchfield  cg->eps_23           = PetscPowReal(PETSC_MACHINE_EPSILON, 2.0 / 3.0); /* Just a little tighter*/
61be54a6SAlp Dener  cg->as_type          = CG_AS_BERTSEKAS;
*d6e07cdcSHong Zhang  cg->cg_type          = TAO_BNCG_SSML_BFGS;
c8bcdf1eSAdam Denchfield  cg->alpha            = 1.0;
c8bcdf1eSAdam Denchfield  cg->diag_scaling     = PETSC_TRUE;
3ba16761SJacob Faibussowitsch  PetscFunctionReturn(PETSC_SUCCESS);
c8bcdf1eSAdam Denchfield}
c8bcdf1eSAdam Denchfield
d71ae5a4SJacob FaibussowitschPetscErrorCode TaoBNCGResetUpdate(Tao tao, PetscReal gnormsq)
d71ae5a4SJacob Faibussowitsch{
c8bcdf1eSAdam Denchfield  TAO_BNCG *cg = (TAO_BNCG *)tao->data;
c8bcdf1eSAdam Denchfield  PetscReal scaling;
c8bcdf1eSAdam Denchfield
c8bcdf1eSAdam Denchfield  PetscFunctionBegin;
c8bcdf1eSAdam Denchfield  ++cg->resets;
c8bcdf1eSAdam Denchfield  scaling = 2.0 * PetscMax(1.0, PetscAbsScalar(cg->f)) / PetscMax(gnormsq, cg->eps_23);
484c7b14SAdam Denchfield  scaling = PetscMin(cg->delta_max, PetscMax(cg->delta_min, scaling));
484c7b14SAdam Denchfield  if (cg->unscaled_restart) {
484c7b14SAdam Denchfield    scaling = 1.0;
484c7b14SAdam Denchfield    ++cg->pure_gd_steps;
484c7b14SAdam Denchfield  }
9566063dSJacob Faibussowitsch  PetscCall(VecAXPBY(tao->stepdirection, -scaling, 0.0, tao->gradient));
c8bcdf1eSAdam Denchfield  /* Also want to reset our diagonal scaling with each restart */
1baa6e33SBarry Smith  if (cg->diag_scaling) PetscCall(MatLMVMReset(cg->B, PETSC_FALSE));
3ba16761SJacob Faibussowitsch  PetscFunctionReturn(PETSC_SUCCESS);
c8bcdf1eSAdam Denchfield}
c8bcdf1eSAdam Denchfield
d71ae5a4SJacob FaibussowitschPetscErrorCode TaoBNCGCheckDynamicRestart(Tao tao, PetscReal stepsize, PetscReal gd, PetscReal gd_old, PetscBool *dynrestart, PetscReal fold)
d71ae5a4SJacob Faibussowitsch{
c8bcdf1eSAdam Denchfield  TAO_BNCG *cg = (TAO_BNCG *)tao->data;
c8bcdf1eSAdam Denchfield  PetscReal quadinterp;
c8bcdf1eSAdam Denchfield
c8bcdf1eSAdam Denchfield  PetscFunctionBegin;
50b47da0SAdam Denchfield  if (cg->f < cg->min_quad / 10) {
50b47da0SAdam Denchfield    *dynrestart = PETSC_FALSE;
3ba16761SJacob Faibussowitsch    PetscFunctionReturn(PETSC_SUCCESS);
50b47da0SAdam Denchfield  } /* just skip this since this strategy doesn't work well for functions near zero */
484c7b14SAdam Denchfield  quadinterp = 2.0 * (cg->f - fold) / (stepsize * (gd + gd_old));
50b47da0SAdam Denchfield  if (PetscAbs(quadinterp - 1.0) < cg->tol_quad) ++cg->iter_quad;
c8bcdf1eSAdam Denchfield  else {
c8bcdf1eSAdam Denchfield    cg->iter_quad = 0;
c8bcdf1eSAdam Denchfield    *dynrestart   = PETSC_FALSE;
c8bcdf1eSAdam Denchfield  }
c8bcdf1eSAdam Denchfield  if (cg->iter_quad >= cg->min_quad) {
c8bcdf1eSAdam Denchfield    cg->iter_quad = 0;
c8bcdf1eSAdam Denchfield    *dynrestart   = PETSC_TRUE;
c8bcdf1eSAdam Denchfield  }
3ba16761SJacob Faibussowitsch  PetscFunctionReturn(PETSC_SUCCESS);
c8bcdf1eSAdam Denchfield}
c8bcdf1eSAdam Denchfield
d71ae5a4SJacob FaibussowitschPETSC_INTERN PetscErrorCode TaoBNCGStepDirectionUpdate(Tao tao, PetscReal gnorm2, PetscReal step, PetscReal fold, PetscReal gnorm2_old, PetscReal dnorm, PetscBool pcgd_fallback)
d71ae5a4SJacob Faibussowitsch{
c8bcdf1eSAdam Denchfield  TAO_BNCG *cg    = (TAO_BNCG *)tao->data;
50b47da0SAdam Denchfield  PetscReal gamma = 1.0, tau_k, beta;
484c7b14SAdam Denchfield  PetscReal tmp = 1.0, ynorm, ynorm2 = 1.0, snorm = 1.0, dk_yk = 1.0, gd;
50b47da0SAdam Denchfield  PetscReal gkp1_yk, gd_old, tau_bfgs, tau_dfp, gkp1D_yk, gtDg;
c8bcdf1eSAdam Denchfield  PetscInt  dim;
484c7b14SAdam Denchfield  PetscBool cg_restart = PETSC_FALSE;
c8bcdf1eSAdam Denchfield  PetscFunctionBegin;
c8bcdf1eSAdam Denchfield
50b47da0SAdam Denchfield  /* Local curvature check to see if we need to restart */
414d97d3SAlp Dener  if (tao->niter >= 1 || tao->recycle) {
9566063dSJacob Faibussowitsch    PetscCall(VecWAXPY(cg->yk, -1.0, cg->G_old, tao->gradient));
9566063dSJacob Faibussowitsch    PetscCall(VecNorm(cg->yk, NORM_2, &ynorm));
c8bcdf1eSAdam Denchfield    ynorm2 = ynorm * ynorm;
9566063dSJacob Faibussowitsch    PetscCall(VecDot(cg->yk, tao->stepdirection, &dk_yk));
484c7b14SAdam Denchfield    if (step * dnorm < PETSC_MACHINE_EPSILON || step * dk_yk < PETSC_MACHINE_EPSILON) {
e2570530SAlp Dener      cg_restart = PETSC_TRUE;
484c7b14SAdam Denchfield      ++cg->skipped_updates;
484c7b14SAdam Denchfield    }
50b47da0SAdam Denchfield    if (cg->spaced_restart) {
9566063dSJacob Faibussowitsch      PetscCall(VecGetSize(tao->gradient, &dim));
e2570530SAlp Dener      if (tao->niter % (dim * cg->min_restart_num)) cg_restart = PETSC_TRUE;
50b47da0SAdam Denchfield    }
50b47da0SAdam Denchfield  }
50b47da0SAdam Denchfield  /* If the user wants regular restarts, do it every 6n iterations, where n=dimension */
50b47da0SAdam Denchfield  if (cg->spaced_restart) {
9566063dSJacob Faibussowitsch    PetscCall(VecGetSize(tao->gradient, &dim));
e2570530SAlp Dener    if (0 == tao->niter % (6 * dim)) cg_restart = PETSC_TRUE;
50b47da0SAdam Denchfield  }
50b47da0SAdam Denchfield  /* Compute the diagonal scaling vector if applicable */
1baa6e33SBarry Smith  if (cg->diag_scaling) PetscCall(MatLMVMUpdate(cg->B, tao->solution, tao->gradient));
50b47da0SAdam Denchfield
484c7b14SAdam Denchfield  /* A note on diagonal scaling (to be added to paper):
484c7b14SAdam Denchfield   For the FR, PR, PRP, and DY methods, the diagonally scaled versions
484c7b14SAdam Denchfield   must be derived as a preconditioned CG method rather than as
484c7b14SAdam Denchfield   a Hessian initialization like in the Broyden methods. */
50b47da0SAdam Denchfield
484c7b14SAdam Denchfield  /* In that case, one writes the objective function as
484c7b14SAdam Denchfield   f(x) \equiv f(Ay). Gradient evaluations yield g(x_k) = A g(Ay_k) = A g(x_k).
484c7b14SAdam Denchfield   Furthermore, the direction d_k \equiv (x_k - x_{k-1})/step according to
484c7b14SAdam Denchfield   HZ (2006) becomes A^{-1} d_k, such that d_k^T g_k remains the
484c7b14SAdam Denchfield   same under preconditioning. Note that A is diagonal, such that A^T = A. */
50b47da0SAdam Denchfield
484c7b14SAdam Denchfield  /* This yields questions like what the dot product d_k^T y_k
484c7b14SAdam Denchfield   should look like. HZ mistakenly treats that as the same under
484c7b14SAdam Denchfield   preconditioning, but that is not necessarily true. */
50b47da0SAdam Denchfield
484c7b14SAdam Denchfield  /* Observe y_k \equiv g_k - g_{k-1}, and under the P.C. transformation,
484c7b14SAdam Denchfield   we get d_k^T y_k = (d_k^T A_k^{-T} A_k g_k - d_k^T A_k^{-T} A_{k-1} g_{k-1}),
484c7b14SAdam Denchfield   yielding d_k^T y_k = d_k^T g_k - d_k^T (A_k^{-T} A_{k-1} g_{k-1}), which is
484c7b14SAdam Denchfield   NOT the same if our preconditioning matrix is updated between iterations.
484c7b14SAdam Denchfield   This same issue is found when considering dot products of the form g_{k+1}^T y_k. */
50b47da0SAdam Denchfield
50b47da0SAdam Denchfield  /* Compute CG step direction */
50b47da0SAdam Denchfield  if (cg_restart) {
9566063dSJacob Faibussowitsch    PetscCall(TaoBNCGResetUpdate(tao, gnorm2));
484c7b14SAdam Denchfield  } else if (pcgd_fallback) {
484c7b14SAdam Denchfield    /* Just like preconditioned CG */
9566063dSJacob Faibussowitsch    PetscCall(MatSolve(cg->B, tao->gradient, cg->g_work));
9566063dSJacob Faibussowitsch    PetscCall(VecAXPBY(tao->stepdirection, -1.0, 0.0, cg->g_work));
50b47da0SAdam Denchfield  } else if (ynorm2 > PETSC_MACHINE_EPSILON) {
50b47da0SAdam Denchfield    switch (cg->cg_type) {
*d6e07cdcSHong Zhang    case TAO_BNCG_PCGD:
50b47da0SAdam Denchfield      if (!cg->diag_scaling) {
484c7b14SAdam Denchfield        if (!cg->no_scaling) {
50b47da0SAdam Denchfield          cg->sts = step * step * dnorm * dnorm;
9566063dSJacob Faibussowitsch          PetscCall(TaoBNCGComputeScalarScaling(ynorm2, step * dk_yk, cg->sts, &tau_k, cg->alpha));
484c7b14SAdam Denchfield        } else {
484c7b14SAdam Denchfield          tau_k = 1.0;
484c7b14SAdam Denchfield          ++cg->pure_gd_steps;
484c7b14SAdam Denchfield        }
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBY(tao->stepdirection, -tau_k, 0.0, tao->gradient));
50b47da0SAdam Denchfield      } else {
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(cg->B, tao->gradient, cg->g_work));
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBY(tao->stepdirection, -1.0, 0.0, cg->g_work));
50b47da0SAdam Denchfield      }
50b47da0SAdam Denchfield      break;
484c7b14SAdam Denchfield
*d6e07cdcSHong Zhang    case TAO_BNCG_HS:
50b47da0SAdam Denchfield      /* Classic Hestenes-Stiefel method, modified with scalar and diagonal preconditioning. */
50b47da0SAdam Denchfield      if (!cg->diag_scaling) {
50b47da0SAdam Denchfield        cg->sts = step * step * dnorm * dnorm;
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->yk, tao->gradient, &gkp1_yk));
9566063dSJacob Faibussowitsch        PetscCall(TaoBNCGComputeScalarScaling(ynorm2, step * dk_yk, cg->sts, &tau_k, cg->alpha));
50b47da0SAdam Denchfield        beta = tau_k * gkp1_yk / dk_yk;
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBY(tao->stepdirection, -tau_k, beta, tao->gradient));
50b47da0SAdam Denchfield      } else {
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(cg->B, tao->gradient, cg->g_work));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->yk, cg->g_work, &gkp1_yk));
50b47da0SAdam Denchfield        beta = gkp1_yk / dk_yk;
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBY(tao->stepdirection, -1.0, beta, cg->g_work));
50b47da0SAdam Denchfield      }
c8bcdf1eSAdam Denchfield      break;
484c7b14SAdam Denchfield
*d6e07cdcSHong Zhang    case TAO_BNCG_FR:
9566063dSJacob Faibussowitsch      PetscCall(VecDot(cg->G_old, cg->G_old, &gnorm2_old));
9566063dSJacob Faibussowitsch      PetscCall(VecWAXPY(cg->yk, -1.0, cg->G_old, tao->gradient));
9566063dSJacob Faibussowitsch      PetscCall(VecNorm(cg->yk, NORM_2, &ynorm));
50b47da0SAdam Denchfield      ynorm2 = ynorm * ynorm;
9566063dSJacob Faibussowitsch      PetscCall(VecDot(cg->yk, tao->stepdirection, &dk_yk));
50b47da0SAdam Denchfield      if (!cg->diag_scaling) {
9566063dSJacob Faibussowitsch        PetscCall(TaoBNCGComputeScalarScaling(ynorm2, step * dk_yk, step * step * dnorm * dnorm, &tau_k, cg->alpha));
50b47da0SAdam Denchfield        beta = tau_k * gnorm2 / gnorm2_old;
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBY(tao->stepdirection, -tau_k, beta, tao->gradient));
50b47da0SAdam Denchfield      } else {
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->G_old, cg->g_work, &gnorm2_old)); /* Before it's updated */
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(cg->B, tao->gradient, cg->g_work));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(tao->gradient, cg->g_work, &tmp));
50b47da0SAdam Denchfield        beta = tmp / gnorm2_old;
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBY(tao->stepdirection, -1.0, beta, cg->g_work));
50b47da0SAdam Denchfield      }
c8bcdf1eSAdam Denchfield      break;
484c7b14SAdam Denchfield
*d6e07cdcSHong Zhang    case TAO_BNCG_PRP:
50b47da0SAdam Denchfield      snorm = step * dnorm;
50b47da0SAdam Denchfield      if (!cg->diag_scaling) {
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->G_old, cg->G_old, &gnorm2_old));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->yk, tao->gradient, &gkp1_yk));
9566063dSJacob Faibussowitsch        PetscCall(TaoBNCGComputeScalarScaling(ynorm2, step * dk_yk, snorm * snorm, &tau_k, cg->alpha));
50b47da0SAdam Denchfield        beta = tau_k * gkp1_yk / gnorm2_old;
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBY(tao->stepdirection, -tau_k, beta, tao->gradient));
50b47da0SAdam Denchfield      } else {
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->G_old, cg->g_work, &gnorm2_old));
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(cg->B, tao->gradient, cg->g_work));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->g_work, cg->yk, &gkp1_yk));
50b47da0SAdam Denchfield        beta = gkp1_yk / gnorm2_old;
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBY(tao->stepdirection, -1.0, beta, cg->g_work));
50b47da0SAdam Denchfield      }
c8bcdf1eSAdam Denchfield      break;
484c7b14SAdam Denchfield
*d6e07cdcSHong Zhang    case TAO_BNCG_PRP_PLUS:
9566063dSJacob Faibussowitsch      PetscCall(VecWAXPY(cg->yk, -1.0, cg->G_old, tao->gradient));
9566063dSJacob Faibussowitsch      PetscCall(VecNorm(cg->yk, NORM_2, &ynorm));
50b47da0SAdam Denchfield      ynorm2 = ynorm * ynorm;
50b47da0SAdam Denchfield      if (!cg->diag_scaling) {
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->G_old, cg->G_old, &gnorm2_old));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->yk, tao->gradient, &gkp1_yk));
9566063dSJacob Faibussowitsch        PetscCall(TaoBNCGComputeScalarScaling(ynorm2, step * dk_yk, snorm * snorm, &tau_k, cg->alpha));
50b47da0SAdam Denchfield        beta = tau_k * gkp1_yk / gnorm2_old;
50b47da0SAdam Denchfield        beta = PetscMax(beta, 0.0);
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBY(tao->stepdirection, -tau_k, beta, tao->gradient));
50b47da0SAdam Denchfield      } else {
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->G_old, cg->g_work, &gnorm2_old)); /* Old gtDg */
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(cg->B, tao->gradient, cg->g_work));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->g_work, cg->yk, &gkp1_yk));
50b47da0SAdam Denchfield        beta = gkp1_yk / gnorm2_old;
50b47da0SAdam Denchfield        beta = PetscMax(beta, 0.0);
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBY(tao->stepdirection, -1.0, beta, cg->g_work));
50b47da0SAdam Denchfield      }
c8bcdf1eSAdam Denchfield      break;
484c7b14SAdam Denchfield
*d6e07cdcSHong Zhang    case TAO_BNCG_DY:
484c7b14SAdam Denchfield      /* Dai, Yu-Hong, and Yaxiang Yuan. "A nonlinear conjugate gradient method with a strong global convergence property."
484c7b14SAdam Denchfield         SIAM Journal on optimization 10, no. 1 (1999): 177-182. */
50b47da0SAdam Denchfield      if (!cg->diag_scaling) {
9566063dSJacob Faibussowitsch        PetscCall(VecDot(tao->stepdirection, tao->gradient, &gd));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->G_old, tao->stepdirection, &gd_old));
9566063dSJacob Faibussowitsch        PetscCall(TaoBNCGComputeScalarScaling(ynorm2, step * dk_yk, cg->yts, &tau_k, cg->alpha));
50b47da0SAdam Denchfield        beta = tau_k * gnorm2 / (gd - gd_old);
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBY(tao->stepdirection, -tau_k, beta, tao->gradient));
50b47da0SAdam Denchfield      } else {
9566063dSJacob Faibussowitsch        PetscCall(MatMult(cg->B, tao->stepdirection, cg->d_work));
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(cg->B, tao->gradient, cg->g_work));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->g_work, tao->gradient, &gtDg));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(tao->stepdirection, cg->G_old, &gd_old));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->d_work, cg->g_work, &dk_yk));
50b47da0SAdam Denchfield        dk_yk = dk_yk - gd_old;
50b47da0SAdam Denchfield        beta  = gtDg / dk_yk;
9566063dSJacob Faibussowitsch        PetscCall(VecScale(cg->d_work, beta));
9566063dSJacob Faibussowitsch        PetscCall(VecWAXPY(tao->stepdirection, -1.0, cg->g_work, cg->d_work));
50b47da0SAdam Denchfield      }
c8bcdf1eSAdam Denchfield      break;
484c7b14SAdam Denchfield
*d6e07cdcSHong Zhang    case TAO_BNCG_HZ:
484c7b14SAdam Denchfield      /* Hager, William W., and Hongchao Zhang. "Algorithm 851: CG_DESCENT, a conjugate gradient method with guaranteed descent."
484c7b14SAdam Denchfield         ACM Transactions on Mathematical Software (TOMS) 32, no. 1 (2006): 113-137. */
9566063dSJacob Faibussowitsch      PetscCall(VecDot(tao->gradient, tao->stepdirection, &gd));
9566063dSJacob Faibussowitsch      PetscCall(VecDot(cg->G_old, tao->stepdirection, &gd_old));
9566063dSJacob Faibussowitsch      PetscCall(VecWAXPY(cg->sk, -1.0, cg->X_old, tao->solution));
50b47da0SAdam Denchfield      snorm   = dnorm * step;
50b47da0SAdam Denchfield      cg->yts = step * dk_yk;
48a46eb9SPierre Jolivet      if (cg->use_dynamic_restart) PetscCall(TaoBNCGCheckDynamicRestart(tao, step, gd, gd_old, &cg->dynamic_restart, fold));
50b47da0SAdam Denchfield      if (cg->dynamic_restart) {
9566063dSJacob Faibussowitsch        PetscCall(TaoBNCGResetUpdate(tao, gnorm2));
c8bcdf1eSAdam Denchfield      } else {
c8bcdf1eSAdam Denchfield        if (!cg->diag_scaling) {
9566063dSJacob Faibussowitsch          PetscCall(VecDot(cg->yk, tao->gradient, &gkp1_yk));
9566063dSJacob Faibussowitsch          PetscCall(TaoBNCGComputeScalarScaling(ynorm2, cg->yts, snorm * snorm, &tau_k, cg->alpha));
c8bcdf1eSAdam Denchfield          /* Supplying cg->alpha = -1.0 will give the CG_DESCENT 5.3 special case of tau_k = 1.0 */
c8bcdf1eSAdam Denchfield          tmp  = gd / dk_yk;
c8bcdf1eSAdam Denchfield          beta = tau_k * (gkp1_yk / dk_yk - ynorm2 * gd / (dk_yk * dk_yk));
c8bcdf1eSAdam Denchfield          /* Bound beta as in CG_DESCENT 5.3, as implemented, with the third comparison from DK 2013 */
50b47da0SAdam Denchfield          beta = PetscMax(PetscMax(beta, cg->hz_eta * tau_k * gd_old / (dnorm * dnorm)), cg->dk_eta * tau_k * gd / (dnorm * dnorm));
c8bcdf1eSAdam Denchfield          /* d <- -t*g + beta*t*d */
9566063dSJacob Faibussowitsch          PetscCall(VecAXPBY(tao->stepdirection, -tau_k, beta, tao->gradient));
c8bcdf1eSAdam Denchfield        } else {
c8bcdf1eSAdam Denchfield          /* We have diagonal scaling enabled and are taking a diagonally-scaled memoryless BFGS step */
c8bcdf1eSAdam Denchfield          cg->yty = ynorm2;
c8bcdf1eSAdam Denchfield          cg->sts = snorm * snorm;
50b47da0SAdam Denchfield          /* Apply the diagonal scaling to all my vectors */
9566063dSJacob Faibussowitsch          PetscCall(MatSolve(cg->B, tao->gradient, cg->g_work));
9566063dSJacob Faibussowitsch          PetscCall(MatSolve(cg->B, cg->yk, cg->y_work));
9566063dSJacob Faibussowitsch          PetscCall(MatSolve(cg->B, tao->stepdirection, cg->d_work));
c8bcdf1eSAdam Denchfield          /* Construct the constant ytDgkp1 */
9566063dSJacob Faibussowitsch          PetscCall(VecDot(cg->yk, cg->g_work, &gkp1_yk));
c8bcdf1eSAdam Denchfield          /* Construct the constant for scaling Dkyk in the update */
c8bcdf1eSAdam Denchfield          tmp = gd / dk_yk;
9566063dSJacob Faibussowitsch          PetscCall(VecDot(cg->yk, cg->y_work, &tau_k));
c8bcdf1eSAdam Denchfield          tau_k = -tau_k * gd / (dk_yk * dk_yk);
c8bcdf1eSAdam Denchfield          /* beta is the constant which adds the dk contribution */
484c7b14SAdam Denchfield          beta = gkp1_yk / dk_yk + cg->hz_theta * tau_k; /* HZ; (1.15) from DK 2013 */
c8bcdf1eSAdam Denchfield          /* From HZ2013, modified to account for diagonal scaling*/
9566063dSJacob Faibussowitsch          PetscCall(VecDot(cg->G_old, cg->d_work, &gd_old));
9566063dSJacob Faibussowitsch          PetscCall(VecDot(tao->stepdirection, cg->g_work, &gd));
50b47da0SAdam Denchfield          beta = PetscMax(PetscMax(beta, cg->hz_eta * gd_old / (dnorm * dnorm)), cg->dk_eta * gd / (dnorm * dnorm));
c8bcdf1eSAdam Denchfield          /* Do the update */
9566063dSJacob Faibussowitsch          PetscCall(VecAXPBY(tao->stepdirection, -1.0, beta, cg->g_work));
50b47da0SAdam Denchfield        }
50b47da0SAdam Denchfield      }
c8bcdf1eSAdam Denchfield      break;
484c7b14SAdam Denchfield
*d6e07cdcSHong Zhang    case TAO_BNCG_DK:
484c7b14SAdam Denchfield      /* Dai, Yu-Hong, and Cai-Xia Kou. "A nonlinear conjugate gradient algorithm with an optimal property and an improved Wolfe line search."
484c7b14SAdam Denchfield         SIAM Journal on Optimization 23, no. 1 (2013): 296-320. */
9566063dSJacob Faibussowitsch      PetscCall(VecDot(tao->gradient, tao->stepdirection, &gd));
9566063dSJacob Faibussowitsch      PetscCall(VecDot(cg->G_old, tao->stepdirection, &gd_old));
9566063dSJacob Faibussowitsch      PetscCall(VecWAXPY(cg->sk, -1.0, cg->X_old, tao->solution));
50b47da0SAdam Denchfield      snorm   = step * dnorm;
50b47da0SAdam Denchfield      cg->yts = dk_yk * step;
c8bcdf1eSAdam Denchfield      if (!cg->diag_scaling) {
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->yk, tao->gradient, &gkp1_yk));
9566063dSJacob Faibussowitsch        PetscCall(TaoBNCGComputeScalarScaling(ynorm2, cg->yts, snorm * snorm, &tau_k, cg->alpha));
c8bcdf1eSAdam Denchfield        /* Use cg->alpha = -1.0 to get tau_k = 1.0 as in CG_DESCENT 5.3 */
c8bcdf1eSAdam Denchfield        tmp  = gd / dk_yk;
50b47da0SAdam Denchfield        beta = tau_k * (gkp1_yk / dk_yk - ynorm2 * gd / (dk_yk * dk_yk) + gd / (dnorm * dnorm)) - step * gd / dk_yk;
50b47da0SAdam Denchfield        beta = PetscMax(PetscMax(beta, cg->hz_eta * tau_k * gd_old / (dnorm * dnorm)), cg->dk_eta * tau_k * gd / (dnorm * dnorm));
c8bcdf1eSAdam Denchfield        /* d <- -t*g + beta*t*d */
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBYPCZ(tao->stepdirection, -tau_k, 0.0, beta, tao->gradient, cg->yk));
c8bcdf1eSAdam Denchfield      } else {
c8bcdf1eSAdam Denchfield        /* We have diagonal scaling enabled and are taking a diagonally-scaled memoryless BFGS step */
c8bcdf1eSAdam Denchfield        cg->yty = ynorm2;
c8bcdf1eSAdam Denchfield        cg->sts = snorm * snorm;
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(cg->B, tao->gradient, cg->g_work));
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(cg->B, cg->yk, cg->y_work));
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(cg->B, tao->stepdirection, cg->d_work));
c8bcdf1eSAdam Denchfield        /* Construct the constant ytDgkp1 */
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->yk, cg->g_work, &gkp1_yk));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->yk, cg->y_work, &tau_k));
c8bcdf1eSAdam Denchfield        tau_k = tau_k * gd / (dk_yk * dk_yk);
c8bcdf1eSAdam Denchfield        tmp   = gd / dk_yk;
c8bcdf1eSAdam Denchfield        /* beta is the constant which adds the dk contribution */
484c7b14SAdam Denchfield        beta = gkp1_yk / dk_yk - step * tmp - tau_k;
c8bcdf1eSAdam Denchfield        /* Update this for the last term in beta */
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->y_work, tao->stepdirection, &dk_yk));
c8bcdf1eSAdam Denchfield        beta += tmp * dk_yk / (dnorm * dnorm); /* projection of y_work onto dk */
9566063dSJacob Faibussowitsch        PetscCall(VecDot(tao->stepdirection, cg->g_work, &gd));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->G_old, cg->d_work, &gd_old));
50b47da0SAdam Denchfield        beta = PetscMax(PetscMax(beta, cg->hz_eta * gd_old / (dnorm * dnorm)), cg->dk_eta * gd / (dnorm * dnorm));
c8bcdf1eSAdam Denchfield        /* Do the update */
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBY(tao->stepdirection, -1.0, beta, cg->g_work));
50b47da0SAdam Denchfield      }
c8bcdf1eSAdam Denchfield      break;
484c7b14SAdam Denchfield
*d6e07cdcSHong Zhang    case TAO_BNCG_KD:
110fc3b0SBarry Smith      /* Kou, Cai-Xia, and Yu-Hong Dai. "A modified self-scaling memoryless Broyden-Fletcher-Goldfarb-Shanno method for unconstrained optimization."
484c7b14SAdam Denchfield         Journal of Optimization Theory and Applications 165, no. 1 (2015): 209-224. */
9566063dSJacob Faibussowitsch      PetscCall(VecDot(tao->gradient, tao->stepdirection, &gd));
9566063dSJacob Faibussowitsch      PetscCall(VecDot(cg->G_old, tao->stepdirection, &gd_old));
9566063dSJacob Faibussowitsch      PetscCall(VecWAXPY(cg->sk, -1.0, cg->X_old, tao->solution));
50b47da0SAdam Denchfield      snorm   = step * dnorm;
50b47da0SAdam Denchfield      cg->yts = dk_yk * step;
48a46eb9SPierre Jolivet      if (cg->use_dynamic_restart) PetscCall(TaoBNCGCheckDynamicRestart(tao, step, gd, gd_old, &cg->dynamic_restart, fold));
50b47da0SAdam Denchfield      if (cg->dynamic_restart) {
9566063dSJacob Faibussowitsch        PetscCall(TaoBNCGResetUpdate(tao, gnorm2));
c8bcdf1eSAdam Denchfield      } else {
c8bcdf1eSAdam Denchfield        if (!cg->diag_scaling) {
9566063dSJacob Faibussowitsch          PetscCall(VecDot(cg->yk, tao->gradient, &gkp1_yk));
9566063dSJacob Faibussowitsch          PetscCall(TaoBNCGComputeScalarScaling(ynorm2, cg->yts, snorm * snorm, &tau_k, cg->alpha));
c8bcdf1eSAdam Denchfield          beta = tau_k * (gkp1_yk / dk_yk - ynorm2 * gd / (dk_yk * dk_yk)) - step * gd / dk_yk;
c8bcdf1eSAdam Denchfield          if (beta < cg->zeta * tau_k * gd / (dnorm * dnorm)) /* 0.1 is KD's zeta parameter */
c8bcdf1eSAdam Denchfield          {
c8bcdf1eSAdam Denchfield            beta  = cg->zeta * tau_k * gd / (dnorm * dnorm);
c8bcdf1eSAdam Denchfield            gamma = 0.0;
c8bcdf1eSAdam Denchfield          } else {
c8bcdf1eSAdam Denchfield            if (gkp1_yk < 0 && cg->neg_xi) gamma = -1.0 * gd / dk_yk;
484c7b14SAdam Denchfield            /* This seems to be very effective when there's no tau_k scaling.
484c7b14SAdam Denchfield               This guarantees a large descent step every iteration, going through DK 2015 Lemma 3.1's proof but allowing for negative xi */
ad540459SPierre Jolivet            else gamma = cg->xi * gd / dk_yk;
c8bcdf1eSAdam Denchfield          }
c8bcdf1eSAdam Denchfield          /* d <- -t*g + beta*t*d + t*tmp*yk */
9566063dSJacob Faibussowitsch          PetscCall(VecAXPBYPCZ(tao->stepdirection, -tau_k, gamma * tau_k, beta, tao->gradient, cg->yk));
c8bcdf1eSAdam Denchfield        } else {
c8bcdf1eSAdam Denchfield          /* We have diagonal scaling enabled and are taking a diagonally-scaled memoryless BFGS step */
c8bcdf1eSAdam Denchfield          cg->yty = ynorm2;
c8bcdf1eSAdam Denchfield          cg->sts = snorm * snorm;
9566063dSJacob Faibussowitsch          PetscCall(MatSolve(cg->B, tao->gradient, cg->g_work));
9566063dSJacob Faibussowitsch          PetscCall(MatSolve(cg->B, cg->yk, cg->y_work));
c8bcdf1eSAdam Denchfield          /* Construct the constant ytDgkp1 */
9566063dSJacob Faibussowitsch          PetscCall(VecDot(cg->yk, cg->g_work, &gkp1D_yk));
c8bcdf1eSAdam Denchfield          /* Construct the constant for scaling Dkyk in the update */
c8bcdf1eSAdam Denchfield          gamma = gd / dk_yk;
c8bcdf1eSAdam Denchfield          /* tau_k = -ytDy/(ytd)^2 * gd */
9566063dSJacob Faibussowitsch          PetscCall(VecDot(cg->yk, cg->y_work, &tau_k));
c8bcdf1eSAdam Denchfield          tau_k = tau_k * gd / (dk_yk * dk_yk);
c8bcdf1eSAdam Denchfield          /* beta is the constant which adds the d_k contribution */
c8bcdf1eSAdam Denchfield          beta = gkp1D_yk / dk_yk - step * gamma - tau_k;
c8bcdf1eSAdam Denchfield          /* Here is the requisite check */
9566063dSJacob Faibussowitsch          PetscCall(VecDot(tao->stepdirection, cg->g_work, &tmp));
c8bcdf1eSAdam Denchfield          if (cg->neg_xi) {
c8bcdf1eSAdam Denchfield            /* modified KD implementation */
c8bcdf1eSAdam Denchfield            if (gkp1D_yk / dk_yk < 0) gamma = -1.0 * gd / dk_yk;
ad540459SPierre Jolivet            else gamma = cg->xi * gd / dk_yk;
c8bcdf1eSAdam Denchfield            if (beta < cg->zeta * tmp / (dnorm * dnorm)) {
c8bcdf1eSAdam Denchfield              beta  = cg->zeta * tmp / (dnorm * dnorm);
c8bcdf1eSAdam Denchfield              gamma = 0.0;
c8bcdf1eSAdam Denchfield            }
c8bcdf1eSAdam Denchfield          } else { /* original KD 2015 implementation */
c8bcdf1eSAdam Denchfield            if (beta < cg->zeta * tmp / (dnorm * dnorm)) {
c8bcdf1eSAdam Denchfield              beta  = cg->zeta * tmp / (dnorm * dnorm);
c8bcdf1eSAdam Denchfield              gamma = 0.0;
ad540459SPierre Jolivet            } else gamma = cg->xi * gd / dk_yk;
c8bcdf1eSAdam Denchfield          }
c8bcdf1eSAdam Denchfield          /* Do the update in two steps */
9566063dSJacob Faibussowitsch          PetscCall(VecAXPBY(tao->stepdirection, -1.0, beta, cg->g_work));
9566063dSJacob Faibussowitsch          PetscCall(VecAXPY(tao->stepdirection, gamma, cg->y_work));
50b47da0SAdam Denchfield        }
50b47da0SAdam Denchfield      }
c8bcdf1eSAdam Denchfield      break;
484c7b14SAdam Denchfield
*d6e07cdcSHong Zhang    case TAO_BNCG_SSML_BFGS:
484c7b14SAdam Denchfield      /* Perry, J. M. "A class of conjugate gradient algorithms with a two-step variable-metric memory."
484c7b14SAdam Denchfield         Discussion Papers 269 (1977). */
9566063dSJacob Faibussowitsch      PetscCall(VecDot(tao->gradient, tao->stepdirection, &gd));
9566063dSJacob Faibussowitsch      PetscCall(VecWAXPY(cg->sk, -1.0, cg->X_old, tao->solution));
484c7b14SAdam Denchfield      snorm   = step * dnorm;
484c7b14SAdam Denchfield      cg->yts = dk_yk * step;
484c7b14SAdam Denchfield      cg->yty = ynorm2;
484c7b14SAdam Denchfield      cg->sts = snorm * snorm;
484c7b14SAdam Denchfield      if (!cg->diag_scaling) {
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->yk, tao->gradient, &gkp1_yk));
9566063dSJacob Faibussowitsch        PetscCall(TaoBNCGComputeScalarScaling(cg->yty, cg->yts, cg->sts, &tau_k, cg->alpha));
484c7b14SAdam Denchfield        tmp  = gd / dk_yk;
484c7b14SAdam Denchfield        beta = tau_k * (gkp1_yk / dk_yk - cg->yty * gd / (dk_yk * dk_yk)) - step * tmp;
484c7b14SAdam Denchfield        /* d <- -t*g + beta*t*d + t*tmp*yk */
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBYPCZ(tao->stepdirection, -tau_k, tmp * tau_k, beta, tao->gradient, cg->yk));
484c7b14SAdam Denchfield      } else {
484c7b14SAdam Denchfield        /* We have diagonal scaling enabled and are taking a diagonally-scaled memoryless BFGS step */
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(cg->B, tao->gradient, cg->g_work));
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(cg->B, cg->yk, cg->y_work));
484c7b14SAdam Denchfield        /* compute scalar gamma */
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->g_work, cg->yk, &gkp1_yk));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->y_work, cg->yk, &tmp));
484c7b14SAdam Denchfield        gamma = gd / dk_yk;
484c7b14SAdam Denchfield        /* Compute scalar beta */
484c7b14SAdam Denchfield        beta = (gkp1_yk / dk_yk - gd * tmp / (dk_yk * dk_yk)) - step * gd / dk_yk;
484c7b14SAdam Denchfield        /* Compute stepdirection d_kp1 = gamma*Dkyk + beta*dk - Dkgkp1 */
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBYPCZ(tao->stepdirection, -1.0, gamma, beta, cg->g_work, cg->y_work));
484c7b14SAdam Denchfield      }
484c7b14SAdam Denchfield      break;
484c7b14SAdam Denchfield
*d6e07cdcSHong Zhang    case TAO_BNCG_SSML_DFP:
9566063dSJacob Faibussowitsch      PetscCall(VecDot(tao->gradient, tao->stepdirection, &gd));
9566063dSJacob Faibussowitsch      PetscCall(VecWAXPY(cg->sk, -1.0, cg->X_old, tao->solution));
484c7b14SAdam Denchfield      snorm   = step * dnorm;
484c7b14SAdam Denchfield      cg->yts = dk_yk * step;
484c7b14SAdam Denchfield      cg->yty = ynorm2;
484c7b14SAdam Denchfield      cg->sts = snorm * snorm;
484c7b14SAdam Denchfield      if (!cg->diag_scaling) {
484c7b14SAdam Denchfield        /* Instead of a regular convex combination, we will solve a quadratic formula. */
9566063dSJacob Faibussowitsch        PetscCall(TaoBNCGComputeScalarScaling(cg->yty, cg->yts, cg->sts, &tau_k, cg->alpha));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->yk, tao->gradient, &gkp1_yk));
484c7b14SAdam Denchfield        tau_k = cg->dfp_scale * tau_k;
484c7b14SAdam Denchfield        tmp   = tau_k * gkp1_yk / cg->yty;
484c7b14SAdam Denchfield        beta  = -step * gd / dk_yk;
484c7b14SAdam Denchfield        /* d <- -t*g + beta*d + tmp*yk */
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBYPCZ(tao->stepdirection, -tau_k, tmp, beta, tao->gradient, cg->yk));
484c7b14SAdam Denchfield      } else {
484c7b14SAdam Denchfield        /* We have diagonal scaling enabled and are taking a diagonally-scaled memoryless DFP step */
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(cg->B, tao->gradient, cg->g_work));
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(cg->B, cg->yk, cg->y_work));
484c7b14SAdam Denchfield        /* compute scalar gamma */
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->g_work, cg->yk, &gkp1_yk));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->y_work, cg->yk, &tmp));
484c7b14SAdam Denchfield        gamma = (gkp1_yk / tmp);
484c7b14SAdam Denchfield        /* Compute scalar beta */
484c7b14SAdam Denchfield        beta = -step * gd / dk_yk;
484c7b14SAdam Denchfield        /* Compute stepdirection d_kp1 = gamma*Dkyk + beta*dk - Dkgkp1 */
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBYPCZ(tao->stepdirection, -1.0, gamma, beta, cg->g_work, cg->y_work));
484c7b14SAdam Denchfield      }
484c7b14SAdam Denchfield      break;
484c7b14SAdam Denchfield
*d6e07cdcSHong Zhang    case TAO_BNCG_SSML_BRDN:
9566063dSJacob Faibussowitsch      PetscCall(VecDot(tao->gradient, tao->stepdirection, &gd));
9566063dSJacob Faibussowitsch      PetscCall(VecWAXPY(cg->sk, -1.0, cg->X_old, tao->solution));
484c7b14SAdam Denchfield      snorm   = step * dnorm;
484c7b14SAdam Denchfield      cg->yts = step * dk_yk;
484c7b14SAdam Denchfield      cg->yty = ynorm2;
484c7b14SAdam Denchfield      cg->sts = snorm * snorm;
484c7b14SAdam Denchfield      if (!cg->diag_scaling) {
484c7b14SAdam Denchfield        /* Instead of a regular convex combination, we will solve a quadratic formula. */
9566063dSJacob Faibussowitsch        PetscCall(TaoBNCGComputeScalarScaling(cg->yty, step * dk_yk, snorm * snorm, &tau_bfgs, cg->bfgs_scale));
9566063dSJacob Faibussowitsch        PetscCall(TaoBNCGComputeScalarScaling(cg->yty, step * dk_yk, snorm * snorm, &tau_dfp, cg->dfp_scale));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->yk, tao->gradient, &gkp1_yk));
484c7b14SAdam Denchfield        tau_k = cg->theta * tau_bfgs + (1.0 - cg->theta) * tau_dfp;
484c7b14SAdam Denchfield        /* If bfgs_scale = 1.0, it should reproduce the bfgs tau_bfgs. If bfgs_scale = 0.0,
484c7b14SAdam Denchfield           it should reproduce the tau_dfp scaling. Same with dfp_scale.   */
484c7b14SAdam Denchfield        tmp  = cg->theta * tau_bfgs * gd / dk_yk + (1 - cg->theta) * tau_dfp * gkp1_yk / cg->yty;
484c7b14SAdam Denchfield        beta = cg->theta * tau_bfgs * (gkp1_yk / dk_yk - cg->yty * gd / (dk_yk * dk_yk)) - step * gd / dk_yk;
484c7b14SAdam Denchfield        /* d <- -t*g + beta*d + tmp*yk */
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBYPCZ(tao->stepdirection, -tau_k, tmp, beta, tao->gradient, cg->yk));
484c7b14SAdam Denchfield      } else {
484c7b14SAdam Denchfield        /* We have diagonal scaling enabled */
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(cg->B, tao->gradient, cg->g_work));
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(cg->B, cg->yk, cg->y_work));
484c7b14SAdam Denchfield        /* compute scalar gamma */
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->g_work, cg->yk, &gkp1_yk));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->y_work, cg->yk, &tmp));
484c7b14SAdam Denchfield        gamma = cg->theta * gd / dk_yk + (1 - cg->theta) * (gkp1_yk / tmp);
484c7b14SAdam Denchfield        /* Compute scalar beta */
484c7b14SAdam Denchfield        beta = cg->theta * (gkp1_yk / dk_yk - gd * tmp / (dk_yk * dk_yk)) - step * gd / dk_yk;
484c7b14SAdam Denchfield        /* Compute stepdirection dkp1 = gamma*Dkyk + beta*dk - Dkgkp1 */
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBYPCZ(tao->stepdirection, -1.0, gamma, beta, cg->g_work, cg->y_work));
484c7b14SAdam Denchfield      }
484c7b14SAdam Denchfield      break;
484c7b14SAdam Denchfield
d71ae5a4SJacob Faibussowitsch    default:
d71ae5a4SJacob Faibussowitsch      break;
c8bcdf1eSAdam Denchfield    }
c8bcdf1eSAdam Denchfield  }
3ba16761SJacob Faibussowitsch  PetscFunctionReturn(PETSC_SUCCESS);
c8bcdf1eSAdam Denchfield}
c8bcdf1eSAdam Denchfield
d71ae5a4SJacob FaibussowitschPETSC_INTERN PetscErrorCode TaoBNCGConductIteration(Tao tao, PetscReal gnorm)
d71ae5a4SJacob Faibussowitsch{
c8bcdf1eSAdam Denchfield  TAO_BNCG                    *cg        = (TAO_BNCG *)tao->data;
c8bcdf1eSAdam Denchfield  TaoLineSearchConvergedReason ls_status = TAOLINESEARCH_CONTINUE_ITERATING;
8ca2df50S  PetscReal                    step = 1.0, gnorm2, gd, dnorm = 0.0;
c8bcdf1eSAdam Denchfield  PetscReal                    gnorm2_old, f_old, resnorm, gnorm_old;
c624ebd3SAlp Dener  PetscBool                    pcgd_fallback = PETSC_FALSE;
c8bcdf1eSAdam Denchfield
c8bcdf1eSAdam Denchfield  PetscFunctionBegin;
c8bcdf1eSAdam Denchfield  /* We are now going to perform a line search along the direction. */
c8bcdf1eSAdam Denchfield  /* Store solution and gradient info before it changes */
9566063dSJacob Faibussowitsch  PetscCall(VecCopy(tao->solution, cg->X_old));
9566063dSJacob Faibussowitsch  PetscCall(VecCopy(tao->gradient, cg->G_old));
9566063dSJacob Faibussowitsch  PetscCall(VecCopy(cg->unprojected_gradient, cg->unprojected_gradient_old));
c8bcdf1eSAdam Denchfield
c8bcdf1eSAdam Denchfield  gnorm_old  = gnorm;
c8bcdf1eSAdam Denchfield  gnorm2_old = gnorm_old * gnorm_old;
c8bcdf1eSAdam Denchfield  f_old      = cg->f;
484c7b14SAdam Denchfield  /* Perform bounded line search. If we are recycling a solution from a previous */
484c7b14SAdam Denchfield  /* TaoSolve, then we want to immediately skip to calculating a new direction rather than performing a linesearch */
414d97d3SAlp Dener  if (!(tao->recycle && 0 == tao->niter)) {
484c7b14SAdam Denchfield    /* Above logic: the below code happens every iteration, except for the first iteration of a recycled TaoSolve */
9566063dSJacob Faibussowitsch    PetscCall(TaoLineSearchSetInitialStepLength(tao->linesearch, 1.0));
9566063dSJacob Faibussowitsch    PetscCall(TaoLineSearchApply(tao->linesearch, tao->solution, &cg->f, cg->unprojected_gradient, tao->stepdirection, &step, &ls_status));
9566063dSJacob Faibussowitsch    PetscCall(TaoAddLineSearchCounts(tao));
c8bcdf1eSAdam Denchfield
c8bcdf1eSAdam Denchfield    /*  Check linesearch failure */
c8bcdf1eSAdam Denchfield    if (ls_status != TAOLINESEARCH_SUCCESS && ls_status != TAOLINESEARCH_SUCCESS_USER) {
c8bcdf1eSAdam Denchfield      ++cg->ls_fails;
*d6e07cdcSHong Zhang      if (cg->cg_type == TAO_BNCG_GD) {
c8bcdf1eSAdam Denchfield        /* Nothing left to do but fail out of the optimization */
c8bcdf1eSAdam Denchfield        step        = 0.0;
c8bcdf1eSAdam Denchfield        tao->reason = TAO_DIVERGED_LS_FAILURE;
c8bcdf1eSAdam Denchfield      } else {
484c7b14SAdam Denchfield        /* Restore previous point, perform preconditioned GD and regular GD steps at the last good point */
9566063dSJacob Faibussowitsch        PetscCall(VecCopy(cg->X_old, tao->solution));
9566063dSJacob Faibussowitsch        PetscCall(VecCopy(cg->G_old, tao->gradient));
9566063dSJacob Faibussowitsch        PetscCall(VecCopy(cg->unprojected_gradient_old, cg->unprojected_gradient));
c8bcdf1eSAdam Denchfield        gnorm  = gnorm_old;
c8bcdf1eSAdam Denchfield        gnorm2 = gnorm2_old;
c8bcdf1eSAdam Denchfield        cg->f  = f_old;
c8bcdf1eSAdam Denchfield
484c7b14SAdam Denchfield        /* Fall back on preconditioned CG (so long as you're not already using it) */
*d6e07cdcSHong Zhang        if (cg->cg_type != TAO_BNCG_PCGD && cg->diag_scaling) {
e2570530SAlp Dener          pcgd_fallback = PETSC_TRUE;
9566063dSJacob Faibussowitsch          PetscCall(TaoBNCGStepDirectionUpdate(tao, gnorm2, step, f_old, gnorm2_old, dnorm, pcgd_fallback));
484c7b14SAdam Denchfield
9566063dSJacob Faibussowitsch          PetscCall(TaoBNCGResetUpdate(tao, gnorm2));
9566063dSJacob Faibussowitsch          PetscCall(TaoBNCGBoundStep(tao, cg->as_type, tao->stepdirection));
c8bcdf1eSAdam Denchfield
9566063dSJacob Faibussowitsch          PetscCall(TaoLineSearchSetInitialStepLength(tao->linesearch, 1.0));
9566063dSJacob Faibussowitsch          PetscCall(TaoLineSearchApply(tao->linesearch, tao->solution, &cg->f, cg->unprojected_gradient, tao->stepdirection, &step, &ls_status));
9566063dSJacob Faibussowitsch          PetscCall(TaoAddLineSearchCounts(tao));
c8bcdf1eSAdam Denchfield
484c7b14SAdam Denchfield          pcgd_fallback = PETSC_FALSE;
484c7b14SAdam Denchfield          if (ls_status != TAOLINESEARCH_SUCCESS && ls_status != TAOLINESEARCH_SUCCESS_USER) {
484c7b14SAdam Denchfield            /* Going to perform a regular gradient descent step. */
484c7b14SAdam Denchfield            ++cg->ls_fails;
484c7b14SAdam Denchfield            step = 0.0;
484c7b14SAdam Denchfield          }
484c7b14SAdam Denchfield        }
484c7b14SAdam Denchfield        /* Fall back on the scaled gradient step */
484c7b14SAdam Denchfield        if (ls_status != TAOLINESEARCH_SUCCESS && ls_status != TAOLINESEARCH_SUCCESS_USER) {
484c7b14SAdam Denchfield          ++cg->ls_fails;
9566063dSJacob Faibussowitsch          PetscCall(TaoBNCGResetUpdate(tao, gnorm2));
9566063dSJacob Faibussowitsch          PetscCall(TaoBNCGBoundStep(tao, cg->as_type, tao->stepdirection));
9566063dSJacob Faibussowitsch          PetscCall(TaoLineSearchSetInitialStepLength(tao->linesearch, 1.0));
9566063dSJacob Faibussowitsch          PetscCall(TaoLineSearchApply(tao->linesearch, tao->solution, &cg->f, cg->unprojected_gradient, tao->stepdirection, &step, &ls_status));
9566063dSJacob Faibussowitsch          PetscCall(TaoAddLineSearchCounts(tao));
484c7b14SAdam Denchfield        }
484c7b14SAdam Denchfield
c8bcdf1eSAdam Denchfield        if (ls_status != TAOLINESEARCH_SUCCESS && ls_status != TAOLINESEARCH_SUCCESS_USER) {
c8bcdf1eSAdam Denchfield          /* Nothing left to do but fail out of the optimization */
50b47da0SAdam Denchfield          ++cg->ls_fails;
c8bcdf1eSAdam Denchfield          step        = 0.0;
c8bcdf1eSAdam Denchfield          tao->reason = TAO_DIVERGED_LS_FAILURE;
484c7b14SAdam Denchfield        } else {
484c7b14SAdam Denchfield          /* One of the fallbacks worked. Set them both back equal to false. */
484c7b14SAdam Denchfield          pcgd_fallback = PETSC_FALSE;
c8bcdf1eSAdam Denchfield        }
c8bcdf1eSAdam Denchfield      }
c8bcdf1eSAdam Denchfield    }
c8bcdf1eSAdam Denchfield    /* Convergence test for line search failure */
3ba16761SJacob Faibussowitsch    if (tao->reason != TAO_CONTINUE_ITERATING) PetscFunctionReturn(PETSC_SUCCESS);
c8bcdf1eSAdam Denchfield
c8bcdf1eSAdam Denchfield    /* Standard convergence test */
9566063dSJacob Faibussowitsch    PetscCall(VecFischer(tao->solution, cg->unprojected_gradient, tao->XL, tao->XU, cg->W));
9566063dSJacob Faibussowitsch    PetscCall(VecNorm(cg->W, NORM_2, &resnorm));
3c859ba3SBarry Smith    PetscCheck(!PetscIsInfOrNanReal(resnorm), PetscObjectComm((PetscObject)tao), PETSC_ERR_USER, "User provided compute function generated Inf or NaN");
9566063dSJacob Faibussowitsch    PetscCall(TaoLogConvergenceHistory(tao, cg->f, resnorm, 0.0, tao->ksp_its));
9566063dSJacob Faibussowitsch    PetscCall(TaoMonitor(tao, tao->niter, cg->f, resnorm, 0.0, step));
dbbe0bcdSBarry Smith    PetscUseTypeMethod(tao, convergencetest, tao->cnvP);
3ba16761SJacob Faibussowitsch    if (tao->reason != TAO_CONTINUE_ITERATING) PetscFunctionReturn(PETSC_SUCCESS);
484c7b14SAdam Denchfield  }
c8bcdf1eSAdam Denchfield  /* Assert we have an updated step and we need at least one more iteration. */
c8bcdf1eSAdam Denchfield  /* Calculate the next direction */
c8bcdf1eSAdam Denchfield  /* Estimate the active set at the new solution */
9566063dSJacob Faibussowitsch  PetscCall(TaoBNCGEstimateActiveSet(tao, cg->as_type));
c8bcdf1eSAdam Denchfield  /* Compute the projected gradient and its norm */
9566063dSJacob Faibussowitsch  PetscCall(VecCopy(cg->unprojected_gradient, tao->gradient));
9566063dSJacob Faibussowitsch  PetscCall(VecISSet(tao->gradient, cg->active_idx, 0.0));
9566063dSJacob Faibussowitsch  PetscCall(VecNorm(tao->gradient, NORM_2, &gnorm));
c8bcdf1eSAdam Denchfield  gnorm2 = gnorm * gnorm;
c8bcdf1eSAdam Denchfield
484c7b14SAdam Denchfield  /* Calculate some quantities used in the StepDirectionUpdate. */
9566063dSJacob Faibussowitsch  PetscCall(VecNorm(tao->stepdirection, NORM_2, &dnorm));
484c7b14SAdam Denchfield  /* Update the step direction. */
9566063dSJacob Faibussowitsch  PetscCall(TaoBNCGStepDirectionUpdate(tao, gnorm2, step, f_old, gnorm2_old, dnorm, pcgd_fallback));
484c7b14SAdam Denchfield  ++tao->niter;
9566063dSJacob Faibussowitsch  PetscCall(TaoBNCGBoundStep(tao, cg->as_type, tao->stepdirection));
c8bcdf1eSAdam Denchfield
*d6e07cdcSHong Zhang  if (cg->cg_type != TAO_BNCG_GD) {
c8bcdf1eSAdam Denchfield    /* Figure out which previously active variables became inactive this iteration */
9566063dSJacob Faibussowitsch    PetscCall(ISDestroy(&cg->new_inactives));
48a46eb9SPierre Jolivet    if (cg->inactive_idx && cg->inactive_old) PetscCall(ISDifference(cg->inactive_idx, cg->inactive_old, &cg->new_inactives));
c8bcdf1eSAdam Denchfield    /* Selectively reset the CG step those freshly inactive variables */
c8bcdf1eSAdam Denchfield    if (cg->new_inactives) {
9566063dSJacob Faibussowitsch      PetscCall(VecGetSubVector(tao->stepdirection, cg->new_inactives, &cg->inactive_step));
9566063dSJacob Faibussowitsch      PetscCall(VecGetSubVector(cg->unprojected_gradient, cg->new_inactives, &cg->inactive_grad));
9566063dSJacob Faibussowitsch      PetscCall(VecCopy(cg->inactive_grad, cg->inactive_step));
9566063dSJacob Faibussowitsch      PetscCall(VecScale(cg->inactive_step, -1.0));
9566063dSJacob Faibussowitsch      PetscCall(VecRestoreSubVector(tao->stepdirection, cg->new_inactives, &cg->inactive_step));
9566063dSJacob Faibussowitsch      PetscCall(VecRestoreSubVector(cg->unprojected_gradient, cg->new_inactives, &cg->inactive_grad));
c8bcdf1eSAdam Denchfield    }
c8bcdf1eSAdam Denchfield    /* Verify that this is a descent direction */
9566063dSJacob Faibussowitsch    PetscCall(VecDot(tao->gradient, tao->stepdirection, &gd));
9566063dSJacob Faibussowitsch    PetscCall(VecNorm(tao->stepdirection, NORM_2, &dnorm));
50b47da0SAdam Denchfield    if (PetscIsInfOrNanReal(gd) || (gd / (dnorm * dnorm) <= -1e10 || gd / (dnorm * dnorm) >= -1e-10)) {
c8bcdf1eSAdam Denchfield      /* Not a descent direction, so we reset back to projected gradient descent */
9566063dSJacob Faibussowitsch      PetscCall(TaoBNCGResetUpdate(tao, gnorm2));
9566063dSJacob Faibussowitsch      PetscCall(TaoBNCGBoundStep(tao, cg->as_type, tao->stepdirection));
c8bcdf1eSAdam Denchfield      ++cg->descent_error;
c8bcdf1eSAdam Denchfield    } else {
c8bcdf1eSAdam Denchfield    }
c8bcdf1eSAdam Denchfield  }
3ba16761SJacob Faibussowitsch  PetscFunctionReturn(PETSC_SUCCESS);
ac9112b8SAlp Dener}
484c7b14SAdam Denchfield
*d6e07cdcSHong ZhangPETSC_INTERN PetscErrorCode TaoBNCGSetH0(Tao tao, Mat H0)
d71ae5a4SJacob Faibussowitsch{
484c7b14SAdam Denchfield  TAO_BNCG *cg = (TAO_BNCG *)tao->data;
*d6e07cdcSHong Zhang  PetscBool same;
484c7b14SAdam Denchfield
484c7b14SAdam Denchfield  PetscFunctionBegin;
*d6e07cdcSHong Zhang  PetscCall(PetscObjectTypeCompare((PetscObject)tao, TAOBNCG, &same));
*d6e07cdcSHong Zhang  if (same) {
9566063dSJacob Faibussowitsch    PetscCall(PetscObjectReference((PetscObject)H0));
484c7b14SAdam Denchfield    cg->pc = H0;
*d6e07cdcSHong Zhang  }
*d6e07cdcSHong Zhang  PetscFunctionReturn(PETSC_SUCCESS);
*d6e07cdcSHong Zhang}
*d6e07cdcSHong Zhang
*d6e07cdcSHong Zhang/*@
*d6e07cdcSHong Zhang  TaoBNCGGetType - Return the type for the `TAOBNCG` solver
*d6e07cdcSHong Zhang
*d6e07cdcSHong Zhang  Input Parameter:
*d6e07cdcSHong Zhang. tao  - the `Tao` solver context
*d6e07cdcSHong Zhang
*d6e07cdcSHong Zhang  Output Parameter:
*d6e07cdcSHong Zhang. type - `TAOBNCG` type
*d6e07cdcSHong Zhang
*d6e07cdcSHong Zhang  Level: advanced
*d6e07cdcSHong Zhang
*d6e07cdcSHong Zhang.seealso: `Tao`, `TAOBNCG`, `TaoBNCGSetType()`, `TaoBNCGType`
*d6e07cdcSHong Zhang@*/
*d6e07cdcSHong ZhangPetscErrorCode TaoBNCGGetType(Tao tao, TaoBNCGType *type)
*d6e07cdcSHong Zhang{
*d6e07cdcSHong Zhang  TAO_BNCG *cg = (TAO_BNCG *)tao->data;
*d6e07cdcSHong Zhang  PetscBool same;
*d6e07cdcSHong Zhang
*d6e07cdcSHong Zhang  PetscFunctionBegin;
*d6e07cdcSHong Zhang  PetscCall(PetscObjectTypeCompare((PetscObject)tao, TAOBNCG, &same));
*d6e07cdcSHong Zhang  PetscCheck(same, PetscObjectComm((PetscObject)tao), PETSC_ERR_ARG_INCOMP, "TAO solver is not BNCG type");
*d6e07cdcSHong Zhang  *type = cg->cg_type;
*d6e07cdcSHong Zhang  PetscFunctionReturn(PETSC_SUCCESS);
*d6e07cdcSHong Zhang}
*d6e07cdcSHong Zhang
*d6e07cdcSHong Zhang/*@
*d6e07cdcSHong Zhang  TaoBNCGSetType - Set the type for the `TAOBNCG` solver
*d6e07cdcSHong Zhang
*d6e07cdcSHong Zhang  Input Parameters:
*d6e07cdcSHong Zhang+ tao  - the `Tao` solver context
*d6e07cdcSHong Zhang- type - `TAOBNCG` type
*d6e07cdcSHong Zhang
*d6e07cdcSHong Zhang  Level: advanced
*d6e07cdcSHong Zhang
*d6e07cdcSHong Zhang.seealso: `Tao`, `TAOBNCG`, `TaoBNCGGetType()`, `TaoBNCGType`
*d6e07cdcSHong Zhang@*/
*d6e07cdcSHong ZhangPetscErrorCode TaoBNCGSetType(Tao tao, TaoBNCGType type)
*d6e07cdcSHong Zhang{
*d6e07cdcSHong Zhang  TAO_BNCG *cg = (TAO_BNCG *)tao->data;
*d6e07cdcSHong Zhang  PetscBool same;
*d6e07cdcSHong Zhang
*d6e07cdcSHong Zhang  PetscFunctionBegin;
*d6e07cdcSHong Zhang  PetscCall(PetscObjectTypeCompare((PetscObject)tao, TAOBNCG, &same));
*d6e07cdcSHong Zhang  if (same) cg->cg_type = type;
3ba16761SJacob Faibussowitsch  PetscFunctionReturn(PETSC_SUCCESS);
484c7b14SAdam Denchfield}