impls/bncg/bncg.c

ac9112b8SAlp Dener#include <petsctaolinesearch.h>
414d97d3SAlp Dener#include <../src/tao/bound/impls/bncg/bncg.h> /*I "petsctao.h" I*/
50b47da0SAdam Denchfield#include <petscksp.h>
ac9112b8SAlp Dener
c8bcdf1eSAdam Denchfield#define CG_GradientDescent      0
c8bcdf1eSAdam Denchfield#define CG_HestenesStiefel      1
c8bcdf1eSAdam Denchfield#define CG_FletcherReeves       2
50b47da0SAdam Denchfield#define CG_PolakRibierePolyak   3
c8bcdf1eSAdam Denchfield#define CG_PolakRibierePlus     4
c8bcdf1eSAdam Denchfield#define CG_DaiYuan              5
c8bcdf1eSAdam Denchfield#define CG_HagerZhang           6
c8bcdf1eSAdam Denchfield#define CG_DaiKou               7
c8bcdf1eSAdam Denchfield#define CG_KouDai               8
c8bcdf1eSAdam Denchfield#define CG_SSML_BFGS            9
c8bcdf1eSAdam Denchfield#define CG_SSML_DFP             10
c8bcdf1eSAdam Denchfield#define CG_SSML_BROYDEN         11
484c7b14SAdam Denchfield#define CG_PCGradientDescent    12
484c7b14SAdam Denchfield#define CGTypes                 13
ac9112b8SAlp Dener
484c7b14SAdam Denchfieldstatic const char *CG_Table[64] = {"gd", "hs", "fr", "pr", "prp", "dy", "hz", "dk", "kd", "ssml_bfgs", "ssml_dfp", "ssml_brdn", "pcgd"};
ac9112b8SAlp Dener
61be54a6SAlp Dener#define CG_AS_NONE       0
61be54a6SAlp Dener#define CG_AS_BERTSEKAS  1
61be54a6SAlp Dener#define CG_AS_SIZE       2
ac9112b8SAlp Dener
61be54a6SAlp Denerstatic const char *CG_AS_TYPE[64] = {"none", "bertsekas"};
ac9112b8SAlp Dener
61be54a6SAlp DenerPetscErrorCode TaoBNCGEstimateActiveSet(Tao tao, PetscInt asType)
61be54a6SAlp Dener{
61be54a6SAlp Dener  TAO_BNCG                     *cg = (TAO_BNCG *)tao->data;
61be54a6SAlp Dener
61be54a6SAlp Dener  PetscFunctionBegin;
9566063dSJacob Faibussowitsch  PetscCall(ISDestroy(&cg->inactive_old));
61be54a6SAlp Dener  if (cg->inactive_idx) {
9566063dSJacob Faibussowitsch    PetscCall(ISDuplicate(cg->inactive_idx, &cg->inactive_old));
9566063dSJacob Faibussowitsch    PetscCall(ISCopy(cg->inactive_idx, cg->inactive_old));
61be54a6SAlp Dener  }
61be54a6SAlp Dener  switch (asType) {
61be54a6SAlp Dener  case CG_AS_NONE:
9566063dSJacob Faibussowitsch    PetscCall(ISDestroy(&cg->inactive_idx));
9566063dSJacob Faibussowitsch    PetscCall(VecWhichInactive(tao->XL, tao->solution, cg->unprojected_gradient, tao->XU, PETSC_TRUE, &cg->inactive_idx));
9566063dSJacob Faibussowitsch    PetscCall(ISDestroy(&cg->active_idx));
9566063dSJacob Faibussowitsch    PetscCall(ISComplementVec(cg->inactive_idx, tao->solution, &cg->active_idx));
61be54a6SAlp Dener    break;
61be54a6SAlp Dener
61be54a6SAlp Dener  case CG_AS_BERTSEKAS:
61be54a6SAlp Dener    /* Use gradient descent to estimate the active set */
9566063dSJacob Faibussowitsch    PetscCall(VecCopy(cg->unprojected_gradient, cg->W));
9566063dSJacob Faibussowitsch    PetscCall(VecScale(cg->W, -1.0));
d0609cedSBarry Smith    PetscCall(TaoEstimateActiveBounds(tao->solution, tao->XL, tao->XU, cg->unprojected_gradient, cg->W, cg->work, cg->as_step, &cg->as_tol,
d0609cedSBarry Smith                                      &cg->active_lower, &cg->active_upper, &cg->active_fixed, &cg->active_idx, &cg->inactive_idx));
c4b75bccSAlp Dener    break;
61be54a6SAlp Dener  default:
61be54a6SAlp Dener    break;
61be54a6SAlp Dener  }
61be54a6SAlp Dener  PetscFunctionReturn(0);
61be54a6SAlp Dener}
61be54a6SAlp Dener
a1318120SAlp DenerPetscErrorCode TaoBNCGBoundStep(Tao tao, PetscInt asType, Vec step)
61be54a6SAlp Dener{
61be54a6SAlp Dener  TAO_BNCG                     *cg = (TAO_BNCG *)tao->data;
61be54a6SAlp Dener
61be54a6SAlp Dener  PetscFunctionBegin;
a1318120SAlp Dener  switch (asType) {
61be54a6SAlp Dener  case CG_AS_NONE:
9566063dSJacob Faibussowitsch    PetscCall(VecISSet(step, cg->active_idx, 0.0));
61be54a6SAlp Dener    break;
61be54a6SAlp Dener
61be54a6SAlp Dener  case CG_AS_BERTSEKAS:
9566063dSJacob Faibussowitsch    PetscCall(TaoBoundStep(tao->solution, tao->XL, tao->XU, cg->active_lower, cg->active_upper, cg->active_fixed, 1.0, step));
61be54a6SAlp Dener    break;
61be54a6SAlp Dener
61be54a6SAlp Dener  default:
61be54a6SAlp Dener    break;
61be54a6SAlp Dener  }
61be54a6SAlp Dener  PetscFunctionReturn(0);
61be54a6SAlp Dener}
61be54a6SAlp Dener
ac9112b8SAlp Denerstatic PetscErrorCode TaoSolve_BNCG(Tao tao)
ac9112b8SAlp Dener{
ac9112b8SAlp Dener  TAO_BNCG                     *cg = (TAO_BNCG*)tao->data;
484c7b14SAdam Denchfield  PetscReal                    step=1.0,gnorm,gnorm2, resnorm;
c4b75bccSAlp Dener  PetscInt                     nDiff;
ac9112b8SAlp Dener
ac9112b8SAlp Dener  PetscFunctionBegin;
ac9112b8SAlp Dener  /*   Project the current point onto the feasible set */
9566063dSJacob Faibussowitsch  PetscCall(TaoComputeVariableBounds(tao));
9566063dSJacob Faibussowitsch  PetscCall(TaoLineSearchSetVariableBounds(tao->linesearch,tao->XL,tao->XU));
ac9112b8SAlp Dener
c8bcdf1eSAdam Denchfield  /* Project the initial point onto the feasible region */
9566063dSJacob Faibussowitsch  PetscCall(TaoBoundSolution(tao->solution, tao->XL,tao->XU, 0.0, &nDiff, tao->solution));
484c7b14SAdam Denchfield
414d97d3SAlp Dener  if (nDiff > 0 || !tao->recycle) {
9566063dSJacob Faibussowitsch    PetscCall(TaoComputeObjectiveAndGradient(tao, tao->solution, &cg->f, cg->unprojected_gradient));
484c7b14SAdam Denchfield  }
9566063dSJacob Faibussowitsch  PetscCall(VecNorm(cg->unprojected_gradient,NORM_2,&gnorm));
3c859ba3SBarry Smith  PetscCheck(!PetscIsInfOrNanReal(cg->f) && !PetscIsInfOrNanReal(gnorm),PetscObjectComm((PetscObject)tao),PETSC_ERR_USER, "User provided compute function generated Inf or NaN");
ac9112b8SAlp Dener
61be54a6SAlp Dener  /* Estimate the active set and compute the projected gradient */
9566063dSJacob Faibussowitsch  PetscCall(TaoBNCGEstimateActiveSet(tao, cg->as_type));
61be54a6SAlp Dener
ac9112b8SAlp Dener  /* Project the gradient and calculate the norm */
9566063dSJacob Faibussowitsch  PetscCall(VecCopy(cg->unprojected_gradient, tao->gradient));
9566063dSJacob Faibussowitsch  PetscCall(VecISSet(tao->gradient, cg->active_idx, 0.0));
9566063dSJacob Faibussowitsch  PetscCall(VecNorm(tao->gradient,NORM_2,&gnorm));
ac9112b8SAlp Dener  gnorm2 = gnorm*gnorm;
ac9112b8SAlp Dener
c8bcdf1eSAdam Denchfield  /* Initialize counters */
e031d6f5SAlp Dener  tao->niter = 0;
50b47da0SAdam Denchfield  cg->ls_fails = cg->descent_error = 0;
c8bcdf1eSAdam Denchfield  cg->resets = -1;
484c7b14SAdam Denchfield  cg->skipped_updates = cg->pure_gd_steps = 0;
c8bcdf1eSAdam Denchfield  cg->iter_quad = 0;
c8bcdf1eSAdam Denchfield
c8bcdf1eSAdam Denchfield  /* Convergence test at the starting point. */
ac9112b8SAlp Dener  tao->reason = TAO_CONTINUE_ITERATING;
484c7b14SAdam Denchfield
9566063dSJacob Faibussowitsch  PetscCall(VecFischer(tao->solution, cg->unprojected_gradient, tao->XL, tao->XU, cg->W));
9566063dSJacob Faibussowitsch  PetscCall(VecNorm(cg->W, NORM_2, &resnorm));
3c859ba3SBarry Smith  PetscCheck(!PetscIsInfOrNanReal(resnorm),PetscObjectComm((PetscObject)tao),PETSC_ERR_USER, "User provided compute function generated Inf or NaN");
9566063dSJacob Faibussowitsch  PetscCall(TaoLogConvergenceHistory(tao, cg->f, resnorm, 0.0, tao->ksp_its));
9566063dSJacob Faibussowitsch  PetscCall(TaoMonitor(tao, tao->niter, cg->f, resnorm, 0.0, step));
*dbbe0bcdSBarry Smith  PetscUseTypeMethod(tao,convergencetest ,tao->cnvP);
ac9112b8SAlp Dener  if (tao->reason != TAO_CONTINUE_ITERATING) PetscFunctionReturn(0);
484c7b14SAdam Denchfield  /* Calculate initial direction. */
414d97d3SAlp Dener  if (!tao->recycle) {
484c7b14SAdam Denchfield    /* We are not recycling a solution/history from a past TaoSolve */
9566063dSJacob Faibussowitsch    PetscCall(TaoBNCGResetUpdate(tao, gnorm2));
ac9112b8SAlp Dener  }
c8bcdf1eSAdam Denchfield  /* Initial gradient descent step. Scaling by 1.0 also does a decent job for some problems. */
c8bcdf1eSAdam Denchfield  while (1) {
e1e80dc8SAlp Dener    /* Call general purpose update function */
e1e80dc8SAlp Dener    if (tao->ops->update) {
*dbbe0bcdSBarry Smith      PetscUseTypeMethod(tao,update , tao->niter, tao->user_update);
7494f0b1SStefano Zampini      PetscCall(TaoComputeObjectiveAndGradient(tao, tao->solution, &cg->f, cg->unprojected_gradient));
e1e80dc8SAlp Dener    }
9566063dSJacob Faibussowitsch    PetscCall(TaoBNCGConductIteration(tao, gnorm));
c8bcdf1eSAdam Denchfield    if (tao->reason != TAO_CONTINUE_ITERATING) PetscFunctionReturn(0);
ac9112b8SAlp Dener  }
ac9112b8SAlp Dener}
ac9112b8SAlp Dener
ac9112b8SAlp Denerstatic PetscErrorCode TaoSetUp_BNCG(Tao tao)
ac9112b8SAlp Dener{
ac9112b8SAlp Dener  TAO_BNCG         *cg = (TAO_BNCG*)tao->data;
ac9112b8SAlp Dener
ac9112b8SAlp Dener  PetscFunctionBegin;
c4b75bccSAlp Dener  if (!tao->gradient) {
9566063dSJacob Faibussowitsch    PetscCall(VecDuplicate(tao->solution,&tao->gradient));
c4b75bccSAlp Dener  }
c4b75bccSAlp Dener  if (!tao->stepdirection) {
9566063dSJacob Faibussowitsch    PetscCall(VecDuplicate(tao->solution,&tao->stepdirection));
c4b75bccSAlp Dener  }
c4b75bccSAlp Dener  if (!cg->W) {
9566063dSJacob Faibussowitsch    PetscCall(VecDuplicate(tao->solution,&cg->W));
c4b75bccSAlp Dener  }
c4b75bccSAlp Dener  if (!cg->work) {
9566063dSJacob Faibussowitsch    PetscCall(VecDuplicate(tao->solution,&cg->work));
c4b75bccSAlp Dener  }
c8bcdf1eSAdam Denchfield  if (!cg->sk) {
9566063dSJacob Faibussowitsch    PetscCall(VecDuplicate(tao->solution,&cg->sk));
c8bcdf1eSAdam Denchfield  }
c8bcdf1eSAdam Denchfield  if (!cg->yk) {
9566063dSJacob Faibussowitsch    PetscCall(VecDuplicate(tao->gradient,&cg->yk));
c8bcdf1eSAdam Denchfield  }
c4b75bccSAlp Dener  if (!cg->X_old) {
9566063dSJacob Faibussowitsch    PetscCall(VecDuplicate(tao->solution,&cg->X_old));
c4b75bccSAlp Dener  }
c4b75bccSAlp Dener  if (!cg->G_old) {
9566063dSJacob Faibussowitsch    PetscCall(VecDuplicate(tao->gradient,&cg->G_old));
c8bcdf1eSAdam Denchfield  }
c8bcdf1eSAdam Denchfield  if (cg->diag_scaling) {
9566063dSJacob Faibussowitsch    PetscCall(VecDuplicate(tao->solution,&cg->d_work));
9566063dSJacob Faibussowitsch    PetscCall(VecDuplicate(tao->solution,&cg->y_work));
9566063dSJacob Faibussowitsch    PetscCall(VecDuplicate(tao->solution,&cg->g_work));
c4b75bccSAlp Dener  }
c4b75bccSAlp Dener  if (!cg->unprojected_gradient) {
9566063dSJacob Faibussowitsch    PetscCall(VecDuplicate(tao->gradient,&cg->unprojected_gradient));
c4b75bccSAlp Dener  }
c4b75bccSAlp Dener  if (!cg->unprojected_gradient_old) {
9566063dSJacob Faibussowitsch    PetscCall(VecDuplicate(tao->gradient,&cg->unprojected_gradient_old));
c4b75bccSAlp Dener  }
9566063dSJacob Faibussowitsch  PetscCall(MatLMVMAllocate(cg->B, cg->sk, cg->yk));
1baa6e33SBarry Smith  if (cg->pc) PetscCall(MatLMVMSetJ0(cg->B, cg->pc));
ac9112b8SAlp Dener  PetscFunctionReturn(0);
ac9112b8SAlp Dener}
ac9112b8SAlp Dener
ac9112b8SAlp Denerstatic PetscErrorCode TaoDestroy_BNCG(Tao tao)
ac9112b8SAlp Dener{
ac9112b8SAlp Dener  TAO_BNCG       *cg = (TAO_BNCG*) tao->data;
ac9112b8SAlp Dener
ac9112b8SAlp Dener  PetscFunctionBegin;
ac9112b8SAlp Dener  if (tao->setupcalled) {
9566063dSJacob Faibussowitsch    PetscCall(VecDestroy(&cg->W));
9566063dSJacob Faibussowitsch    PetscCall(VecDestroy(&cg->work));
9566063dSJacob Faibussowitsch    PetscCall(VecDestroy(&cg->X_old));
9566063dSJacob Faibussowitsch    PetscCall(VecDestroy(&cg->G_old));
9566063dSJacob Faibussowitsch    PetscCall(VecDestroy(&cg->unprojected_gradient));
9566063dSJacob Faibussowitsch    PetscCall(VecDestroy(&cg->unprojected_gradient_old));
9566063dSJacob Faibussowitsch    PetscCall(VecDestroy(&cg->g_work));
9566063dSJacob Faibussowitsch    PetscCall(VecDestroy(&cg->d_work));
9566063dSJacob Faibussowitsch    PetscCall(VecDestroy(&cg->y_work));
9566063dSJacob Faibussowitsch    PetscCall(VecDestroy(&cg->sk));
9566063dSJacob Faibussowitsch    PetscCall(VecDestroy(&cg->yk));
ac9112b8SAlp Dener  }
9566063dSJacob Faibussowitsch  PetscCall(ISDestroy(&cg->active_lower));
9566063dSJacob Faibussowitsch  PetscCall(ISDestroy(&cg->active_upper));
9566063dSJacob Faibussowitsch  PetscCall(ISDestroy(&cg->active_fixed));
9566063dSJacob Faibussowitsch  PetscCall(ISDestroy(&cg->active_idx));
9566063dSJacob Faibussowitsch  PetscCall(ISDestroy(&cg->inactive_idx));
9566063dSJacob Faibussowitsch  PetscCall(ISDestroy(&cg->inactive_old));
9566063dSJacob Faibussowitsch  PetscCall(ISDestroy(&cg->new_inactives));
9566063dSJacob Faibussowitsch  PetscCall(MatDestroy(&cg->B));
484c7b14SAdam Denchfield  if (cg->pc) {
9566063dSJacob Faibussowitsch    PetscCall(MatDestroy(&cg->pc));
484c7b14SAdam Denchfield  }
9566063dSJacob Faibussowitsch  PetscCall(PetscFree(tao->data));
ac9112b8SAlp Dener  PetscFunctionReturn(0);
ac9112b8SAlp Dener}
ac9112b8SAlp Dener
*dbbe0bcdSBarry Smithstatic PetscErrorCode TaoSetFromOptions_BNCG(Tao tao,PetscOptionItems *PetscOptionsObject)
ac9112b8SAlp Dener{
ac9112b8SAlp Dener  TAO_BNCG       *cg = (TAO_BNCG*)tao->data;
ac9112b8SAlp Dener
ac9112b8SAlp Dener  PetscFunctionBegin;
d0609cedSBarry Smith  PetscOptionsHeadBegin(PetscOptionsObject,"Nonlinear Conjugate Gradient method for unconstrained optimization");
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsEList("-tao_bncg_type","cg formula", "", CG_Table, CGTypes, CG_Table[cg->cg_type], &cg->cg_type,NULL));
8ebe3e4eSStefano Zampini  if (cg->cg_type != CG_SSML_BFGS) cg->alpha = -1.0; /* Setting defaults for non-BFGS methods. User can change it below. */
484c7b14SAdam Denchfield  if (CG_GradientDescent == cg->cg_type) {
484c7b14SAdam Denchfield    cg->cg_type = CG_PCGradientDescent;
484c7b14SAdam Denchfield    /* Set scaling equal to none or, at best, scalar scaling. */
484c7b14SAdam Denchfield    cg->unscaled_restart = PETSC_TRUE;
484c7b14SAdam Denchfield    cg->diag_scaling = PETSC_FALSE;
484c7b14SAdam Denchfield  }
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsEList("-tao_bncg_as_type","active set estimation method", "", CG_AS_TYPE, CG_AS_SIZE, CG_AS_TYPE[cg->cg_type], &cg->cg_type,NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bncg_hz_eta","(developer) cutoff tolerance for HZ", "", cg->hz_eta,&cg->hz_eta,NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bncg_eps","(developer) cutoff value for restarts", "", cg->epsilon,&cg->epsilon,NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bncg_dk_eta","(developer) cutoff tolerance for DK", "", cg->dk_eta,&cg->dk_eta,NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bncg_xi","(developer) Parameter in the KD method", "", cg->xi,&cg->xi,NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bncg_theta", "(developer) update parameter for the Broyden method", "", cg->theta, &cg->theta, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bncg_hz_theta", "(developer) parameter for the HZ (2006) method", "", cg->hz_theta, &cg->hz_theta, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bncg_alpha","(developer) parameter for the scalar scaling","",cg->alpha,&cg->alpha,NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bncg_bfgs_scale", "(developer) update parameter for bfgs/brdn CG methods", "", cg->bfgs_scale, &cg->bfgs_scale, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bncg_dfp_scale", "(developer) update parameter for bfgs/brdn CG methods", "", cg->dfp_scale, &cg->dfp_scale, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsBool("-tao_bncg_diag_scaling","Enable diagonal Broyden-like preconditioning","",cg->diag_scaling,&cg->diag_scaling,NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsBool("-tao_bncg_dynamic_restart","(developer) use dynamic restarts as in HZ, DK, KD","",cg->use_dynamic_restart,&cg->use_dynamic_restart,NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsBool("-tao_bncg_unscaled_restart","(developer) use unscaled gradient restarts","",cg->unscaled_restart,&cg->unscaled_restart,NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bncg_zeta", "(developer) Free parameter for the Kou-Dai method", "", cg->zeta, &cg->zeta, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsInt("-tao_bncg_min_quad", "(developer) Number of iterations with approximate quadratic behavior needed for restart", "", cg->min_quad, &cg->min_quad, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsInt("-tao_bncg_min_restart_num", "(developer) Number of iterations between restarts (times dimension)", "", cg->min_restart_num, &cg->min_restart_num, NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsBool("-tao_bncg_spaced_restart","(developer) Enable regular steepest descent restarting every fixed number of iterations","",cg->spaced_restart,&cg->spaced_restart,NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsBool("-tao_bncg_no_scaling","Disable all scaling except in restarts","",cg->no_scaling,&cg->no_scaling,NULL));
484c7b14SAdam Denchfield  if (cg->no_scaling) {
484c7b14SAdam Denchfield    cg->diag_scaling = PETSC_FALSE;
484c7b14SAdam Denchfield    cg->alpha = -1.0;
484c7b14SAdam Denchfield  }
b474139fSKarl Rupp  if (cg->alpha == -1.0 && cg->cg_type == CG_KouDai && !cg->diag_scaling) { /* Some more default options that appear to be good. */
484c7b14SAdam Denchfield    cg->neg_xi = PETSC_TRUE;
484c7b14SAdam Denchfield  }
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsBool("-tao_bncg_neg_xi","(developer) Use negative xi when it might be a smaller descent direction than necessary","",cg->neg_xi,&cg->neg_xi,NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bncg_as_tol", "(developer) initial tolerance used when estimating actively bounded variables","",cg->as_tol,&cg->as_tol,NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bncg_as_step", "(developer) step length used when estimating actively bounded variables","",cg->as_step,&cg->as_step,NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bncg_delta_min", "(developer) minimum scaling factor used for scaled gradient restarts","",cg->delta_min,&cg->delta_min,NULL));
9566063dSJacob Faibussowitsch  PetscCall(PetscOptionsReal("-tao_bncg_delta_max", "(developer) maximum scaling factor used for scaled gradient restarts","",cg->delta_max,&cg->delta_max,NULL));
50b47da0SAdam Denchfield
d0609cedSBarry Smith  PetscOptionsHeadEnd();
9566063dSJacob Faibussowitsch  PetscCall(MatSetOptionsPrefix(cg->B, ((PetscObject)tao)->prefix));
9566063dSJacob Faibussowitsch  PetscCall(MatAppendOptionsPrefix(cg->B, "tao_bncg_"));
9566063dSJacob Faibussowitsch  PetscCall(MatSetFromOptions(cg->B));
ac9112b8SAlp Dener  PetscFunctionReturn(0);
ac9112b8SAlp Dener}
ac9112b8SAlp Dener
ac9112b8SAlp Denerstatic PetscErrorCode TaoView_BNCG(Tao tao, PetscViewer viewer)
ac9112b8SAlp Dener{
ac9112b8SAlp Dener  PetscBool      isascii;
ac9112b8SAlp Dener  TAO_BNCG       *cg = (TAO_BNCG*)tao->data;
ac9112b8SAlp Dener
ac9112b8SAlp Dener  PetscFunctionBegin;
9566063dSJacob Faibussowitsch  PetscCall(PetscObjectTypeCompare((PetscObject)viewer, PETSCVIEWERASCII, &isascii));
ac9112b8SAlp Dener  if (isascii) {
9566063dSJacob Faibussowitsch    PetscCall(PetscViewerASCIIPushTab(viewer));
9566063dSJacob Faibussowitsch    PetscCall(PetscViewerASCIIPrintf(viewer, "CG Type: %s\n", CG_Table[cg->cg_type]));
63a3b9bcSJacob Faibussowitsch    PetscCall(PetscViewerASCIIPrintf(viewer, "Skipped Stepdirection Updates: %" PetscInt_FMT "\n", cg->skipped_updates));
63a3b9bcSJacob Faibussowitsch    PetscCall(PetscViewerASCIIPrintf(viewer, "Scaled gradient steps: %" PetscInt_FMT "\n", cg->resets));
63a3b9bcSJacob Faibussowitsch    PetscCall(PetscViewerASCIIPrintf(viewer, "Pure gradient steps: %" PetscInt_FMT "\n", cg->pure_gd_steps));
63a3b9bcSJacob Faibussowitsch    PetscCall(PetscViewerASCIIPrintf(viewer, "Not a descent direction: %" PetscInt_FMT "\n", cg->descent_error));
63a3b9bcSJacob Faibussowitsch    PetscCall(PetscViewerASCIIPrintf(viewer, "Line search fails: %" PetscInt_FMT "\n", cg->ls_fails));
484c7b14SAdam Denchfield    if (cg->diag_scaling) {
9566063dSJacob Faibussowitsch      PetscCall(PetscObjectTypeCompare((PetscObject)viewer,PETSCVIEWERASCII,&isascii));
484c7b14SAdam Denchfield      if (isascii) {
9566063dSJacob Faibussowitsch        PetscCall(PetscViewerPushFormat(viewer, PETSC_VIEWER_ASCII_INFO));
9566063dSJacob Faibussowitsch        PetscCall(MatView(cg->B, viewer));
9566063dSJacob Faibussowitsch        PetscCall(PetscViewerPopFormat(viewer));
484c7b14SAdam Denchfield      }
484c7b14SAdam Denchfield    }
9566063dSJacob Faibussowitsch    PetscCall(PetscViewerASCIIPopTab(viewer));
ac9112b8SAlp Dener  }
ac9112b8SAlp Dener  PetscFunctionReturn(0);
ac9112b8SAlp Dener}
ac9112b8SAlp Dener
c8bcdf1eSAdam DenchfieldPetscErrorCode TaoBNCGComputeScalarScaling(PetscReal yty, PetscReal yts, PetscReal sts, PetscReal *scale, PetscReal alpha)
c8bcdf1eSAdam Denchfield{
c8bcdf1eSAdam Denchfield  PetscReal a, b, c, sig1, sig2;
c8bcdf1eSAdam Denchfield
c8bcdf1eSAdam Denchfield  PetscFunctionBegin;
c8bcdf1eSAdam Denchfield  *scale = 0.0;
8ebe3e4eSStefano Zampini  if (1.0 == alpha) *scale = yts/yty;
8ebe3e4eSStefano Zampini  else if (0.0 == alpha) *scale = sts/yts;
50b47da0SAdam Denchfield  else if (-1.0 == alpha) *scale = 1.0;
c8bcdf1eSAdam Denchfield  else {
c8bcdf1eSAdam Denchfield    a = yty;
c8bcdf1eSAdam Denchfield    b = yts;
c8bcdf1eSAdam Denchfield    c = sts;
c8bcdf1eSAdam Denchfield    a *= alpha;
c8bcdf1eSAdam Denchfield    b *= -(2.0*alpha - 1.0);
c8bcdf1eSAdam Denchfield    c *= alpha - 1.0;
c8bcdf1eSAdam Denchfield    sig1 = (-b + PetscSqrtReal(b*b - 4.0*a*c))/(2.0*a);
c8bcdf1eSAdam Denchfield    sig2 = (-b - PetscSqrtReal(b*b - 4.0*a*c))/(2.0*a);
c8bcdf1eSAdam Denchfield    /* accept the positive root as the scalar */
8ebe3e4eSStefano Zampini    if (sig1 > 0.0) *scale = sig1;
8ebe3e4eSStefano Zampini    else if (sig2 > 0.0) *scale = sig2;
8ebe3e4eSStefano Zampini    else SETERRQ(PETSC_COMM_SELF, PETSC_ERR_CONV_FAILED, "Cannot find positive scalar");
c8bcdf1eSAdam Denchfield  }
c8bcdf1eSAdam Denchfield  PetscFunctionReturn(0);
c8bcdf1eSAdam Denchfield}
c8bcdf1eSAdam Denchfield
ac9112b8SAlp Dener/*MC
ac9112b8SAlp Dener  TAOBNCG - Bound-constrained Nonlinear Conjugate Gradient method.
ac9112b8SAlp Dener
ac9112b8SAlp Dener  Options Database Keys:
50b47da0SAdam Denchfield+ -tao_bncg_recycle - enable recycling the latest calculated gradient vector in subsequent TaoSolve() calls (currently disabled)
c4b75bccSAlp Dener. -tao_bncg_eta <r> - restart tolerance
61be54a6SAlp Dener. -tao_bncg_type <taocg_type> - cg formula
c4b75bccSAlp Dener. -tao_bncg_as_type <none,bertsekas> - active set estimation method
c4b75bccSAlp Dener. -tao_bncg_as_tol <r> - tolerance used in Bertsekas active-set estimation
c4b75bccSAlp Dener. -tao_bncg_as_step <r> - trial step length used in Bertsekas active-set estimation
50b47da0SAdam Denchfield. -tao_bncg_eps <r> - cutoff used for determining whether or not we restart based on steplength each iteration, as well as determining whether or not we continue using the last stepdirection. Defaults to machine precision.
50b47da0SAdam Denchfield. -tao_bncg_theta <r> - convex combination parameter for the Broyden method
50b47da0SAdam Denchfield. -tao_bncg_hz_eta <r> - cutoff tolerance for the beta term in the HZ, DK methods
50b47da0SAdam Denchfield. -tao_bncg_dk_eta <r> - cutoff tolerance for the beta term in the HZ, DK methods
50b47da0SAdam Denchfield. -tao_bncg_xi <r> - Multiplicative constant of the gamma term in the KD method
50b47da0SAdam Denchfield. -tao_bncg_hz_theta <r> - Multiplicative constant of the theta term for the HZ method
50b47da0SAdam Denchfield. -tao_bncg_bfgs_scale <r> - Scaling parameter of the bfgs contribution to the scalar Broyden method
50b47da0SAdam Denchfield. -tao_bncg_dfp_scale <r> - Scaling parameter of the dfp contribution to the scalar Broyden method
50b47da0SAdam Denchfield. -tao_bncg_diag_scaling <b> - Whether or not to use diagonal initialization/preconditioning for the CG methods. Default True.
50b47da0SAdam Denchfield. -tao_bncg_dynamic_restart <b> - use dynamic restart strategy in the HZ, DK, KD methods
50b47da0SAdam Denchfield. -tao_bncg_unscaled_restart <b> - whether or not to scale the gradient when doing gradient descent restarts
50b47da0SAdam Denchfield. -tao_bncg_zeta <r> - Scaling parameter in the KD method
484c7b14SAdam Denchfield. -tao_bncg_delta_min <r> - Minimum bound for rescaling during restarted gradient descent steps
484c7b14SAdam Denchfield. -tao_bncg_delta_max <r> - Maximum bound for rescaling during restarted gradient descent steps
50b47da0SAdam Denchfield. -tao_bncg_min_quad <i> - Number of quadratic-like steps in a row necessary to do a dynamic restart
50b47da0SAdam Denchfield. -tao_bncg_min_restart_num <i> - This number, x, makes sure there is a gradient descent step every x*n iterations, where n is the dimension of the problem
50b47da0SAdam Denchfield. -tao_bncg_spaced_restart <b> - whether or not to do gradient descent steps every x*n iterations
484c7b14SAdam Denchfield. -tao_bncg_no_scaling <b> - If true, eliminates all scaling, including defaults.
3850be85SAlp Dener- -tao_bncg_neg_xi <b> - Whether or not to use negative xi in the KD method under certain conditions
ac9112b8SAlp Dener
ac9112b8SAlp Dener  Notes:
ac9112b8SAlp Dener    CG formulas are:
3850be85SAlp Dener+ "gd" - Gradient Descent
3850be85SAlp Dener. "fr" - Fletcher-Reeves
3850be85SAlp Dener. "pr" - Polak-Ribiere-Polyak
3850be85SAlp Dener. "prp" - Polak-Ribiere-Plus
3850be85SAlp Dener. "hs" - Hestenes-Steifel
3850be85SAlp Dener. "dy" - Dai-Yuan
3850be85SAlp Dener. "ssml_bfgs" - Self-Scaling Memoryless BFGS
3850be85SAlp Dener. "ssml_dfp"  - Self-Scaling Memoryless DFP
3850be85SAlp Dener. "ssml_brdn" - Self-Scaling Memoryless Broyden
3850be85SAlp Dener. "hz" - Hager-Zhang (CG_DESCENT 5.3)
3850be85SAlp Dener. "dk" - Dai-Kou (2013)
3850be85SAlp Dener- "kd" - Kou-Dai (2015)
9abc5736SPatrick Sanan
ac9112b8SAlp Dener  Level: beginner
ac9112b8SAlp DenerM*/
ac9112b8SAlp Dener
ac9112b8SAlp DenerPETSC_EXTERN PetscErrorCode TaoCreate_BNCG(Tao tao)
ac9112b8SAlp Dener{
ac9112b8SAlp Dener  TAO_BNCG       *cg;
ac9112b8SAlp Dener  const char     *morethuente_type = TAOLINESEARCHMT;
ac9112b8SAlp Dener
ac9112b8SAlp Dener  PetscFunctionBegin;
ac9112b8SAlp Dener  tao->ops->setup = TaoSetUp_BNCG;
ac9112b8SAlp Dener  tao->ops->solve = TaoSolve_BNCG;
ac9112b8SAlp Dener  tao->ops->view = TaoView_BNCG;
ac9112b8SAlp Dener  tao->ops->setfromoptions = TaoSetFromOptions_BNCG;
ac9112b8SAlp Dener  tao->ops->destroy = TaoDestroy_BNCG;
ac9112b8SAlp Dener
ac9112b8SAlp Dener  /* Override default settings (unless already changed) */
ac9112b8SAlp Dener  if (!tao->max_it_changed) tao->max_it = 2000;
ac9112b8SAlp Dener  if (!tao->max_funcs_changed) tao->max_funcs = 4000;
ac9112b8SAlp Dener
ac9112b8SAlp Dener  /*  Note: nondefault values should be used for nonlinear conjugate gradient  */
ac9112b8SAlp Dener  /*  method.  In particular, gtol should be less that 0.5; the value used in  */
ac9112b8SAlp Dener  /*  Nocedal and Wright is 0.10.  We use the default values for the  */
ac9112b8SAlp Dener  /*  linesearch because it seems to work better. */
9566063dSJacob Faibussowitsch  PetscCall(TaoLineSearchCreate(((PetscObject)tao)->comm, &tao->linesearch));
9566063dSJacob Faibussowitsch  PetscCall(PetscObjectIncrementTabLevel((PetscObject)tao->linesearch, (PetscObject)tao, 1));
9566063dSJacob Faibussowitsch  PetscCall(TaoLineSearchSetType(tao->linesearch, morethuente_type));
9566063dSJacob Faibussowitsch  PetscCall(TaoLineSearchUseTaoRoutines(tao->linesearch, tao));
ac9112b8SAlp Dener
9566063dSJacob Faibussowitsch  PetscCall(PetscNewLog(tao,&cg));
ac9112b8SAlp Dener  tao->data = (void*)cg;
9566063dSJacob Faibussowitsch  PetscCall(KSPInitializePackage());
9566063dSJacob Faibussowitsch  PetscCall(MatCreate(PetscObjectComm((PetscObject)tao), &cg->B));
9566063dSJacob Faibussowitsch  PetscCall(PetscObjectIncrementTabLevel((PetscObject)cg->B, (PetscObject)tao, 1));
9566063dSJacob Faibussowitsch  PetscCall(MatSetType(cg->B, MATLMVMDIAGBROYDEN));
50b47da0SAdam Denchfield
484c7b14SAdam Denchfield  cg->pc = NULL;
484c7b14SAdam Denchfield
50b47da0SAdam Denchfield  cg->dk_eta = 0.5;
50b47da0SAdam Denchfield  cg->hz_eta = 0.4;
c8bcdf1eSAdam Denchfield  cg->dynamic_restart = PETSC_FALSE;
c8bcdf1eSAdam Denchfield  cg->unscaled_restart = PETSC_FALSE;
484c7b14SAdam Denchfield  cg->no_scaling = PETSC_FALSE;
484c7b14SAdam Denchfield  cg->delta_min = 1e-7;
484c7b14SAdam Denchfield  cg->delta_max = 100;
c8bcdf1eSAdam Denchfield  cg->theta = 1.0;
c8bcdf1eSAdam Denchfield  cg->hz_theta = 1.0;
c8bcdf1eSAdam Denchfield  cg->dfp_scale = 1.0;
c8bcdf1eSAdam Denchfield  cg->bfgs_scale = 1.0;
50b47da0SAdam Denchfield  cg->zeta = 0.1;
50b47da0SAdam Denchfield  cg->min_quad = 6;
c8bcdf1eSAdam Denchfield  cg->min_restart_num = 6; /* As in CG_DESCENT and KD2015*/
c8bcdf1eSAdam Denchfield  cg->xi = 1.0;
50b47da0SAdam Denchfield  cg->neg_xi = PETSC_TRUE;
c8bcdf1eSAdam Denchfield  cg->spaced_restart = PETSC_FALSE;
c8bcdf1eSAdam Denchfield  cg->tol_quad = 1e-8;
61be54a6SAlp Dener  cg->as_step = 0.001;
61be54a6SAlp Dener  cg->as_tol = 0.001;
50b47da0SAdam Denchfield  cg->eps_23 = PetscPowReal(PETSC_MACHINE_EPSILON, 2.0/3.0); /* Just a little tighter*/
61be54a6SAlp Dener  cg->as_type = CG_AS_BERTSEKAS;
c8bcdf1eSAdam Denchfield  cg->cg_type = CG_SSML_BFGS;
c8bcdf1eSAdam Denchfield  cg->alpha = 1.0;
c8bcdf1eSAdam Denchfield  cg->diag_scaling = PETSC_TRUE;
c8bcdf1eSAdam Denchfield  PetscFunctionReturn(0);
c8bcdf1eSAdam Denchfield}
c8bcdf1eSAdam Denchfield
c8bcdf1eSAdam DenchfieldPetscErrorCode TaoBNCGResetUpdate(Tao tao, PetscReal gnormsq)
c8bcdf1eSAdam Denchfield{
c8bcdf1eSAdam Denchfield   TAO_BNCG          *cg = (TAO_BNCG*)tao->data;
c8bcdf1eSAdam Denchfield   PetscReal         scaling;
c8bcdf1eSAdam Denchfield
c8bcdf1eSAdam Denchfield   PetscFunctionBegin;
c8bcdf1eSAdam Denchfield   ++cg->resets;
c8bcdf1eSAdam Denchfield   scaling = 2.0 * PetscMax(1.0, PetscAbsScalar(cg->f)) / PetscMax(gnormsq, cg->eps_23);
484c7b14SAdam Denchfield   scaling = PetscMin(cg->delta_max, PetscMax(cg->delta_min, scaling));
484c7b14SAdam Denchfield   if (cg->unscaled_restart) {
484c7b14SAdam Denchfield     scaling = 1.0;
484c7b14SAdam Denchfield     ++cg->pure_gd_steps;
484c7b14SAdam Denchfield   }
9566063dSJacob Faibussowitsch   PetscCall(VecAXPBY(tao->stepdirection, -scaling, 0.0, tao->gradient));
c8bcdf1eSAdam Denchfield   /* Also want to reset our diagonal scaling with each restart */
1baa6e33SBarry Smith   if (cg->diag_scaling) PetscCall(MatLMVMReset(cg->B, PETSC_FALSE));
c8bcdf1eSAdam Denchfield   PetscFunctionReturn(0);
c8bcdf1eSAdam Denchfield }
c8bcdf1eSAdam Denchfield
c8bcdf1eSAdam DenchfieldPetscErrorCode TaoBNCGCheckDynamicRestart(Tao tao, PetscReal stepsize, PetscReal gd, PetscReal gd_old, PetscBool *dynrestart, PetscReal fold)
c8bcdf1eSAdam Denchfield{
c8bcdf1eSAdam Denchfield   TAO_BNCG          *cg = (TAO_BNCG*)tao->data;
c8bcdf1eSAdam Denchfield   PetscReal         quadinterp;
c8bcdf1eSAdam Denchfield
c8bcdf1eSAdam Denchfield   PetscFunctionBegin;
50b47da0SAdam Denchfield   if (cg->f < cg->min_quad/10) {
50b47da0SAdam Denchfield     *dynrestart = PETSC_FALSE;
50b47da0SAdam Denchfield     PetscFunctionReturn(0);
50b47da0SAdam Denchfield   } /* just skip this since this strategy doesn't work well for functions near zero */
484c7b14SAdam Denchfield   quadinterp = 2.0*(cg->f - fold)/(stepsize*(gd + gd_old));
50b47da0SAdam Denchfield   if (PetscAbs(quadinterp - 1.0) < cg->tol_quad) ++cg->iter_quad;
c8bcdf1eSAdam Denchfield   else {
c8bcdf1eSAdam Denchfield     cg->iter_quad = 0;
c8bcdf1eSAdam Denchfield     *dynrestart = PETSC_FALSE;
c8bcdf1eSAdam Denchfield   }
c8bcdf1eSAdam Denchfield   if (cg->iter_quad >= cg->min_quad) {
c8bcdf1eSAdam Denchfield     cg->iter_quad = 0;
c8bcdf1eSAdam Denchfield     *dynrestart = PETSC_TRUE;
c8bcdf1eSAdam Denchfield   }
c8bcdf1eSAdam Denchfield   PetscFunctionReturn(0);
c8bcdf1eSAdam Denchfield }
c8bcdf1eSAdam Denchfield
8ca2df50SPETSC_INTERN PetscErrorCode TaoBNCGStepDirectionUpdate(Tao tao, PetscReal gnorm2, PetscReal step, PetscReal fold, PetscReal gnorm2_old, PetscReal dnorm, PetscBool pcgd_fallback)
50b47da0SAdam Denchfield{
c8bcdf1eSAdam Denchfield  TAO_BNCG          *cg = (TAO_BNCG*)tao->data;
50b47da0SAdam Denchfield  PetscReal         gamma = 1.0, tau_k, beta;
484c7b14SAdam Denchfield  PetscReal         tmp = 1.0, ynorm, ynorm2 = 1.0, snorm = 1.0, dk_yk=1.0, gd;
50b47da0SAdam Denchfield  PetscReal         gkp1_yk, gd_old, tau_bfgs, tau_dfp, gkp1D_yk, gtDg;
c8bcdf1eSAdam Denchfield  PetscInt          dim;
484c7b14SAdam Denchfield  PetscBool         cg_restart = PETSC_FALSE;
c8bcdf1eSAdam Denchfield  PetscFunctionBegin;
c8bcdf1eSAdam Denchfield
50b47da0SAdam Denchfield  /* Local curvature check to see if we need to restart */
414d97d3SAlp Dener  if (tao->niter >= 1 || tao->recycle) {
9566063dSJacob Faibussowitsch    PetscCall(VecWAXPY(cg->yk, -1.0, cg->G_old, tao->gradient));
9566063dSJacob Faibussowitsch    PetscCall(VecNorm(cg->yk, NORM_2, &ynorm));
c8bcdf1eSAdam Denchfield    ynorm2 = ynorm*ynorm;
9566063dSJacob Faibussowitsch    PetscCall(VecDot(cg->yk, tao->stepdirection, &dk_yk));
484c7b14SAdam Denchfield    if (step*dnorm < PETSC_MACHINE_EPSILON || step*dk_yk < PETSC_MACHINE_EPSILON) {
e2570530SAlp Dener      cg_restart = PETSC_TRUE;
484c7b14SAdam Denchfield      ++cg->skipped_updates;
484c7b14SAdam Denchfield    }
50b47da0SAdam Denchfield    if (cg->spaced_restart) {
9566063dSJacob Faibussowitsch      PetscCall(VecGetSize(tao->gradient, &dim));
e2570530SAlp Dener      if (tao->niter % (dim*cg->min_restart_num)) cg_restart = PETSC_TRUE;
50b47da0SAdam Denchfield    }
50b47da0SAdam Denchfield  }
50b47da0SAdam Denchfield  /* If the user wants regular restarts, do it every 6n iterations, where n=dimension */
50b47da0SAdam Denchfield  if (cg->spaced_restart) {
9566063dSJacob Faibussowitsch    PetscCall(VecGetSize(tao->gradient, &dim));
e2570530SAlp Dener    if (0 == tao->niter % (6*dim)) cg_restart = PETSC_TRUE;
50b47da0SAdam Denchfield  }
50b47da0SAdam Denchfield  /* Compute the diagonal scaling vector if applicable */
1baa6e33SBarry Smith  if (cg->diag_scaling) PetscCall(MatLMVMUpdate(cg->B, tao->solution, tao->gradient));
50b47da0SAdam Denchfield
484c7b14SAdam Denchfield  /* A note on diagonal scaling (to be added to paper):
484c7b14SAdam Denchfield   For the FR, PR, PRP, and DY methods, the diagonally scaled versions
484c7b14SAdam Denchfield   must be derived as a preconditioned CG method rather than as
484c7b14SAdam Denchfield   a Hessian initialization like in the Broyden methods. */
50b47da0SAdam Denchfield
484c7b14SAdam Denchfield  /* In that case, one writes the objective function as
484c7b14SAdam Denchfield   f(x) \equiv f(Ay). Gradient evaluations yield g(x_k) = A g(Ay_k) = A g(x_k).
484c7b14SAdam Denchfield   Furthermore, the direction d_k \equiv (x_k - x_{k-1})/step according to
484c7b14SAdam Denchfield   HZ (2006) becomes A^{-1} d_k, such that d_k^T g_k remains the
484c7b14SAdam Denchfield   same under preconditioning. Note that A is diagonal, such that A^T = A. */
50b47da0SAdam Denchfield
484c7b14SAdam Denchfield  /* This yields questions like what the dot product d_k^T y_k
484c7b14SAdam Denchfield   should look like. HZ mistakenly treats that as the same under
484c7b14SAdam Denchfield   preconditioning, but that is not necessarily true. */
50b47da0SAdam Denchfield
484c7b14SAdam Denchfield  /* Observe y_k \equiv g_k - g_{k-1}, and under the P.C. transformation,
484c7b14SAdam Denchfield   we get d_k^T y_k = (d_k^T A_k^{-T} A_k g_k - d_k^T A_k^{-T} A_{k-1} g_{k-1}),
484c7b14SAdam Denchfield   yielding d_k^T y_k = d_k^T g_k - d_k^T (A_k^{-T} A_{k-1} g_{k-1}), which is
484c7b14SAdam Denchfield   NOT the same if our preconditioning matrix is updated between iterations.
484c7b14SAdam Denchfield   This same issue is found when considering dot products of the form g_{k+1}^T y_k. */
50b47da0SAdam Denchfield
50b47da0SAdam Denchfield  /* Compute CG step direction */
50b47da0SAdam Denchfield  if (cg_restart) {
9566063dSJacob Faibussowitsch    PetscCall(TaoBNCGResetUpdate(tao, gnorm2));
484c7b14SAdam Denchfield  } else if (pcgd_fallback) {
484c7b14SAdam Denchfield    /* Just like preconditioned CG */
9566063dSJacob Faibussowitsch    PetscCall(MatSolve(cg->B, tao->gradient, cg->g_work));
9566063dSJacob Faibussowitsch    PetscCall(VecAXPBY(tao->stepdirection, -1.0, 0.0, cg->g_work));
50b47da0SAdam Denchfield  } else if (ynorm2 > PETSC_MACHINE_EPSILON) {
50b47da0SAdam Denchfield    switch (cg->cg_type) {
484c7b14SAdam Denchfield    case CG_PCGradientDescent:
50b47da0SAdam Denchfield      if (!cg->diag_scaling) {
484c7b14SAdam Denchfield        if (!cg->no_scaling) {
50b47da0SAdam Denchfield        cg->sts = step*step*dnorm*dnorm;
9566063dSJacob Faibussowitsch        PetscCall(TaoBNCGComputeScalarScaling(ynorm2, step*dk_yk, cg->sts, &tau_k, cg->alpha));
484c7b14SAdam Denchfield        } else {
484c7b14SAdam Denchfield          tau_k = 1.0;
484c7b14SAdam Denchfield          ++cg->pure_gd_steps;
484c7b14SAdam Denchfield        }
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBY(tao->stepdirection, -tau_k, 0.0, tao->gradient));
50b47da0SAdam Denchfield      } else {
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(cg->B, tao->gradient, cg->g_work));
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBY(tao->stepdirection, -1.0, 0.0, cg->g_work));
50b47da0SAdam Denchfield      }
50b47da0SAdam Denchfield      break;
484c7b14SAdam Denchfield
50b47da0SAdam Denchfield    case CG_HestenesStiefel:
50b47da0SAdam Denchfield      /* Classic Hestenes-Stiefel method, modified with scalar and diagonal preconditioning. */
50b47da0SAdam Denchfield      if (!cg->diag_scaling) {
50b47da0SAdam Denchfield        cg->sts = step*step*dnorm*dnorm;
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->yk, tao->gradient, &gkp1_yk));
9566063dSJacob Faibussowitsch        PetscCall(TaoBNCGComputeScalarScaling(ynorm2, step*dk_yk, cg->sts, &tau_k, cg->alpha));
50b47da0SAdam Denchfield        beta = tau_k*gkp1_yk/dk_yk;
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBY(tao->stepdirection, -tau_k, beta, tao->gradient));
50b47da0SAdam Denchfield      } else {
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(cg->B, tao->gradient, cg->g_work));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->yk, cg->g_work, &gkp1_yk));
50b47da0SAdam Denchfield        beta = gkp1_yk/dk_yk;
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBY(tao->stepdirection, -1.0, beta, cg->g_work));
50b47da0SAdam Denchfield      }
c8bcdf1eSAdam Denchfield      break;
484c7b14SAdam Denchfield
c8bcdf1eSAdam Denchfield    case CG_FletcherReeves:
9566063dSJacob Faibussowitsch      PetscCall(VecDot(cg->G_old, cg->G_old, &gnorm2_old));
9566063dSJacob Faibussowitsch      PetscCall(VecWAXPY(cg->yk, -1.0, cg->G_old, tao->gradient));
9566063dSJacob Faibussowitsch      PetscCall(VecNorm(cg->yk, NORM_2, &ynorm));
50b47da0SAdam Denchfield      ynorm2 = ynorm*ynorm;
9566063dSJacob Faibussowitsch      PetscCall(VecDot(cg->yk, tao->stepdirection, &dk_yk));
50b47da0SAdam Denchfield      if (!cg->diag_scaling) {
9566063dSJacob Faibussowitsch        PetscCall(TaoBNCGComputeScalarScaling(ynorm2, step*dk_yk, step*step*dnorm*dnorm, &tau_k, cg->alpha));
50b47da0SAdam Denchfield        beta = tau_k*gnorm2/gnorm2_old;
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBY(tao->stepdirection, -tau_k, beta, tao->gradient));
50b47da0SAdam Denchfield      } else {
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->G_old, cg->g_work, &gnorm2_old)); /* Before it's updated */
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(cg->B, tao->gradient, cg->g_work));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(tao->gradient, cg->g_work, &tmp));
50b47da0SAdam Denchfield        beta = tmp/gnorm2_old;
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBY(tao->stepdirection, -1.0, beta, cg->g_work));
50b47da0SAdam Denchfield      }
c8bcdf1eSAdam Denchfield      break;
484c7b14SAdam Denchfield
50b47da0SAdam Denchfield    case CG_PolakRibierePolyak:
50b47da0SAdam Denchfield      snorm = step*dnorm;
50b47da0SAdam Denchfield      if (!cg->diag_scaling) {
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->G_old, cg->G_old, &gnorm2_old));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->yk, tao->gradient, &gkp1_yk));
9566063dSJacob Faibussowitsch        PetscCall(TaoBNCGComputeScalarScaling(ynorm2, step*dk_yk, snorm*snorm, &tau_k, cg->alpha));
50b47da0SAdam Denchfield        beta = tau_k*gkp1_yk/gnorm2_old;
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBY(tao->stepdirection, -tau_k, beta, tao->gradient));
50b47da0SAdam Denchfield      } else {
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->G_old, cg->g_work, &gnorm2_old));
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(cg->B, tao->gradient, cg->g_work));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->g_work, cg->yk, &gkp1_yk));
50b47da0SAdam Denchfield        beta = gkp1_yk/gnorm2_old;
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBY(tao->stepdirection, -1.0, beta, cg->g_work));
50b47da0SAdam Denchfield      }
c8bcdf1eSAdam Denchfield      break;
484c7b14SAdam Denchfield
c8bcdf1eSAdam Denchfield    case CG_PolakRibierePlus:
9566063dSJacob Faibussowitsch      PetscCall(VecWAXPY(cg->yk, -1.0, cg->G_old, tao->gradient));
9566063dSJacob Faibussowitsch      PetscCall(VecNorm(cg->yk, NORM_2, &ynorm));
50b47da0SAdam Denchfield      ynorm2 = ynorm*ynorm;
50b47da0SAdam Denchfield      if (!cg->diag_scaling) {
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->G_old, cg->G_old, &gnorm2_old));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->yk, tao->gradient, &gkp1_yk));
9566063dSJacob Faibussowitsch        PetscCall(TaoBNCGComputeScalarScaling(ynorm2, step*dk_yk, snorm*snorm, &tau_k, cg->alpha));
50b47da0SAdam Denchfield        beta = tau_k*gkp1_yk/gnorm2_old;
50b47da0SAdam Denchfield        beta = PetscMax(beta, 0.0);
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBY(tao->stepdirection, -tau_k, beta, tao->gradient));
50b47da0SAdam Denchfield      } else {
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->G_old, cg->g_work, &gnorm2_old)); /* Old gtDg */
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(cg->B, tao->gradient, cg->g_work));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->g_work, cg->yk, &gkp1_yk));
50b47da0SAdam Denchfield        beta = gkp1_yk/gnorm2_old;
50b47da0SAdam Denchfield        beta = PetscMax(beta, 0.0);
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBY(tao->stepdirection, -1.0, beta, cg->g_work));
50b47da0SAdam Denchfield      }
c8bcdf1eSAdam Denchfield      break;
484c7b14SAdam Denchfield
484c7b14SAdam Denchfield    case CG_DaiYuan:
484c7b14SAdam Denchfield      /* Dai, Yu-Hong, and Yaxiang Yuan. "A nonlinear conjugate gradient method with a strong global convergence property."
484c7b14SAdam Denchfield         SIAM Journal on optimization 10, no. 1 (1999): 177-182. */
50b47da0SAdam Denchfield      if (!cg->diag_scaling) {
9566063dSJacob Faibussowitsch        PetscCall(VecDot(tao->stepdirection, tao->gradient, &gd));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->G_old, tao->stepdirection, &gd_old));
9566063dSJacob Faibussowitsch        PetscCall(TaoBNCGComputeScalarScaling(ynorm2, step*dk_yk, cg->yts, &tau_k, cg->alpha));
50b47da0SAdam Denchfield        beta = tau_k*gnorm2/(gd - gd_old);
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBY(tao->stepdirection, -tau_k, beta, tao->gradient));
50b47da0SAdam Denchfield      } else {
9566063dSJacob Faibussowitsch        PetscCall(MatMult(cg->B, tao->stepdirection, cg->d_work));
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(cg->B, tao->gradient, cg->g_work));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->g_work, tao->gradient, &gtDg));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(tao->stepdirection, cg->G_old, &gd_old));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->d_work, cg->g_work, &dk_yk));
50b47da0SAdam Denchfield        dk_yk = dk_yk - gd_old;
50b47da0SAdam Denchfield        beta = gtDg/dk_yk;
9566063dSJacob Faibussowitsch        PetscCall(VecScale(cg->d_work, beta));
9566063dSJacob Faibussowitsch        PetscCall(VecWAXPY(tao->stepdirection, -1.0, cg->g_work, cg->d_work));
50b47da0SAdam Denchfield      }
c8bcdf1eSAdam Denchfield      break;
484c7b14SAdam Denchfield
c8bcdf1eSAdam Denchfield    case CG_HagerZhang:
484c7b14SAdam Denchfield      /* Hager, William W., and Hongchao Zhang. "Algorithm 851: CG_DESCENT, a conjugate gradient method with guaranteed descent."
484c7b14SAdam Denchfield         ACM Transactions on Mathematical Software (TOMS) 32, no. 1 (2006): 113-137. */
9566063dSJacob Faibussowitsch      PetscCall(VecDot(tao->gradient, tao->stepdirection, &gd));
9566063dSJacob Faibussowitsch      PetscCall(VecDot(cg->G_old, tao->stepdirection, &gd_old));
9566063dSJacob Faibussowitsch      PetscCall(VecWAXPY(cg->sk, -1.0, cg->X_old, tao->solution));
50b47da0SAdam Denchfield      snorm = dnorm*step;
50b47da0SAdam Denchfield      cg->yts = step*dk_yk;
c8bcdf1eSAdam Denchfield      if (cg->use_dynamic_restart) {
9566063dSJacob Faibussowitsch        PetscCall(TaoBNCGCheckDynamicRestart(tao, step, gd, gd_old, &cg->dynamic_restart, fold));
c8bcdf1eSAdam Denchfield      }
50b47da0SAdam Denchfield      if (cg->dynamic_restart) {
9566063dSJacob Faibussowitsch        PetscCall(TaoBNCGResetUpdate(tao, gnorm2));
c8bcdf1eSAdam Denchfield      } else {
c8bcdf1eSAdam Denchfield        if (!cg->diag_scaling) {
9566063dSJacob Faibussowitsch          PetscCall(VecDot(cg->yk, tao->gradient, &gkp1_yk));
9566063dSJacob Faibussowitsch          PetscCall(TaoBNCGComputeScalarScaling(ynorm2, cg->yts, snorm*snorm, &tau_k, cg->alpha));
c8bcdf1eSAdam Denchfield          /* Supplying cg->alpha = -1.0 will give the CG_DESCENT 5.3 special case of tau_k = 1.0 */
c8bcdf1eSAdam Denchfield          tmp = gd/dk_yk;
c8bcdf1eSAdam Denchfield          beta = tau_k*(gkp1_yk/dk_yk - ynorm2*gd/(dk_yk*dk_yk));
c8bcdf1eSAdam Denchfield          /* Bound beta as in CG_DESCENT 5.3, as implemented, with the third comparison from DK 2013 */
50b47da0SAdam Denchfield          beta = PetscMax(PetscMax(beta, cg->hz_eta*tau_k*gd_old/(dnorm*dnorm)), cg->dk_eta*tau_k*gd/(dnorm*dnorm));
c8bcdf1eSAdam Denchfield          /* d <- -t*g + beta*t*d */
9566063dSJacob Faibussowitsch          PetscCall(VecAXPBY(tao->stepdirection, -tau_k, beta, tao->gradient));
c8bcdf1eSAdam Denchfield        } else {
c8bcdf1eSAdam Denchfield          /* We have diagonal scaling enabled and are taking a diagonally-scaled memoryless BFGS step */
c8bcdf1eSAdam Denchfield          cg->yty = ynorm2;
c8bcdf1eSAdam Denchfield          cg->sts = snorm*snorm;
50b47da0SAdam Denchfield          /* Apply the diagonal scaling to all my vectors */
9566063dSJacob Faibussowitsch          PetscCall(MatSolve(cg->B, tao->gradient, cg->g_work));
9566063dSJacob Faibussowitsch          PetscCall(MatSolve(cg->B, cg->yk, cg->y_work));
9566063dSJacob Faibussowitsch          PetscCall(MatSolve(cg->B, tao->stepdirection, cg->d_work));
c8bcdf1eSAdam Denchfield          /* Construct the constant ytDgkp1 */
9566063dSJacob Faibussowitsch          PetscCall(VecDot(cg->yk, cg->g_work, &gkp1_yk));
c8bcdf1eSAdam Denchfield          /* Construct the constant for scaling Dkyk in the update */
c8bcdf1eSAdam Denchfield          tmp = gd/dk_yk;
9566063dSJacob Faibussowitsch          PetscCall(VecDot(cg->yk, cg->y_work, &tau_k));
c8bcdf1eSAdam Denchfield          tau_k = -tau_k*gd/(dk_yk*dk_yk);
c8bcdf1eSAdam Denchfield          /* beta is the constant which adds the dk contribution */
484c7b14SAdam Denchfield          beta = gkp1_yk/dk_yk + cg->hz_theta*tau_k; /* HZ; (1.15) from DK 2013 */
c8bcdf1eSAdam Denchfield          /* From HZ2013, modified to account for diagonal scaling*/
9566063dSJacob Faibussowitsch          PetscCall(VecDot(cg->G_old, cg->d_work, &gd_old));
9566063dSJacob Faibussowitsch          PetscCall(VecDot(tao->stepdirection, cg->g_work, &gd));
50b47da0SAdam Denchfield          beta = PetscMax(PetscMax(beta, cg->hz_eta*gd_old/(dnorm*dnorm)), cg->dk_eta*gd/(dnorm*dnorm));
c8bcdf1eSAdam Denchfield          /* Do the update */
9566063dSJacob Faibussowitsch          PetscCall(VecAXPBY(tao->stepdirection, -1.0, beta, cg->g_work));
50b47da0SAdam Denchfield        }
50b47da0SAdam Denchfield      }
c8bcdf1eSAdam Denchfield      break;
484c7b14SAdam Denchfield
c8bcdf1eSAdam Denchfield    case CG_DaiKou:
484c7b14SAdam Denchfield      /* Dai, Yu-Hong, and Cai-Xia Kou. "A nonlinear conjugate gradient algorithm with an optimal property and an improved Wolfe line search."
484c7b14SAdam Denchfield         SIAM Journal on Optimization 23, no. 1 (2013): 296-320. */
9566063dSJacob Faibussowitsch      PetscCall(VecDot(tao->gradient, tao->stepdirection, &gd));
9566063dSJacob Faibussowitsch      PetscCall(VecDot(cg->G_old, tao->stepdirection, &gd_old));
9566063dSJacob Faibussowitsch      PetscCall(VecWAXPY(cg->sk, -1.0, cg->X_old, tao->solution));
50b47da0SAdam Denchfield      snorm = step*dnorm;
50b47da0SAdam Denchfield      cg->yts = dk_yk*step;
c8bcdf1eSAdam Denchfield      if (!cg->diag_scaling) {
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->yk, tao->gradient, &gkp1_yk));
9566063dSJacob Faibussowitsch        PetscCall(TaoBNCGComputeScalarScaling(ynorm2, cg->yts, snorm*snorm, &tau_k, cg->alpha));
c8bcdf1eSAdam Denchfield        /* Use cg->alpha = -1.0 to get tau_k = 1.0 as in CG_DESCENT 5.3 */
c8bcdf1eSAdam Denchfield        tmp = gd/dk_yk;
50b47da0SAdam Denchfield        beta = tau_k*(gkp1_yk/dk_yk - ynorm2*gd/(dk_yk*dk_yk) + gd/(dnorm*dnorm)) - step*gd/dk_yk;
50b47da0SAdam Denchfield        beta = PetscMax(PetscMax(beta, cg->hz_eta*tau_k*gd_old/(dnorm*dnorm)), cg->dk_eta*tau_k*gd/(dnorm*dnorm));
c8bcdf1eSAdam Denchfield        /* d <- -t*g + beta*t*d */
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBYPCZ(tao->stepdirection, -tau_k, 0.0, beta, tao->gradient, cg->yk));
c8bcdf1eSAdam Denchfield      } else {
c8bcdf1eSAdam Denchfield        /* We have diagonal scaling enabled and are taking a diagonally-scaled memoryless BFGS step */
c8bcdf1eSAdam Denchfield        cg->yty = ynorm2;
c8bcdf1eSAdam Denchfield        cg->sts = snorm*snorm;
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(cg->B, tao->gradient, cg->g_work));
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(cg->B, cg->yk, cg->y_work));
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(cg->B, tao->stepdirection, cg->d_work));
c8bcdf1eSAdam Denchfield        /* Construct the constant ytDgkp1 */
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->yk, cg->g_work, &gkp1_yk));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->yk, cg->y_work, &tau_k));
c8bcdf1eSAdam Denchfield        tau_k = tau_k*gd/(dk_yk*dk_yk);
c8bcdf1eSAdam Denchfield        tmp = gd/dk_yk;
c8bcdf1eSAdam Denchfield        /* beta is the constant which adds the dk contribution */
484c7b14SAdam Denchfield        beta = gkp1_yk/dk_yk - step*tmp - tau_k;
c8bcdf1eSAdam Denchfield        /* Update this for the last term in beta */
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->y_work, tao->stepdirection, &dk_yk));
c8bcdf1eSAdam Denchfield        beta += tmp*dk_yk/(dnorm*dnorm); /* projection of y_work onto dk */
9566063dSJacob Faibussowitsch        PetscCall(VecDot(tao->stepdirection, cg->g_work, &gd));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->G_old, cg->d_work, &gd_old));
50b47da0SAdam Denchfield        beta = PetscMax(PetscMax(beta, cg->hz_eta*gd_old/(dnorm*dnorm)), cg->dk_eta*gd/(dnorm*dnorm));
c8bcdf1eSAdam Denchfield        /* Do the update */
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBY(tao->stepdirection, -1.0, beta, cg->g_work));
50b47da0SAdam Denchfield      }
c8bcdf1eSAdam Denchfield      break;
484c7b14SAdam Denchfield
c8bcdf1eSAdam Denchfield    case CG_KouDai:
110fc3b0SBarry Smith      /* Kou, Cai-Xia, and Yu-Hong Dai. "A modified self-scaling memoryless Broyden-Fletcher-Goldfarb-Shanno method for unconstrained optimization."
484c7b14SAdam Denchfield         Journal of Optimization Theory and Applications 165, no. 1 (2015): 209-224. */
9566063dSJacob Faibussowitsch      PetscCall(VecDot(tao->gradient, tao->stepdirection, &gd));
9566063dSJacob Faibussowitsch      PetscCall(VecDot(cg->G_old, tao->stepdirection, &gd_old));
9566063dSJacob Faibussowitsch      PetscCall(VecWAXPY(cg->sk, -1.0, cg->X_old, tao->solution));
50b47da0SAdam Denchfield      snorm = step*dnorm;
50b47da0SAdam Denchfield      cg->yts = dk_yk*step;
c8bcdf1eSAdam Denchfield      if (cg->use_dynamic_restart) {
9566063dSJacob Faibussowitsch        PetscCall(TaoBNCGCheckDynamicRestart(tao, step, gd, gd_old, &cg->dynamic_restart, fold));
c8bcdf1eSAdam Denchfield      }
50b47da0SAdam Denchfield      if (cg->dynamic_restart) {
9566063dSJacob Faibussowitsch        PetscCall(TaoBNCGResetUpdate(tao, gnorm2));
c8bcdf1eSAdam Denchfield      } else {
c8bcdf1eSAdam Denchfield        if (!cg->diag_scaling) {
9566063dSJacob Faibussowitsch          PetscCall(VecDot(cg->yk, tao->gradient, &gkp1_yk));
9566063dSJacob Faibussowitsch          PetscCall(TaoBNCGComputeScalarScaling(ynorm2, cg->yts, snorm*snorm, &tau_k, cg->alpha));
c8bcdf1eSAdam Denchfield          beta = tau_k*(gkp1_yk/dk_yk - ynorm2*gd/(dk_yk*dk_yk)) - step*gd/dk_yk;
c8bcdf1eSAdam Denchfield          if (beta < cg->zeta*tau_k*gd/(dnorm*dnorm)) /* 0.1 is KD's zeta parameter */
c8bcdf1eSAdam Denchfield          {
c8bcdf1eSAdam Denchfield            beta = cg->zeta*tau_k*gd/(dnorm*dnorm);
c8bcdf1eSAdam Denchfield            gamma = 0.0;
c8bcdf1eSAdam Denchfield          } else {
c8bcdf1eSAdam Denchfield            if (gkp1_yk < 0 && cg->neg_xi) gamma = -1.0*gd/dk_yk;
484c7b14SAdam Denchfield            /* This seems to be very effective when there's no tau_k scaling.
484c7b14SAdam Denchfield               This guarantees a large descent step every iteration, going through DK 2015 Lemma 3.1's proof but allowing for negative xi */
50b47da0SAdam Denchfield            else {
50b47da0SAdam Denchfield              gamma = cg->xi*gd/dk_yk;
50b47da0SAdam Denchfield            }
c8bcdf1eSAdam Denchfield          }
c8bcdf1eSAdam Denchfield          /* d <- -t*g + beta*t*d + t*tmp*yk */
9566063dSJacob Faibussowitsch          PetscCall(VecAXPBYPCZ(tao->stepdirection, -tau_k, gamma*tau_k, beta, tao->gradient, cg->yk));
c8bcdf1eSAdam Denchfield        } else {
c8bcdf1eSAdam Denchfield          /* We have diagonal scaling enabled and are taking a diagonally-scaled memoryless BFGS step */
c8bcdf1eSAdam Denchfield          cg->yty = ynorm2;
c8bcdf1eSAdam Denchfield          cg->sts = snorm*snorm;
9566063dSJacob Faibussowitsch          PetscCall(MatSolve(cg->B, tao->gradient, cg->g_work));
9566063dSJacob Faibussowitsch          PetscCall(MatSolve(cg->B, cg->yk, cg->y_work));
c8bcdf1eSAdam Denchfield          /* Construct the constant ytDgkp1 */
9566063dSJacob Faibussowitsch          PetscCall(VecDot(cg->yk, cg->g_work, &gkp1D_yk));
c8bcdf1eSAdam Denchfield          /* Construct the constant for scaling Dkyk in the update */
c8bcdf1eSAdam Denchfield          gamma = gd/dk_yk;
c8bcdf1eSAdam Denchfield          /* tau_k = -ytDy/(ytd)^2 * gd */
9566063dSJacob Faibussowitsch          PetscCall(VecDot(cg->yk, cg->y_work, &tau_k));
c8bcdf1eSAdam Denchfield          tau_k = tau_k*gd/(dk_yk*dk_yk);
c8bcdf1eSAdam Denchfield          /* beta is the constant which adds the d_k contribution */
c8bcdf1eSAdam Denchfield          beta = gkp1D_yk/dk_yk - step*gamma - tau_k;
c8bcdf1eSAdam Denchfield          /* Here is the requisite check */
9566063dSJacob Faibussowitsch          PetscCall(VecDot(tao->stepdirection, cg->g_work, &tmp));
c8bcdf1eSAdam Denchfield          if (cg->neg_xi) {
c8bcdf1eSAdam Denchfield            /* modified KD implementation */
c8bcdf1eSAdam Denchfield            if (gkp1D_yk/dk_yk < 0) gamma = -1.0*gd/dk_yk;
50b47da0SAdam Denchfield            else {
50b47da0SAdam Denchfield              gamma = cg->xi*gd/dk_yk;
50b47da0SAdam Denchfield            }
c8bcdf1eSAdam Denchfield            if (beta < cg->zeta*tmp/(dnorm*dnorm)) {
c8bcdf1eSAdam Denchfield              beta = cg->zeta*tmp/(dnorm*dnorm);
c8bcdf1eSAdam Denchfield              gamma = 0.0;
c8bcdf1eSAdam Denchfield            }
c8bcdf1eSAdam Denchfield          } else { /* original KD 2015 implementation */
c8bcdf1eSAdam Denchfield            if (beta < cg->zeta*tmp/(dnorm*dnorm)) {
c8bcdf1eSAdam Denchfield              beta = cg->zeta*tmp/(dnorm*dnorm);
c8bcdf1eSAdam Denchfield              gamma = 0.0;
c8bcdf1eSAdam Denchfield            } else {
c8bcdf1eSAdam Denchfield              gamma = cg->xi*gd/dk_yk;
c8bcdf1eSAdam Denchfield            }
c8bcdf1eSAdam Denchfield          }
c8bcdf1eSAdam Denchfield          /* Do the update in two steps */
9566063dSJacob Faibussowitsch          PetscCall(VecAXPBY(tao->stepdirection, -1.0, beta, cg->g_work));
9566063dSJacob Faibussowitsch          PetscCall(VecAXPY(tao->stepdirection, gamma, cg->y_work));
50b47da0SAdam Denchfield        }
50b47da0SAdam Denchfield      }
c8bcdf1eSAdam Denchfield      break;
484c7b14SAdam Denchfield
484c7b14SAdam Denchfield    case CG_SSML_BFGS:
484c7b14SAdam Denchfield      /* Perry, J. M. "A class of conjugate gradient algorithms with a two-step variable-metric memory."
484c7b14SAdam Denchfield         Discussion Papers 269 (1977). */
9566063dSJacob Faibussowitsch      PetscCall(VecDot(tao->gradient, tao->stepdirection, &gd));
9566063dSJacob Faibussowitsch      PetscCall(VecWAXPY(cg->sk, -1.0, cg->X_old, tao->solution));
484c7b14SAdam Denchfield      snorm = step*dnorm;
484c7b14SAdam Denchfield      cg->yts = dk_yk*step;
484c7b14SAdam Denchfield      cg->yty = ynorm2;
484c7b14SAdam Denchfield      cg->sts = snorm*snorm;
484c7b14SAdam Denchfield      if (!cg->diag_scaling) {
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->yk, tao->gradient, &gkp1_yk));
9566063dSJacob Faibussowitsch        PetscCall(TaoBNCGComputeScalarScaling(cg->yty, cg->yts, cg->sts, &tau_k, cg->alpha));
484c7b14SAdam Denchfield        tmp = gd/dk_yk;
484c7b14SAdam Denchfield        beta = tau_k*(gkp1_yk/dk_yk - cg->yty*gd/(dk_yk*dk_yk)) - step*tmp;
484c7b14SAdam Denchfield        /* d <- -t*g + beta*t*d + t*tmp*yk */
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBYPCZ(tao->stepdirection, -tau_k, tmp*tau_k, beta, tao->gradient, cg->yk));
484c7b14SAdam Denchfield      } else {
484c7b14SAdam Denchfield        /* We have diagonal scaling enabled and are taking a diagonally-scaled memoryless BFGS step */
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(cg->B, tao->gradient, cg->g_work));
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(cg->B, cg->yk, cg->y_work));
484c7b14SAdam Denchfield        /* compute scalar gamma */
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->g_work, cg->yk, &gkp1_yk));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->y_work, cg->yk, &tmp));
484c7b14SAdam Denchfield        gamma = gd/dk_yk;
484c7b14SAdam Denchfield        /* Compute scalar beta */
484c7b14SAdam Denchfield        beta = (gkp1_yk/dk_yk - gd*tmp/(dk_yk*dk_yk)) - step*gd/dk_yk;
484c7b14SAdam Denchfield        /* Compute stepdirection d_kp1 = gamma*Dkyk + beta*dk - Dkgkp1 */
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBYPCZ(tao->stepdirection, -1.0, gamma, beta, cg->g_work, cg->y_work));
484c7b14SAdam Denchfield      }
484c7b14SAdam Denchfield      break;
484c7b14SAdam Denchfield
484c7b14SAdam Denchfield    case CG_SSML_DFP:
9566063dSJacob Faibussowitsch      PetscCall(VecDot(tao->gradient, tao->stepdirection, &gd));
9566063dSJacob Faibussowitsch      PetscCall(VecWAXPY(cg->sk, -1.0, cg->X_old, tao->solution));
484c7b14SAdam Denchfield      snorm = step*dnorm;
484c7b14SAdam Denchfield      cg->yts = dk_yk*step;
484c7b14SAdam Denchfield      cg->yty = ynorm2;
484c7b14SAdam Denchfield      cg->sts = snorm*snorm;
484c7b14SAdam Denchfield      if (!cg->diag_scaling) {
484c7b14SAdam Denchfield        /* Instead of a regular convex combination, we will solve a quadratic formula. */
9566063dSJacob Faibussowitsch        PetscCall(TaoBNCGComputeScalarScaling(cg->yty, cg->yts, cg->sts, &tau_k, cg->alpha));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->yk, tao->gradient, &gkp1_yk));
484c7b14SAdam Denchfield        tau_k = cg->dfp_scale*tau_k;
484c7b14SAdam Denchfield        tmp = tau_k*gkp1_yk/cg->yty;
484c7b14SAdam Denchfield        beta = -step*gd/dk_yk;
484c7b14SAdam Denchfield        /* d <- -t*g + beta*d + tmp*yk */
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBYPCZ(tao->stepdirection, -tau_k, tmp, beta, tao->gradient, cg->yk));
484c7b14SAdam Denchfield      } else {
484c7b14SAdam Denchfield        /* We have diagonal scaling enabled and are taking a diagonally-scaled memoryless DFP step */
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(cg->B, tao->gradient, cg->g_work));
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(cg->B, cg->yk, cg->y_work));
484c7b14SAdam Denchfield        /* compute scalar gamma */
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->g_work, cg->yk, &gkp1_yk));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->y_work, cg->yk, &tmp));
484c7b14SAdam Denchfield        gamma = (gkp1_yk/tmp);
484c7b14SAdam Denchfield        /* Compute scalar beta */
484c7b14SAdam Denchfield        beta = -step*gd/dk_yk;
484c7b14SAdam Denchfield        /* Compute stepdirection d_kp1 = gamma*Dkyk + beta*dk - Dkgkp1 */
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBYPCZ(tao->stepdirection, -1.0, gamma, beta, cg->g_work, cg->y_work));
484c7b14SAdam Denchfield      }
484c7b14SAdam Denchfield      break;
484c7b14SAdam Denchfield
484c7b14SAdam Denchfield    case CG_SSML_BROYDEN:
9566063dSJacob Faibussowitsch      PetscCall(VecDot(tao->gradient, tao->stepdirection, &gd));
9566063dSJacob Faibussowitsch      PetscCall(VecWAXPY(cg->sk, -1.0, cg->X_old, tao->solution));
484c7b14SAdam Denchfield      snorm = step*dnorm;
484c7b14SAdam Denchfield      cg->yts = step*dk_yk;
484c7b14SAdam Denchfield      cg->yty = ynorm2;
484c7b14SAdam Denchfield      cg->sts = snorm*snorm;
484c7b14SAdam Denchfield      if (!cg->diag_scaling) {
484c7b14SAdam Denchfield        /* Instead of a regular convex combination, we will solve a quadratic formula. */
9566063dSJacob Faibussowitsch        PetscCall(TaoBNCGComputeScalarScaling(cg->yty, step*dk_yk, snorm*snorm, &tau_bfgs, cg->bfgs_scale));
9566063dSJacob Faibussowitsch        PetscCall(TaoBNCGComputeScalarScaling(cg->yty, step*dk_yk, snorm*snorm, &tau_dfp, cg->dfp_scale));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->yk, tao->gradient, &gkp1_yk));
484c7b14SAdam Denchfield        tau_k = cg->theta*tau_bfgs + (1.0-cg->theta)*tau_dfp;
484c7b14SAdam Denchfield        /* If bfgs_scale = 1.0, it should reproduce the bfgs tau_bfgs. If bfgs_scale = 0.0,
484c7b14SAdam Denchfield           it should reproduce the tau_dfp scaling. Same with dfp_scale.   */
484c7b14SAdam Denchfield        tmp = cg->theta*tau_bfgs*gd/dk_yk + (1-cg->theta)*tau_dfp*gkp1_yk/cg->yty;
484c7b14SAdam Denchfield        beta = cg->theta*tau_bfgs*(gkp1_yk/dk_yk - cg->yty*gd/(dk_yk*dk_yk)) - step*gd/dk_yk;
484c7b14SAdam Denchfield        /* d <- -t*g + beta*d + tmp*yk */
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBYPCZ(tao->stepdirection, -tau_k, tmp, beta, tao->gradient, cg->yk));
484c7b14SAdam Denchfield      } else {
484c7b14SAdam Denchfield        /* We have diagonal scaling enabled */
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(cg->B, tao->gradient, cg->g_work));
9566063dSJacob Faibussowitsch        PetscCall(MatSolve(cg->B, cg->yk, cg->y_work));
484c7b14SAdam Denchfield        /* compute scalar gamma */
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->g_work, cg->yk, &gkp1_yk));
9566063dSJacob Faibussowitsch        PetscCall(VecDot(cg->y_work, cg->yk, &tmp));
484c7b14SAdam Denchfield        gamma = cg->theta*gd/dk_yk + (1-cg->theta)*(gkp1_yk/tmp);
484c7b14SAdam Denchfield        /* Compute scalar beta */
484c7b14SAdam Denchfield        beta = cg->theta*(gkp1_yk/dk_yk - gd*tmp/(dk_yk*dk_yk)) - step*gd/dk_yk;
484c7b14SAdam Denchfield        /* Compute stepdirection dkp1 = gamma*Dkyk + beta*dk - Dkgkp1 */
9566063dSJacob Faibussowitsch        PetscCall(VecAXPBYPCZ(tao->stepdirection, -1.0, gamma, beta, cg->g_work, cg->y_work));
484c7b14SAdam Denchfield      }
484c7b14SAdam Denchfield      break;
484c7b14SAdam Denchfield
c8bcdf1eSAdam Denchfield    default:
c8bcdf1eSAdam Denchfield      break;
484c7b14SAdam Denchfield
c8bcdf1eSAdam Denchfield    }
c8bcdf1eSAdam Denchfield  }
c8bcdf1eSAdam Denchfield  PetscFunctionReturn(0);
c8bcdf1eSAdam Denchfield}
c8bcdf1eSAdam Denchfield
c8bcdf1eSAdam DenchfieldPETSC_INTERN PetscErrorCode TaoBNCGConductIteration(Tao tao, PetscReal gnorm)
c8bcdf1eSAdam Denchfield{
c8bcdf1eSAdam Denchfield  TAO_BNCG                     *cg = (TAO_BNCG*)tao->data;
c8bcdf1eSAdam Denchfield  TaoLineSearchConvergedReason ls_status = TAOLINESEARCH_CONTINUE_ITERATING;
8ca2df50S  PetscReal                    step=1.0,gnorm2,gd,dnorm=0.0;
c8bcdf1eSAdam Denchfield  PetscReal                    gnorm2_old,f_old,resnorm, gnorm_old;
c624ebd3SAlp Dener  PetscBool                    pcgd_fallback = PETSC_FALSE;
c8bcdf1eSAdam Denchfield
c8bcdf1eSAdam Denchfield  PetscFunctionBegin;
c8bcdf1eSAdam Denchfield  /* We are now going to perform a line search along the direction. */
c8bcdf1eSAdam Denchfield  /* Store solution and gradient info before it changes */
9566063dSJacob Faibussowitsch  PetscCall(VecCopy(tao->solution, cg->X_old));
9566063dSJacob Faibussowitsch  PetscCall(VecCopy(tao->gradient, cg->G_old));
9566063dSJacob Faibussowitsch  PetscCall(VecCopy(cg->unprojected_gradient, cg->unprojected_gradient_old));
c8bcdf1eSAdam Denchfield
c8bcdf1eSAdam Denchfield  gnorm_old = gnorm;
c8bcdf1eSAdam Denchfield  gnorm2_old = gnorm_old*gnorm_old;
c8bcdf1eSAdam Denchfield  f_old = cg->f;
484c7b14SAdam Denchfield  /* Perform bounded line search. If we are recycling a solution from a previous */
484c7b14SAdam Denchfield  /* TaoSolve, then we want to immediately skip to calculating a new direction rather than performing a linesearch */
414d97d3SAlp Dener  if (!(tao->recycle && 0 == tao->niter)) {
484c7b14SAdam Denchfield    /* Above logic: the below code happens every iteration, except for the first iteration of a recycled TaoSolve */
9566063dSJacob Faibussowitsch    PetscCall(TaoLineSearchSetInitialStepLength(tao->linesearch, 1.0));
9566063dSJacob Faibussowitsch    PetscCall(TaoLineSearchApply(tao->linesearch, tao->solution, &cg->f, cg->unprojected_gradient, tao->stepdirection, &step, &ls_status));
9566063dSJacob Faibussowitsch    PetscCall(TaoAddLineSearchCounts(tao));
c8bcdf1eSAdam Denchfield
c8bcdf1eSAdam Denchfield    /*  Check linesearch failure */
c8bcdf1eSAdam Denchfield    if (ls_status != TAOLINESEARCH_SUCCESS && ls_status != TAOLINESEARCH_SUCCESS_USER) {
c8bcdf1eSAdam Denchfield      ++cg->ls_fails;
c624ebd3SAlp Dener      if (cg->cg_type == CG_GradientDescent) {
c8bcdf1eSAdam Denchfield        /* Nothing left to do but fail out of the optimization */
c8bcdf1eSAdam Denchfield        step = 0.0;
c8bcdf1eSAdam Denchfield        tao->reason = TAO_DIVERGED_LS_FAILURE;
c8bcdf1eSAdam Denchfield      } else {
484c7b14SAdam Denchfield        /* Restore previous point, perform preconditioned GD and regular GD steps at the last good point */
9566063dSJacob Faibussowitsch        PetscCall(VecCopy(cg->X_old, tao->solution));
9566063dSJacob Faibussowitsch        PetscCall(VecCopy(cg->G_old, tao->gradient));
9566063dSJacob Faibussowitsch        PetscCall(VecCopy(cg->unprojected_gradient_old, cg->unprojected_gradient));
c8bcdf1eSAdam Denchfield        gnorm = gnorm_old;
c8bcdf1eSAdam Denchfield        gnorm2 = gnorm2_old;
c8bcdf1eSAdam Denchfield        cg->f = f_old;
c8bcdf1eSAdam Denchfield
484c7b14SAdam Denchfield        /* Fall back on preconditioned CG (so long as you're not already using it) */
484c7b14SAdam Denchfield        if (cg->cg_type != CG_PCGradientDescent && cg->diag_scaling) {
e2570530SAlp Dener          pcgd_fallback = PETSC_TRUE;
9566063dSJacob Faibussowitsch          PetscCall(TaoBNCGStepDirectionUpdate(tao, gnorm2, step, f_old, gnorm2_old, dnorm, pcgd_fallback));
484c7b14SAdam Denchfield
9566063dSJacob Faibussowitsch          PetscCall(TaoBNCGResetUpdate(tao, gnorm2));
9566063dSJacob Faibussowitsch          PetscCall(TaoBNCGBoundStep(tao, cg->as_type, tao->stepdirection));
c8bcdf1eSAdam Denchfield
9566063dSJacob Faibussowitsch          PetscCall(TaoLineSearchSetInitialStepLength(tao->linesearch, 1.0));
9566063dSJacob Faibussowitsch          PetscCall(TaoLineSearchApply(tao->linesearch, tao->solution, &cg->f, cg->unprojected_gradient, tao->stepdirection, &step, &ls_status));
9566063dSJacob Faibussowitsch          PetscCall(TaoAddLineSearchCounts(tao));
c8bcdf1eSAdam Denchfield
484c7b14SAdam Denchfield          pcgd_fallback = PETSC_FALSE;
484c7b14SAdam Denchfield          if (ls_status != TAOLINESEARCH_SUCCESS && ls_status != TAOLINESEARCH_SUCCESS_USER) {
484c7b14SAdam Denchfield            /* Going to perform a regular gradient descent step. */
484c7b14SAdam Denchfield            ++cg->ls_fails;
484c7b14SAdam Denchfield            step = 0.0;
484c7b14SAdam Denchfield          }
484c7b14SAdam Denchfield        }
484c7b14SAdam Denchfield        /* Fall back on the scaled gradient step */
484c7b14SAdam Denchfield        if (ls_status != TAOLINESEARCH_SUCCESS && ls_status != TAOLINESEARCH_SUCCESS_USER) {
484c7b14SAdam Denchfield          ++cg->ls_fails;
9566063dSJacob Faibussowitsch          PetscCall(TaoBNCGResetUpdate(tao, gnorm2));
9566063dSJacob Faibussowitsch          PetscCall(TaoBNCGBoundStep(tao, cg->as_type, tao->stepdirection));
9566063dSJacob Faibussowitsch          PetscCall(TaoLineSearchSetInitialStepLength(tao->linesearch, 1.0));
9566063dSJacob Faibussowitsch          PetscCall(TaoLineSearchApply(tao->linesearch, tao->solution, &cg->f, cg->unprojected_gradient, tao->stepdirection, &step, &ls_status));
9566063dSJacob Faibussowitsch          PetscCall(TaoAddLineSearchCounts(tao));
484c7b14SAdam Denchfield        }
484c7b14SAdam Denchfield
c8bcdf1eSAdam Denchfield        if (ls_status != TAOLINESEARCH_SUCCESS && ls_status != TAOLINESEARCH_SUCCESS_USER) {
c8bcdf1eSAdam Denchfield          /* Nothing left to do but fail out of the optimization */
50b47da0SAdam Denchfield          ++cg->ls_fails;
c8bcdf1eSAdam Denchfield          step = 0.0;
c8bcdf1eSAdam Denchfield          tao->reason = TAO_DIVERGED_LS_FAILURE;
484c7b14SAdam Denchfield        } else {
484c7b14SAdam Denchfield          /* One of the fallbacks worked. Set them both back equal to false. */
484c7b14SAdam Denchfield          pcgd_fallback = PETSC_FALSE;
c8bcdf1eSAdam Denchfield        }
c8bcdf1eSAdam Denchfield      }
c8bcdf1eSAdam Denchfield    }
c8bcdf1eSAdam Denchfield    /* Convergence test for line search failure */
c8bcdf1eSAdam Denchfield    if (tao->reason != TAO_CONTINUE_ITERATING) PetscFunctionReturn(0);
c8bcdf1eSAdam Denchfield
c8bcdf1eSAdam Denchfield    /* Standard convergence test */
9566063dSJacob Faibussowitsch    PetscCall(VecFischer(tao->solution, cg->unprojected_gradient, tao->XL, tao->XU, cg->W));
9566063dSJacob Faibussowitsch    PetscCall(VecNorm(cg->W, NORM_2, &resnorm));
3c859ba3SBarry Smith    PetscCheck(!PetscIsInfOrNanReal(resnorm),PetscObjectComm((PetscObject)tao),PETSC_ERR_USER, "User provided compute function generated Inf or NaN");
9566063dSJacob Faibussowitsch    PetscCall(TaoLogConvergenceHistory(tao, cg->f, resnorm, 0.0, tao->ksp_its));
9566063dSJacob Faibussowitsch    PetscCall(TaoMonitor(tao, tao->niter, cg->f, resnorm, 0.0, step));
*dbbe0bcdSBarry Smith    PetscUseTypeMethod(tao,convergencetest ,tao->cnvP);
c8bcdf1eSAdam Denchfield    if (tao->reason != TAO_CONTINUE_ITERATING) PetscFunctionReturn(0);
484c7b14SAdam Denchfield  }
c8bcdf1eSAdam Denchfield  /* Assert we have an updated step and we need at least one more iteration. */
c8bcdf1eSAdam Denchfield  /* Calculate the next direction */
c8bcdf1eSAdam Denchfield  /* Estimate the active set at the new solution */
9566063dSJacob Faibussowitsch  PetscCall(TaoBNCGEstimateActiveSet(tao, cg->as_type));
c8bcdf1eSAdam Denchfield  /* Compute the projected gradient and its norm */
9566063dSJacob Faibussowitsch  PetscCall(VecCopy(cg->unprojected_gradient, tao->gradient));
9566063dSJacob Faibussowitsch  PetscCall(VecISSet(tao->gradient, cg->active_idx, 0.0));
9566063dSJacob Faibussowitsch  PetscCall(VecNorm(tao->gradient,NORM_2,&gnorm));
c8bcdf1eSAdam Denchfield  gnorm2 = gnorm*gnorm;
c8bcdf1eSAdam Denchfield
484c7b14SAdam Denchfield  /* Calculate some quantities used in the StepDirectionUpdate. */
9566063dSJacob Faibussowitsch  PetscCall(VecNorm(tao->stepdirection, NORM_2, &dnorm));
484c7b14SAdam Denchfield  /* Update the step direction. */
9566063dSJacob Faibussowitsch  PetscCall(TaoBNCGStepDirectionUpdate(tao, gnorm2, step, f_old, gnorm2_old, dnorm, pcgd_fallback));
484c7b14SAdam Denchfield  ++tao->niter;
9566063dSJacob Faibussowitsch  PetscCall(TaoBNCGBoundStep(tao, cg->as_type, tao->stepdirection));
c8bcdf1eSAdam Denchfield
c8bcdf1eSAdam Denchfield  if (cg->cg_type != CG_GradientDescent) {
c8bcdf1eSAdam Denchfield    /* Figure out which previously active variables became inactive this iteration */
9566063dSJacob Faibussowitsch    PetscCall(ISDestroy(&cg->new_inactives));
c8bcdf1eSAdam Denchfield    if (cg->inactive_idx && cg->inactive_old) {
9566063dSJacob Faibussowitsch      PetscCall(ISDifference(cg->inactive_idx, cg->inactive_old, &cg->new_inactives));
c8bcdf1eSAdam Denchfield    }
c8bcdf1eSAdam Denchfield    /* Selectively reset the CG step those freshly inactive variables */
c8bcdf1eSAdam Denchfield    if (cg->new_inactives) {
9566063dSJacob Faibussowitsch      PetscCall(VecGetSubVector(tao->stepdirection, cg->new_inactives, &cg->inactive_step));
9566063dSJacob Faibussowitsch      PetscCall(VecGetSubVector(cg->unprojected_gradient, cg->new_inactives, &cg->inactive_grad));
9566063dSJacob Faibussowitsch      PetscCall(VecCopy(cg->inactive_grad, cg->inactive_step));
9566063dSJacob Faibussowitsch      PetscCall(VecScale(cg->inactive_step, -1.0));
9566063dSJacob Faibussowitsch      PetscCall(VecRestoreSubVector(tao->stepdirection, cg->new_inactives, &cg->inactive_step));
9566063dSJacob Faibussowitsch      PetscCall(VecRestoreSubVector(cg->unprojected_gradient, cg->new_inactives, &cg->inactive_grad));
c8bcdf1eSAdam Denchfield    }
c8bcdf1eSAdam Denchfield    /* Verify that this is a descent direction */
9566063dSJacob Faibussowitsch    PetscCall(VecDot(tao->gradient, tao->stepdirection, &gd));
9566063dSJacob Faibussowitsch    PetscCall(VecNorm(tao->stepdirection, NORM_2, &dnorm));
50b47da0SAdam Denchfield    if (PetscIsInfOrNanReal(gd) || (gd/(dnorm*dnorm) <= -1e10 || gd/(dnorm*dnorm) >= -1e-10)) {
c8bcdf1eSAdam Denchfield      /* Not a descent direction, so we reset back to projected gradient descent */
9566063dSJacob Faibussowitsch      PetscCall(TaoBNCGResetUpdate(tao, gnorm2));
9566063dSJacob Faibussowitsch      PetscCall(TaoBNCGBoundStep(tao, cg->as_type, tao->stepdirection));
c8bcdf1eSAdam Denchfield      ++cg->descent_error;
c8bcdf1eSAdam Denchfield    } else {
c8bcdf1eSAdam Denchfield    }
c8bcdf1eSAdam Denchfield  }
ac9112b8SAlp Dener  PetscFunctionReturn(0);
ac9112b8SAlp Dener}
484c7b14SAdam Denchfield
484c7b14SAdam DenchfieldPetscErrorCode TaoBNCGSetH0(Tao tao, Mat H0)
484c7b14SAdam Denchfield{
484c7b14SAdam Denchfield  TAO_BNCG                     *cg = (TAO_BNCG*)tao->data;
484c7b14SAdam Denchfield
484c7b14SAdam Denchfield  PetscFunctionBegin;
9566063dSJacob Faibussowitsch  PetscCall(PetscObjectReference((PetscObject)H0));
484c7b14SAdam Denchfield  cg->pc = H0;
484c7b14SAdam Denchfield  PetscFunctionReturn(0);
484c7b14SAdam Denchfield}