impls/bnk/bntl.c

c14b763aSAlp Dener#include <../src/tao/bound/impls/bnk/bnk.h>
c14b763aSAlp Dener#include <petscksp.h>
c14b763aSAlp Dener
c14b763aSAlp Dener/*
c14b763aSAlp Dener Implements Newton's Method with a trust region approach for solving
198282dbSAlp Dener bound constrained minimization problems.
c14b763aSAlp Dener
c4b75bccSAlp Dener In this variant, the trust region failures trigger a line search with
c4b75bccSAlp Dener the existing Newton step instead of re-solving the step with a
c4b75bccSAlp Dener different radius.
c4b75bccSAlp Dener
198282dbSAlp Dener ------------------------------------------------------------
198282dbSAlp Dener
198282dbSAlp Dener x_0 = VecMedian(x_0)
198282dbSAlp Dener f_0, g_0 = TaoComputeObjectiveAndGradient(x_0)
c4b75bccSAlp Dener pg_0 = project(g_0)
198282dbSAlp Dener check convergence at pg_0
c4b75bccSAlp Dener needH = TaoBNKInitialize(default:BNK_INIT_INTERPOLATION)
198282dbSAlp Dener niter = 0
198282dbSAlp Dener step_accepted = true
198282dbSAlp Dener
198282dbSAlp Dener while niter <= max_it
198282dbSAlp Dener    niter += 1
c4b75bccSAlp Dener
c4b75bccSAlp Dener    if needH
c4b75bccSAlp Dener      If max_cg_steps > 0
c4b75bccSAlp Dener        x_k, g_k, pg_k = TaoSolve(BNCG)
c4b75bccSAlp Dener      end
c4b75bccSAlp Dener
198282dbSAlp Dener      H_k = TaoComputeHessian(x_k)
198282dbSAlp Dener      if pc_type == BNK_PC_BFGS
198282dbSAlp Dener        add correction to BFGS approx
198282dbSAlp Dener        if scale_type == BNK_SCALE_AHESS
198282dbSAlp Dener          D = VecMedian(1e-6, abs(diag(H_k)), 1e6)
198282dbSAlp Dener          scale BFGS with VecReciprocal(D)
198282dbSAlp Dener        end
198282dbSAlp Dener      end
c4b75bccSAlp Dener      needH = False
c4b75bccSAlp Dener    end
198282dbSAlp Dener
198282dbSAlp Dener    if pc_type = BNK_PC_BFGS
198282dbSAlp Dener      B_k = BFGS
198282dbSAlp Dener    else
198282dbSAlp Dener      B_k = VecMedian(1e-6, abs(diag(H_k)), 1e6)
198282dbSAlp Dener      B_k = VecReciprocal(B_k)
198282dbSAlp Dener    end
198282dbSAlp Dener    w = x_k - VecMedian(x_k - 0.001*B_k*g_k)
198282dbSAlp Dener    eps = min(eps, norm2(w))
198282dbSAlp Dener    determine the active and inactive index sets such that
198282dbSAlp Dener      L = {i : (x_k)_i <= l_i + eps && (g_k)_i > 0}
198282dbSAlp Dener      U = {i : (x_k)_i >= u_i - eps && (g_k)_i < 0}
198282dbSAlp Dener      F = {i : l_i = (x_k)_i = u_i}
198282dbSAlp Dener      A = {L + U + F}
c4b75bccSAlp Dener      IA = {i : i not in A}
198282dbSAlp Dener
c4b75bccSAlp Dener    generate the reduced system Hr_k dr_k = -gr_k for variables in IA
198282dbSAlp Dener    if pc_type == BNK_PC_BFGS && scale_type == BNK_SCALE_PHESS
198282dbSAlp Dener      D = VecMedian(1e-6, abs(diag(Hr_k)), 1e6)
198282dbSAlp Dener      scale BFGS with VecReciprocal(D)
198282dbSAlp Dener    end
198282dbSAlp Dener    solve Hr_k dr_k = -gr_k
198282dbSAlp Dener    set d_k to (l - x) for variables in L, (u - x) for variables in U, and 0 for variables in F
198282dbSAlp Dener
198282dbSAlp Dener    x_{k+1} = VecMedian(x_k + d_k)
198282dbSAlp Dener    s = x_{k+1} - x_k
198282dbSAlp Dener    prered = dot(s, 0.5*gr_k - Hr_k*s)
198282dbSAlp Dener    f_{k+1} = TaoComputeObjective(x_{k+1})
198282dbSAlp Dener    actred = f_k - f_{k+1}
198282dbSAlp Dener
198282dbSAlp Dener    oldTrust = trust
198282dbSAlp Dener    step_accepted, trust = TaoBNKUpdateTrustRadius(default: BNK_UPDATE_REDUCTION)
198282dbSAlp Dener    if step_accepted
198282dbSAlp Dener      g_{k+1} = TaoComputeGradient(x_{k+1})
c4b75bccSAlp Dener      pg_{k+1} = project(g_{k+1})
198282dbSAlp Dener      count the accepted Newton step
198282dbSAlp Dener    else
198282dbSAlp Dener      if dot(d_k, pg_k)) >= 0 || norm(d_k) == NaN || norm(d_k) == Inf
198282dbSAlp Dener        dr_k = -BFGS*gr_k for variables in I
198282dbSAlp Dener        if dot(d_k, pg_k)) >= 0 || norm(d_k) == NaN || norm(d_k) == Inf
198282dbSAlp Dener          reset the BFGS preconditioner
198282dbSAlp Dener          calculate scale delta and apply it to BFGS
198282dbSAlp Dener          dr_k = -BFGS*gr_k for variables in I
198282dbSAlp Dener          if dot(d_k, pg_k)) >= 0 || norm(d_k) == NaN || norm(d_k) == Inf
198282dbSAlp Dener            dr_k = -gr_k for variables in I
198282dbSAlp Dener          end
198282dbSAlp Dener        end
198282dbSAlp Dener      end
198282dbSAlp Dener
198282dbSAlp Dener      x_{k+1}, f_{k+1}, g_{k+1}, ls_failed = TaoBNKPerformLineSearch()
198282dbSAlp Dener      if ls_failed
198282dbSAlp Dener        f_{k+1} = f_k
198282dbSAlp Dener        x_{k+1} = x_k
198282dbSAlp Dener        g_{k+1} = g_k
198282dbSAlp Dener        pg_{k+1} = pg_k
198282dbSAlp Dener        terminate
198282dbSAlp Dener      else
c4b75bccSAlp Dener        pg_{k+1} = project(g_{k+1})
198282dbSAlp Dener        trust = oldTrust
198282dbSAlp Dener        trust = TaoBNKUpdateTrustRadius(BNK_UPDATE_STEP)
198282dbSAlp Dener        count the accepted step type (Newton, BFGS, scaled grad or grad)
198282dbSAlp Dener      end
198282dbSAlp Dener    end
198282dbSAlp Dener
198282dbSAlp Dener    check convergence at pg_{k+1}
198282dbSAlp Dener end
c14b763aSAlp Dener*/
c14b763aSAlp Dener
d71ae5a4SJacob FaibussowitschPetscErrorCode TaoSolve_BNTL(Tao tao)
d71ae5a4SJacob Faibussowitsch{
c14b763aSAlp Dener  TAO_BNK                     *bnk = (TAO_BNK *)tao->data;
e465cd6fSAlp Dener  KSPConvergedReason           ksp_reason;
c14b763aSAlp Dener  TaoLineSearchConvergedReason ls_reason;
c14b763aSAlp Dener
89da521bSAlp Dener  PetscReal oldTrust, prered, actred, steplen, resnorm;
937a31a1SAlp Dener  PetscBool cgTerminate, needH = PETSC_TRUE, stepAccepted, shift = PETSC_FALSE;
c4b75bccSAlp Dener  PetscInt  stepType, nDiff;
c14b763aSAlp Dener
c14b763aSAlp Dener  PetscFunctionBegin;
28017e9fSAlp Dener  /* Initialize the preconditioner, KSP solver and trust radius/line search */
c14b763aSAlp Dener  tao->reason = TAO_CONTINUE_ITERATING;
9566063dSJacob Faibussowitsch  PetscCall(TaoBNKInitialize(tao, bnk->init_type, &needH));
3ba16761SJacob Faibussowitsch  if (tao->reason != TAO_CONTINUE_ITERATING) PetscFunctionReturn(PETSC_SUCCESS);
c14b763aSAlp Dener
c14b763aSAlp Dener  /* Have not converged; continue with Newton method */
c14b763aSAlp Dener  while (tao->reason == TAO_CONTINUE_ITERATING) {
e1e80dc8SAlp Dener    /* Call general purpose update function */
e1e80dc8SAlp Dener    if (tao->ops->update) {
dbbe0bcdSBarry Smith      PetscUseTypeMethod(tao, update, tao->niter, tao->user_update);
7494f0b1SStefano Zampini      PetscCall(TaoComputeObjectiveAndGradient(tao, tao->solution, &bnk->f, bnk->unprojected_gradient));
e1e80dc8SAlp Dener    }
62675beeSAlp Dener
89da521bSAlp Dener    if (needH && bnk->inactive_idx) {
e031d6f5SAlp Dener      /* Take BNCG steps (if enabled) to trade-off Hessian evaluations for more gradient evaluations */
9566063dSJacob Faibussowitsch      PetscCall(TaoBNKTakeCGSteps(tao, &cgTerminate));
e031d6f5SAlp Dener      if (cgTerminate) {
e031d6f5SAlp Dener        tao->reason = bnk->bncg->reason;
3ba16761SJacob Faibussowitsch        PetscFunctionReturn(PETSC_SUCCESS);
e031d6f5SAlp Dener      }
08752603SAlp Dener      /* Compute the hessian and update the BFGS preconditioner at the new iterate */
9566063dSJacob Faibussowitsch      PetscCall((*bnk->computehessian)(tao));
937a31a1SAlp Dener      needH = PETSC_FALSE;
937a31a1SAlp Dener    }
c14b763aSAlp Dener
8d5ead36SAlp Dener    /* Use the common BNK kernel to compute the Newton step (for inactive variables only) */
9566063dSJacob Faibussowitsch    PetscCall((*bnk->computestep)(tao, shift, &ksp_reason, &stepType));
c14b763aSAlp Dener
c14b763aSAlp Dener    /* Store current solution before it changes */
c14b763aSAlp Dener    oldTrust  = tao->trust;
c14b763aSAlp Dener    bnk->fold = bnk->f;
9566063dSJacob Faibussowitsch    PetscCall(VecCopy(tao->solution, bnk->Xold));
9566063dSJacob Faibussowitsch    PetscCall(VecCopy(tao->gradient, bnk->Gold));
9566063dSJacob Faibussowitsch    PetscCall(VecCopy(bnk->unprojected_gradient, bnk->unprojected_gradient_old));
c14b763aSAlp Dener
c14b763aSAlp Dener    /* Temporarily accept the step and project it into the bounds */
9566063dSJacob Faibussowitsch    PetscCall(VecAXPY(tao->solution, 1.0, tao->stepdirection));
9566063dSJacob Faibussowitsch    PetscCall(TaoBoundSolution(tao->solution, tao->XL, tao->XU, 0.0, &nDiff, tao->solution));
c14b763aSAlp Dener
c14b763aSAlp Dener    /* Check if the projection changed the step direction */
c4b75bccSAlp Dener    if (nDiff > 0) {
c4b75bccSAlp Dener      /* Projection changed the step, so we have to recompute the step and
c4b75bccSAlp Dener         the predicted reduction. Leave the trust radius unchanged. */
9566063dSJacob Faibussowitsch      PetscCall(VecCopy(tao->solution, tao->stepdirection));
9566063dSJacob Faibussowitsch      PetscCall(VecAXPY(tao->stepdirection, -1.0, bnk->Xold));
9566063dSJacob Faibussowitsch      PetscCall(TaoBNKRecomputePred(tao, tao->stepdirection, &prered));
c14b763aSAlp Dener    } else {
c14b763aSAlp Dener      /* Step did not change, so we can just recover the pre-computed prediction */
9566063dSJacob Faibussowitsch      PetscCall(KSPCGGetObjFcn(tao->ksp, &prered));
c14b763aSAlp Dener    }
c14b763aSAlp Dener    prered = -prered;
c14b763aSAlp Dener
c14b763aSAlp Dener    /* Compute the actual reduction and update the trust radius */
9566063dSJacob Faibussowitsch    PetscCall(TaoComputeObjective(tao, tao->solution, &bnk->f));
3c859ba3SBarry Smith    PetscCheck(!PetscIsInfOrNanReal(bnk->f), PetscObjectComm((PetscObject)tao), PETSC_ERR_USER, "User provided compute function generated Inf or NaN");
c14b763aSAlp Dener    actred = bnk->fold - bnk->f;
9566063dSJacob Faibussowitsch    PetscCall(TaoBNKUpdateTrustRadius(tao, prered, actred, bnk->update_type, stepType, &stepAccepted));
c14b763aSAlp Dener
c14b763aSAlp Dener    if (stepAccepted) {
c14b763aSAlp Dener      /* Step is good, evaluate the gradient and the hessian */
8d5ead36SAlp Dener      steplen = 1.0;
937a31a1SAlp Dener      needH   = PETSC_TRUE;
e465cd6fSAlp Dener      ++bnk->newt;
9566063dSJacob Faibussowitsch      PetscCall(TaoComputeGradient(tao, tao->solution, bnk->unprojected_gradient));
9566063dSJacob Faibussowitsch      PetscCall(TaoBNKEstimateActiveSet(tao, bnk->as_type));
9566063dSJacob Faibussowitsch      PetscCall(VecCopy(bnk->unprojected_gradient, tao->gradient));
*976ed0a4SStefano Zampini      if (bnk->active_idx) PetscCall(VecISSet(tao->gradient, bnk->active_idx, 0.0));
9566063dSJacob Faibussowitsch      PetscCall(TaoGradientNorm(tao, tao->gradient, NORM_2, &bnk->gnorm));
c14b763aSAlp Dener    } else {
c14b763aSAlp Dener      /* Trust-region rejected the step. Revert the solution. */
c14b763aSAlp Dener      bnk->f = bnk->fold;
9566063dSJacob Faibussowitsch      PetscCall(VecCopy(bnk->Xold, tao->solution));
c14b763aSAlp Dener      /* Trigger the line search */
9566063dSJacob Faibussowitsch      PetscCall(TaoBNKSafeguardStep(tao, ksp_reason, &stepType));
9566063dSJacob Faibussowitsch      PetscCall(TaoBNKPerformLineSearch(tao, &stepType, &steplen, &ls_reason));
c14b763aSAlp Dener      if (ls_reason != TAOLINESEARCH_SUCCESS && ls_reason != TAOLINESEARCH_SUCCESS_USER) {
c14b763aSAlp Dener        /* Line search failed, revert solution and terminate */
c0f10754SAlp Dener        stepAccepted = PETSC_FALSE;
937a31a1SAlp Dener        needH        = PETSC_FALSE;
c14b763aSAlp Dener        bnk->f       = bnk->fold;
9566063dSJacob Faibussowitsch        PetscCall(VecCopy(bnk->Xold, tao->solution));
9566063dSJacob Faibussowitsch        PetscCall(VecCopy(bnk->Gold, tao->gradient));
9566063dSJacob Faibussowitsch        PetscCall(VecCopy(bnk->unprojected_gradient_old, bnk->unprojected_gradient));
c14b763aSAlp Dener        tao->trust  = 0.0;
c14b763aSAlp Dener        tao->reason = TAO_DIVERGED_LS_FAILURE;
c14b763aSAlp Dener      } else {
937a31a1SAlp Dener        /* new iterate so we need to recompute the Hessian */
937a31a1SAlp Dener        needH = PETSC_TRUE;
198282dbSAlp Dener        /* compute the projected gradient */
9566063dSJacob Faibussowitsch        PetscCall(TaoBNKEstimateActiveSet(tao, bnk->as_type));
9566063dSJacob Faibussowitsch        PetscCall(VecCopy(bnk->unprojected_gradient, tao->gradient));
*976ed0a4SStefano Zampini        if (bnk->active_idx) PetscCall(VecISSet(tao->gradient, bnk->active_idx, 0.0));
9566063dSJacob Faibussowitsch        PetscCall(TaoGradientNorm(tao, tao->gradient, NORM_2, &bnk->gnorm));
c14b763aSAlp Dener        /* Line search succeeded so we should update the trust radius based on the LS step length */
770b7498SAlp Dener        tao->trust = oldTrust;
9566063dSJacob Faibussowitsch        PetscCall(TaoBNKUpdateTrustRadius(tao, prered, actred, BNK_UPDATE_STEP, stepType, &stepAccepted));
62675beeSAlp Dener        /* count the accepted step type */
9566063dSJacob Faibussowitsch        PetscCall(TaoBNKAddStepCounts(tao, stepType));
c14b763aSAlp Dener      }
c14b763aSAlp Dener    }
c14b763aSAlp Dener
c14b763aSAlp Dener    /*  Check for termination */
9566063dSJacob Faibussowitsch    PetscCall(VecFischer(tao->solution, bnk->unprojected_gradient, tao->XL, tao->XU, bnk->W));
9566063dSJacob Faibussowitsch    PetscCall(VecNorm(bnk->W, NORM_2, &resnorm));
3c859ba3SBarry Smith    PetscCheck(!PetscIsInfOrNanReal(resnorm), PetscObjectComm((PetscObject)tao), PETSC_ERR_USER, "User provided compute function generated Inf or NaN");
0f0abf79SStefano Zampini    ++tao->niter;
9566063dSJacob Faibussowitsch    PetscCall(TaoLogConvergenceHistory(tao, bnk->f, resnorm, 0.0, tao->ksp_its));
9566063dSJacob Faibussowitsch    PetscCall(TaoMonitor(tao, tao->niter, bnk->f, resnorm, 0.0, steplen));
dbbe0bcdSBarry Smith    PetscUseTypeMethod(tao, convergencetest, tao->cnvP);
c14b763aSAlp Dener  }
3ba16761SJacob Faibussowitsch  PetscFunctionReturn(PETSC_SUCCESS);
c14b763aSAlp Dener}
c14b763aSAlp Dener
df278d8fSAlp Dener/*------------------------------------------------------------*/
d71ae5a4SJacob Faibussowitschstatic PetscErrorCode TaoSetUp_BNTL(Tao tao)
d71ae5a4SJacob Faibussowitsch{
2e6e4ca1SStefano Zampini  KSP               ksp;
2e6e4ca1SStefano Zampini  PetscVoidFunction valid;
5eb5f4d6SAlp Dener
5eb5f4d6SAlp Dener  PetscFunctionBegin;
9566063dSJacob Faibussowitsch  PetscCall(TaoSetUp_BNK(tao));
9566063dSJacob Faibussowitsch  PetscCall(TaoGetKSP(tao, &ksp));
9566063dSJacob Faibussowitsch  PetscCall(PetscObjectQueryFunction((PetscObject)ksp, "KSPCGSetRadius_C", &valid));
3c859ba3SBarry Smith  PetscCheck(valid, PetscObjectComm((PetscObject)tao), PETSC_ERR_SUP, "Not for KSP type %s. Must use a trust-region CG method for KSP (e.g. KSPNASH, KSPSTCG, KSPGLTR)", ((PetscObject)ksp)->type_name);
3ba16761SJacob Faibussowitsch  PetscFunctionReturn(PETSC_SUCCESS);
5eb5f4d6SAlp Dener}
5eb5f4d6SAlp Dener
5eb5f4d6SAlp Dener/*------------------------------------------------------------*/
d71ae5a4SJacob Faibussowitschstatic PetscErrorCode TaoSetFromOptions_BNTL(Tao tao, PetscOptionItems *PetscOptionsObject)
d71ae5a4SJacob Faibussowitsch{
9b6ef848SAlp Dener  TAO_BNK *bnk = (TAO_BNK *)tao->data;
9b6ef848SAlp Dener
9b6ef848SAlp Dener  PetscFunctionBegin;
dbbe0bcdSBarry Smith  PetscCall(TaoSetFromOptions_BNK(tao, PetscOptionsObject));
e0ed867bSAlp Dener  if (bnk->update_type == BNK_UPDATE_STEP) bnk->update_type = BNK_UPDATE_REDUCTION;
3ba16761SJacob Faibussowitsch  PetscFunctionReturn(PETSC_SUCCESS);
9b6ef848SAlp Dener}
9b6ef848SAlp Dener
9b6ef848SAlp Dener/*------------------------------------------------------------*/
3850be85SAlp Dener/*MC
3850be85SAlp Dener  TAOBNTL - Bounded Newton Trust Region method with line-search fall-back for nonlinear
3850be85SAlp Dener            minimization with bound constraints.
9b6ef848SAlp Dener
3850be85SAlp Dener  Options Database Keys:
3850be85SAlp Dener  + -tao_bnk_max_cg_its - maximum number of bounded conjugate-gradient iterations taken in each Newton loop
3850be85SAlp Dener  . -tao_bnk_init_type - trust radius initialization method ("constant", "direction", "interpolation")
3850be85SAlp Dener  . -tao_bnk_update_type - trust radius update method ("step", "direction", "interpolation")
3850be85SAlp Dener  - -tao_bnk_as_type - active-set estimation method ("none", "bertsekas")
3850be85SAlp Dener
3850be85SAlp Dener  Level: beginner
3850be85SAlp DenerM*/
d71ae5a4SJacob FaibussowitschPETSC_EXTERN PetscErrorCode TaoCreate_BNTL(Tao tao)
d71ae5a4SJacob Faibussowitsch{
c14b763aSAlp Dener  TAO_BNK *bnk;
c14b763aSAlp Dener
c14b763aSAlp Dener  PetscFunctionBegin;
9566063dSJacob Faibussowitsch  PetscCall(TaoCreate_BNK(tao));
c14b763aSAlp Dener  tao->ops->solve          = TaoSolve_BNTL;
5eb5f4d6SAlp Dener  tao->ops->setup          = TaoSetUp_BNTL;
e0ed867bSAlp Dener  tao->ops->setfromoptions = TaoSetFromOptions_BNTL;
c14b763aSAlp Dener
c14b763aSAlp Dener  bnk              = (TAO_BNK *)tao->data;
c14b763aSAlp Dener  bnk->update_type = BNK_UPDATE_REDUCTION; /* trust region updates based on predicted/actual reduction */
3ba16761SJacob Faibussowitsch  PetscFunctionReturn(PETSC_SUCCESS);
c14b763aSAlp Dener}