impls/bnk/bntl.c

c14b763aSAlp Dener#include <../src/tao/bound/impls/bnk/bnk.h>
c14b763aSAlp Dener#include <petscksp.h>
c14b763aSAlp Dener
c14b763aSAlp Dener/*
c14b763aSAlp Dener Implements Newton's Method with a trust region approach for solving
c14b763aSAlp Dener bound constrained minimization problems. This version includes a
c14b763aSAlp Dener line search fall-back in the event of a trust region failure.
c14b763aSAlp Dener
df278d8fSAlp Dener The linear system solve has to be done with a conjugate gradient method.
c14b763aSAlp Dener*/
c14b763aSAlp Dener
c14b763aSAlp Denerstatic PetscErrorCode TaoSolve_BNTL(Tao tao)
c14b763aSAlp Dener{
c14b763aSAlp Dener  PetscErrorCode               ierr;
c14b763aSAlp Dener  TAO_BNK                      *bnk = (TAO_BNK *)tao->data;
c14b763aSAlp Dener  TaoLineSearchConvergedReason ls_reason;
c14b763aSAlp Dener
c14b763aSAlp Dener  PetscReal                    oldTrust, prered, actred, stepNorm, gdx, delta, steplen;
c14b763aSAlp Dener  PetscBool                    stepAccepted = PETSC_TRUE;
c14b763aSAlp Dener  PetscInt                     stepType, bfgsUpdates, updateType;
c14b763aSAlp Dener
c14b763aSAlp Dener  PetscFunctionBegin;
c14b763aSAlp Dener  /*   Project the current point onto the feasible set */
c14b763aSAlp Dener  ierr = TaoComputeVariableBounds(tao);CHKERRQ(ierr);
c14b763aSAlp Dener  ierr = TaoLineSearchSetVariableBounds(tao->linesearch,tao->XL,tao->XU);CHKERRQ(ierr);
c14b763aSAlp Dener
c14b763aSAlp Dener  /* Project the initial point onto the feasible region */
c14b763aSAlp Dener  ierr = VecMedian(tao->XL,tao->solution,tao->XU,tao->solution);CHKERRQ(ierr);
c14b763aSAlp Dener
c14b763aSAlp Dener  /* Check convergence criteria */
c14b763aSAlp Dener  ierr = TaoComputeObjectiveAndGradient(tao, tao->solution, &bnk->f, bnk->unprojected_gradient);CHKERRQ(ierr);
c14b763aSAlp Dener  ierr = VecBoundGradientProjection(bnk->unprojected_gradient,tao->solution,tao->XL,tao->XU,tao->gradient);CHKERRQ(ierr);
c14b763aSAlp Dener  ierr = TaoGradientNorm(tao, tao->gradient,NORM_2,&bnk->gnorm);CHKERRQ(ierr);
c14b763aSAlp Dener  if (PetscIsInfOrNanReal(bnk->f) || PetscIsInfOrNanReal(bnk->gnorm)) SETERRQ(PETSC_COMM_SELF,1, "User provided compute function generated Inf or NaN");
c14b763aSAlp Dener
c14b763aSAlp Dener  tao->reason = TAO_CONTINUE_ITERATING;
c14b763aSAlp Dener  ierr = TaoLogConvergenceHistory(tao,bnk->f,bnk->gnorm,0.0,tao->ksp_its);CHKERRQ(ierr);
c14b763aSAlp Dener  ierr = TaoMonitor(tao,tao->niter,bnk->f,bnk->gnorm,0.0,tao->trust);CHKERRQ(ierr);
c14b763aSAlp Dener  ierr = (*tao->ops->convergencetest)(tao,tao->cnvP);CHKERRQ(ierr);
c14b763aSAlp Dener  if (tao->reason != TAO_CONTINUE_ITERATING) PetscFunctionReturn(0);
c14b763aSAlp Dener
c14b763aSAlp Dener  /* Initialize the preconditioner and trust radius */
c14b763aSAlp Dener  ierr = TaoBNKInitialize(tao);CHKERRQ(ierr);
c14b763aSAlp Dener
c14b763aSAlp Dener  /* Have not converged; continue with Newton method */
c14b763aSAlp Dener  while (tao->reason == TAO_CONTINUE_ITERATING) {
c14b763aSAlp Dener    tao->niter++;
c14b763aSAlp Dener    tao->ksp_its=0;
c14b763aSAlp Dener    /* Compute the Hessian */
c14b763aSAlp Dener    ierr = TaoComputeHessian(tao,tao->solution,tao->hessian,tao->hessian_pre);CHKERRQ(ierr);
c14b763aSAlp Dener    /* Update the BFGS preconditioner */
c14b763aSAlp Dener    if (BNK_PC_BFGS == bnk->pc_type) {
c14b763aSAlp Dener      if (BFGS_SCALE_PHESS == bnk->bfgs_scale_type) {
c14b763aSAlp Dener        /* Obtain diagonal for the bfgs preconditioner  */
c14b763aSAlp Dener        ierr = MatGetDiagonal(tao->hessian, bnk->Diag);CHKERRQ(ierr);
c14b763aSAlp Dener        ierr = VecAbs(bnk->Diag);CHKERRQ(ierr);
c14b763aSAlp Dener        ierr = VecReciprocal(bnk->Diag);CHKERRQ(ierr);
c14b763aSAlp Dener        ierr = MatLMVMSetScale(bnk->M,bnk->Diag);CHKERRQ(ierr);
c14b763aSAlp Dener      }
c14b763aSAlp Dener      /* Update the limited memory preconditioner and get existing # of updates */
c14b763aSAlp Dener      ierr = MatLMVMUpdate(bnk->M, tao->solution, bnk->unprojected_gradient);CHKERRQ(ierr);
c14b763aSAlp Dener    }
c14b763aSAlp Dener
8d5ead36SAlp Dener    /* Use the common BNK kernel to compute the Newton step (for inactive variables only) */
c14b763aSAlp Dener    ierr = TaoBNKComputeStep(tao, PETSC_FALSE, &stepType);CHKERRQ(ierr);
c14b763aSAlp Dener
c14b763aSAlp Dener    /* Store current solution before it changes */
c14b763aSAlp Dener    oldTrust = tao->trust;
c14b763aSAlp Dener    bnk->fold = bnk->f;
c14b763aSAlp Dener    ierr = VecCopy(tao->solution, bnk->Xold);CHKERRQ(ierr);
c14b763aSAlp Dener    ierr = VecCopy(tao->gradient, bnk->Gold);CHKERRQ(ierr);
c14b763aSAlp Dener    ierr = VecCopy(bnk->unprojected_gradient, bnk->unprojected_gradient_old);CHKERRQ(ierr);
c14b763aSAlp Dener
c14b763aSAlp Dener    /* Temporarily accept the step and project it into the bounds */
c14b763aSAlp Dener    ierr = VecAXPY(tao->solution, 1.0, tao->stepdirection);CHKERRQ(ierr);
c14b763aSAlp Dener    ierr = VecMedian(tao->XL, tao->solution, tao->XU, tao->solution);CHKERRQ(ierr);
c14b763aSAlp Dener
c14b763aSAlp Dener    /* Check if the projection changed the step direction */
c14b763aSAlp Dener    ierr = VecCopy(tao->solution, tao->stepdirection);CHKERRQ(ierr);
8d5ead36SAlp Dener    ierr = VecAXPY(tao->stepdirection, -1.0, bnk->Xold);CHKERRQ(ierr);
c14b763aSAlp Dener    ierr = VecNorm(tao->stepdirection, NORM_2, &stepNorm);CHKERRQ(ierr);
c14b763aSAlp Dener    if (stepNorm != bnk->dnorm) {
8d5ead36SAlp Dener      /* Projection changed the step, so we have to recompute predicted reduction.
8d5ead36SAlp Dener         However, we deliberately do not change the step norm and the trust radius
8d5ead36SAlp Dener         in order for the safeguard to more closely mimic a piece-wise linesearch
8d5ead36SAlp Dener         along the bounds. */
c14b763aSAlp Dener      ierr = MatMult(tao->hessian, tao->stepdirection, bnk->Xwork);CHKERRQ(ierr);
c14b763aSAlp Dener      ierr = VecAYPX(bnk->Xwork, -0.5, tao->gradient);CHKERRQ(ierr);
c14b763aSAlp Dener      ierr = VecDot(bnk->Xwork, tao->stepdirection, &prered);
c14b763aSAlp Dener    } else {
c14b763aSAlp Dener      /* Step did not change, so we can just recover the pre-computed prediction */
c14b763aSAlp Dener      ierr = KSPCGGetObjFcn(tao->ksp, &prered);CHKERRQ(ierr);
c14b763aSAlp Dener    }
c14b763aSAlp Dener    prered = -prered;
c14b763aSAlp Dener
c14b763aSAlp Dener    /* Compute the actual reduction and update the trust radius */
c14b763aSAlp Dener    ierr = TaoComputeObjective(tao, tao->solution, &bnk->f);CHKERRQ(ierr);
c14b763aSAlp Dener    actred = bnk->fold - bnk->f;
c14b763aSAlp Dener    ierr = TaoBNKUpdateTrustRadius(tao, prered, actred, stepType, &stepAccepted);CHKERRQ(ierr);
c14b763aSAlp Dener
c14b763aSAlp Dener    if (stepAccepted) {
c14b763aSAlp Dener      /* Step is good, evaluate the gradient and the hessian */
8d5ead36SAlp Dener      steplen = 1.0;
c14b763aSAlp Dener      ierr = TaoComputeGradient(tao, tao->solution, bnk->unprojected_gradient);CHKERRQ(ierr);
c14b763aSAlp Dener      ierr = VecBoundGradientProjection(bnk->unprojected_gradient,tao->solution,tao->XL,tao->XU,tao->gradient);CHKERRQ(ierr);
c14b763aSAlp Dener    } else {
c14b763aSAlp Dener      /* Trust-region rejected the step. Revert the solution. */
c14b763aSAlp Dener      bnk->f = bnk->fold;
c14b763aSAlp Dener      ierr = VecCopy(bnk->Xold, tao->solution);CHKERRQ(ierr);
c14b763aSAlp Dener
c14b763aSAlp Dener      /* Now check to make sure the Newton step is a descent direction... */
c14b763aSAlp Dener      ierr = VecDot(tao->stepdirection, tao->gradient, &gdx);CHKERRQ(ierr);
c14b763aSAlp Dener      if ((gdx >= 0.0) || PetscIsInfOrNanReal(gdx)) {
c14b763aSAlp Dener        /* Newton step is not descent or direction produced Inf or NaN */
c14b763aSAlp Dener        --bnk->newt;
c14b763aSAlp Dener        if (BNK_PC_BFGS != bnk->pc_type) {
c14b763aSAlp Dener          /* We don't have the BFGS matrix around and updated
c14b763aSAlp Dener             Must use gradient direction in this case */
c14b763aSAlp Dener          ierr = VecCopy(tao->gradient, tao->stepdirection);CHKERRQ(ierr);
c14b763aSAlp Dener          ++bnk->grad;
c14b763aSAlp Dener          stepType = BNK_GRADIENT;
c14b763aSAlp Dener        } else {
c14b763aSAlp Dener          /* We have the BFGS matrix, so attempt to use the BFGS direction */
a41f356dSAlp Dener          ierr = MatLMVMSolve(bnk->M, bnk->unprojected_gradient, tao->stepdirection);CHKERRQ(ierr);
c14b763aSAlp Dener
8d5ead36SAlp Dener          /* Check for success (descent direction)
8d5ead36SAlp Dener             NOTE: Negative gdx here means not a descent direction because
8d5ead36SAlp Dener             the fall-back step is missing a negative sign. */
c14b763aSAlp Dener          ierr = VecDot(tao->stepdirection, tao->gradient, &gdx);CHKERRQ(ierr);
8d5ead36SAlp Dener          if ((gdx <= 0) || PetscIsInfOrNanReal(gdx)) {
c14b763aSAlp Dener            /* BFGS direction is not descent or direction produced not a number
c14b763aSAlp Dener               We can assert bfgsUpdates > 1 in this case because
c14b763aSAlp Dener               the first solve produces the scaled gradient direction,
c14b763aSAlp Dener               which is guaranteed to be descent */
c14b763aSAlp Dener
c14b763aSAlp Dener            /* Use steepest descent direction (scaled) */
c14b763aSAlp Dener            if (bnk->f != 0.0) {
c14b763aSAlp Dener              delta = 2.0 * PetscAbsScalar(bnk->f) / (bnk->gnorm*bnk->gnorm);
c14b763aSAlp Dener            } else {
c14b763aSAlp Dener              delta = 2.0 / (bnk->gnorm*bnk->gnorm);
c14b763aSAlp Dener            }
c14b763aSAlp Dener            ierr = MatLMVMSetDelta(bnk->M, delta);CHKERRQ(ierr);
c14b763aSAlp Dener            ierr = MatLMVMReset(bnk->M);CHKERRQ(ierr);
a41f356dSAlp Dener            ierr = MatLMVMUpdate(bnk->M, tao->solution, bnk->unprojected_gradient);CHKERRQ(ierr);
a41f356dSAlp Dener            ierr = MatLMVMSolve(bnk->M, bnk->unprojected_gradient, tao->stepdirection);CHKERRQ(ierr);
c14b763aSAlp Dener
c14b763aSAlp Dener            ++bnk->sgrad;
c14b763aSAlp Dener            stepType = BNK_SCALED_GRADIENT;
c14b763aSAlp Dener          } else {
c14b763aSAlp Dener            ierr = MatLMVMGetUpdates(bnk->M, &bfgsUpdates);CHKERRQ(ierr);
c14b763aSAlp Dener            if (1 == bfgsUpdates) {
c14b763aSAlp Dener              /* The first BFGS direction is always the scaled gradient */
c14b763aSAlp Dener              ++bnk->sgrad;
c14b763aSAlp Dener              stepType = BNK_SCALED_GRADIENT;
c14b763aSAlp Dener            } else {
c14b763aSAlp Dener              ++bnk->bfgs;
c14b763aSAlp Dener              stepType = BNK_BFGS;
c14b763aSAlp Dener            }
c14b763aSAlp Dener          }
c14b763aSAlp Dener        }
c14b763aSAlp Dener      }
*770b7498SAlp Dener      /* Make sure the safeguarded fall-back step is zero for actively bounded variables */
*770b7498SAlp Dener      ierr = VecBoundGradientProjection(tao->stepdirection,tao->solution,tao->XL,tao->XU,tao->stepdirection);CHKERRQ(ierr);
8d5ead36SAlp Dener      ierr = VecScale(tao->stepdirection, -1.0);CHKERRQ(ierr);
c14b763aSAlp Dener
c14b763aSAlp Dener      /* Trigger the line search */
c14b763aSAlp Dener      ierr = TaoBNKPerformLineSearch(tao, stepType, &steplen, &ls_reason);CHKERRQ(ierr);
c14b763aSAlp Dener      if (ls_reason != TAOLINESEARCH_SUCCESS && ls_reason != TAOLINESEARCH_SUCCESS_USER) {
c14b763aSAlp Dener        /* Line search failed, revert solution and terminate */
c14b763aSAlp Dener        bnk->f = bnk->fold;
c14b763aSAlp Dener        ierr = VecCopy(bnk->Xold, tao->solution);CHKERRQ(ierr);
c14b763aSAlp Dener        ierr = VecCopy(bnk->Gold, tao->gradient);CHKERRQ(ierr);
c14b763aSAlp Dener        ierr = VecCopy(bnk->unprojected_gradient_old, bnk->unprojected_gradient);CHKERRQ(ierr);
c14b763aSAlp Dener        tao->trust = 0.0;
c14b763aSAlp Dener        tao->reason = TAO_DIVERGED_LS_FAILURE;
c14b763aSAlp Dener      } else {
c14b763aSAlp Dener        /* Line search succeeded so we should update the trust radius based on the LS step length */
c14b763aSAlp Dener        updateType = bnk->update_type;
c14b763aSAlp Dener        bnk->update_type = BNK_UPDATE_STEP;
*770b7498SAlp Dener        tao->trust = oldTrust;
c14b763aSAlp Dener        ierr = TaoBNKUpdateTrustRadius(tao, prered, actred, stepType, &stepAccepted);CHKERRQ(ierr);
c14b763aSAlp Dener        bnk->update_type = updateType;
c14b763aSAlp Dener      }
c14b763aSAlp Dener    }
c14b763aSAlp Dener
c14b763aSAlp Dener    /*  Check for termination */
c14b763aSAlp Dener    ierr = TaoGradientNorm(tao, tao->gradient, NORM_2, &bnk->gnorm);CHKERRQ(ierr);
c14b763aSAlp Dener    if (PetscIsInfOrNanReal(bnk->gnorm)) SETERRQ(PETSC_COMM_SELF,1,"User provided compute function generated Not-a-Number");
c14b763aSAlp Dener    ierr = TaoLogConvergenceHistory(tao,bnk->f,bnk->gnorm,0.0,tao->ksp_its);CHKERRQ(ierr);
8d5ead36SAlp Dener    ierr = TaoMonitor(tao,tao->niter,bnk->f,bnk->gnorm,0.0,steplen);CHKERRQ(ierr);
c14b763aSAlp Dener    ierr = (*tao->ops->convergencetest)(tao,tao->cnvP);CHKERRQ(ierr);
c14b763aSAlp Dener  }
c14b763aSAlp Dener  PetscFunctionReturn(0);
c14b763aSAlp Dener}
c14b763aSAlp Dener
df278d8fSAlp Dener/*------------------------------------------------------------*/
df278d8fSAlp Dener
c14b763aSAlp DenerPETSC_EXTERN PetscErrorCode TaoCreate_BNTL(Tao tao)
c14b763aSAlp Dener{
c14b763aSAlp Dener  TAO_BNK        *bnk;
c14b763aSAlp Dener  PetscErrorCode ierr;
c14b763aSAlp Dener
c14b763aSAlp Dener  PetscFunctionBegin;
c14b763aSAlp Dener  ierr = TaoCreate_BNK(tao);CHKERRQ(ierr);
c14b763aSAlp Dener  tao->ops->solve=TaoSolve_BNTL;
c14b763aSAlp Dener
c14b763aSAlp Dener  bnk = (TAO_BNK *)tao->data;
c14b763aSAlp Dener  bnk->update_type = BNK_UPDATE_REDUCTION; /* trust region updates based on predicted/actual reduction */
c14b763aSAlp Dener  bnk->sval = 0.0; /* disable Hessian shifting */
c14b763aSAlp Dener  PetscFunctionReturn(0);
c14b763aSAlp Dener}