impls/bnk/bntl.c

c14b763aSAlp Dener#include <../src/tao/bound/impls/bnk/bnk.h>
c14b763aSAlp Dener#include <petscksp.h>
c14b763aSAlp Dener
c14b763aSAlp Dener/*
c14b763aSAlp Dener Implements Newton's Method with a trust region approach for solving
c14b763aSAlp Dener bound constrained minimization problems. This version includes a
c14b763aSAlp Dener line search fall-back in the event of a trust region failure.
c14b763aSAlp Dener
*df278d8fSAlp Dener The linear system solve has to be done with a conjugate gradient method.
c14b763aSAlp Dener*/
c14b763aSAlp Dener
c14b763aSAlp Denerstatic PetscErrorCode TaoSolve_BNTL(Tao tao)
c14b763aSAlp Dener{
c14b763aSAlp Dener  PetscErrorCode               ierr;
c14b763aSAlp Dener  TAO_BNK                      *bnk = (TAO_BNK *)tao->data;
c14b763aSAlp Dener  TaoLineSearchConvergedReason ls_reason;
c14b763aSAlp Dener
c14b763aSAlp Dener  PetscReal                    oldTrust, prered, actred, stepNorm, gdx, delta, steplen;
c14b763aSAlp Dener  PetscBool                    stepAccepted = PETSC_TRUE;
c14b763aSAlp Dener  PetscInt                     stepType, bfgsUpdates, updateType;
c14b763aSAlp Dener
c14b763aSAlp Dener  PetscFunctionBegin;
c14b763aSAlp Dener  /*   Project the current point onto the feasible set */
c14b763aSAlp Dener  ierr = TaoComputeVariableBounds(tao);CHKERRQ(ierr);
c14b763aSAlp Dener  ierr = TaoLineSearchSetVariableBounds(tao->linesearch,tao->XL,tao->XU);CHKERRQ(ierr);
c14b763aSAlp Dener
c14b763aSAlp Dener  /* Project the initial point onto the feasible region */
c14b763aSAlp Dener  ierr = VecMedian(tao->XL,tao->solution,tao->XU,tao->solution);CHKERRQ(ierr);
c14b763aSAlp Dener
c14b763aSAlp Dener  /* Check convergence criteria */
c14b763aSAlp Dener  ierr = TaoComputeObjectiveAndGradient(tao, tao->solution, &bnk->f, bnk->unprojected_gradient);CHKERRQ(ierr);
c14b763aSAlp Dener  ierr = VecBoundGradientProjection(bnk->unprojected_gradient,tao->solution,tao->XL,tao->XU,tao->gradient);CHKERRQ(ierr);
c14b763aSAlp Dener  ierr = TaoGradientNorm(tao, tao->gradient,NORM_2,&bnk->gnorm);CHKERRQ(ierr);
c14b763aSAlp Dener  if (PetscIsInfOrNanReal(bnk->f) || PetscIsInfOrNanReal(bnk->gnorm)) SETERRQ(PETSC_COMM_SELF,1, "User provided compute function generated Inf or NaN");
c14b763aSAlp Dener
c14b763aSAlp Dener  tao->reason = TAO_CONTINUE_ITERATING;
c14b763aSAlp Dener  ierr = TaoLogConvergenceHistory(tao,bnk->f,bnk->gnorm,0.0,tao->ksp_its);CHKERRQ(ierr);
c14b763aSAlp Dener  ierr = TaoMonitor(tao,tao->niter,bnk->f,bnk->gnorm,0.0,tao->trust);CHKERRQ(ierr);
c14b763aSAlp Dener  ierr = (*tao->ops->convergencetest)(tao,tao->cnvP);CHKERRQ(ierr);
c14b763aSAlp Dener  if (tao->reason != TAO_CONTINUE_ITERATING) PetscFunctionReturn(0);
c14b763aSAlp Dener
c14b763aSAlp Dener  /* Initialize the preconditioner and trust radius */
c14b763aSAlp Dener  ierr = TaoBNKInitialize(tao);CHKERRQ(ierr);
c14b763aSAlp Dener
c14b763aSAlp Dener  /* Have not converged; continue with Newton method */
c14b763aSAlp Dener  while (tao->reason == TAO_CONTINUE_ITERATING) {
c14b763aSAlp Dener
c14b763aSAlp Dener    if (stepAccepted) {
c14b763aSAlp Dener      tao->niter++;
c14b763aSAlp Dener      tao->ksp_its=0;
c14b763aSAlp Dener      /* Compute the Hessian */
c14b763aSAlp Dener      ierr = TaoComputeHessian(tao,tao->solution,tao->hessian,tao->hessian_pre);CHKERRQ(ierr);
c14b763aSAlp Dener      /* Update the BFGS preconditioner */
c14b763aSAlp Dener      if (BNK_PC_BFGS == bnk->pc_type) {
c14b763aSAlp Dener        if (BFGS_SCALE_PHESS == bnk->bfgs_scale_type) {
c14b763aSAlp Dener          /* Obtain diagonal for the bfgs preconditioner  */
c14b763aSAlp Dener          ierr = MatGetDiagonal(tao->hessian, bnk->Diag);CHKERRQ(ierr);
c14b763aSAlp Dener          ierr = VecAbs(bnk->Diag);CHKERRQ(ierr);
c14b763aSAlp Dener          ierr = VecReciprocal(bnk->Diag);CHKERRQ(ierr);
c14b763aSAlp Dener          ierr = MatLMVMSetScale(bnk->M,bnk->Diag);CHKERRQ(ierr);
c14b763aSAlp Dener        }
c14b763aSAlp Dener        /* Update the limited memory preconditioner and get existing # of updates */
c14b763aSAlp Dener        ierr = MatLMVMUpdate(bnk->M, tao->solution, bnk->unprojected_gradient);CHKERRQ(ierr);
c14b763aSAlp Dener      }
c14b763aSAlp Dener    }
c14b763aSAlp Dener
c14b763aSAlp Dener    /* Use the common BNK kernel to compute the raw Newton step */
c14b763aSAlp Dener    ierr = TaoBNKComputeStep(tao, PETSC_FALSE, &stepType);CHKERRQ(ierr);
c14b763aSAlp Dener
c14b763aSAlp Dener    /* Store current solution before it changes */
c14b763aSAlp Dener    oldTrust = tao->trust;
c14b763aSAlp Dener    bnk->fold = bnk->f;
c14b763aSAlp Dener    ierr = VecCopy(tao->solution, bnk->Xold);CHKERRQ(ierr);
c14b763aSAlp Dener    ierr = VecCopy(tao->gradient, bnk->Gold);CHKERRQ(ierr);
c14b763aSAlp Dener    ierr = VecCopy(bnk->unprojected_gradient, bnk->unprojected_gradient_old);CHKERRQ(ierr);
c14b763aSAlp Dener
c14b763aSAlp Dener    /* Temporarily accept the step and project it into the bounds */
c14b763aSAlp Dener    ierr = VecAXPY(tao->solution, 1.0, tao->stepdirection);CHKERRQ(ierr);
c14b763aSAlp Dener    ierr = VecMedian(tao->XL, tao->solution, tao->XU, tao->solution);CHKERRQ(ierr);
c14b763aSAlp Dener
c14b763aSAlp Dener    /* Check if the projection changed the step direction */
c14b763aSAlp Dener    ierr = VecCopy(tao->solution, tao->stepdirection);CHKERRQ(ierr);
c14b763aSAlp Dener    ierr = VecAXPBY(tao->stepdirection, -1.0, 1.0, bnk->Xold);CHKERRQ(ierr);
c14b763aSAlp Dener    ierr = VecNorm(tao->stepdirection, NORM_2, &stepNorm);CHKERRQ(ierr);
c14b763aSAlp Dener    if (stepNorm != bnk->dnorm) {
c14b763aSAlp Dener      /* Projection changed the step, so we have to adjust trust radius and recompute predicted reduction */
c14b763aSAlp Dener      bnk->dnorm = stepNorm;
c14b763aSAlp Dener      tao->trust = bnk->dnorm;
c14b763aSAlp Dener      ierr = MatMult(tao->hessian, tao->stepdirection, bnk->Xwork);CHKERRQ(ierr);
c14b763aSAlp Dener      ierr = VecAYPX(bnk->Xwork, -0.5, tao->gradient);CHKERRQ(ierr);
c14b763aSAlp Dener      ierr = VecDot(bnk->Xwork, tao->stepdirection, &prered);
c14b763aSAlp Dener    } else {
c14b763aSAlp Dener      /* Step did not change, so we can just recover the pre-computed prediction */
c14b763aSAlp Dener      ierr = KSPCGGetObjFcn(tao->ksp, &prered);CHKERRQ(ierr);
c14b763aSAlp Dener    }
c14b763aSAlp Dener    prered = -prered;
c14b763aSAlp Dener
c14b763aSAlp Dener    /* Compute the actual reduction and update the trust radius */
c14b763aSAlp Dener    ierr = TaoComputeObjective(tao, tao->solution, &bnk->f);CHKERRQ(ierr);
c14b763aSAlp Dener    actred = bnk->fold - bnk->f;
c14b763aSAlp Dener    ierr = TaoBNKUpdateTrustRadius(tao, prered, actred, stepType, &stepAccepted);CHKERRQ(ierr);
c14b763aSAlp Dener
c14b763aSAlp Dener    if (stepAccepted) {
c14b763aSAlp Dener      /* Step is good, evaluate the gradient and the hessian */
c14b763aSAlp Dener      ierr = TaoComputeGradient(tao, tao->solution, bnk->unprojected_gradient);CHKERRQ(ierr);
c14b763aSAlp Dener      ierr = VecBoundGradientProjection(bnk->unprojected_gradient,tao->solution,tao->XL,tao->XU,tao->gradient);CHKERRQ(ierr);
c14b763aSAlp Dener    } else {
c14b763aSAlp Dener      /* Trust-region rejected the step. Revert the solution. */
c14b763aSAlp Dener      bnk->f = bnk->fold;
c14b763aSAlp Dener      ierr = VecCopy(bnk->Xold, tao->solution);CHKERRQ(ierr);
c14b763aSAlp Dener
c14b763aSAlp Dener      /* Now check to make sure the Newton step is a descent direction... */
c14b763aSAlp Dener      ierr = VecDot(tao->stepdirection, tao->gradient, &gdx);CHKERRQ(ierr);
c14b763aSAlp Dener      if ((gdx >= 0.0) || PetscIsInfOrNanReal(gdx)) {
c14b763aSAlp Dener        /* Newton step is not descent or direction produced Inf or NaN */
c14b763aSAlp Dener        --bnk->newt;
c14b763aSAlp Dener        if (BNK_PC_BFGS != bnk->pc_type) {
c14b763aSAlp Dener          /* We don't have the BFGS matrix around and updated
c14b763aSAlp Dener             Must use gradient direction in this case */
c14b763aSAlp Dener          ierr = VecCopy(tao->gradient, tao->stepdirection);CHKERRQ(ierr);
c14b763aSAlp Dener          ierr = VecScale(tao->stepdirection, -1.0);CHKERRQ(ierr);
c14b763aSAlp Dener          ++bnk->grad;
c14b763aSAlp Dener          stepType = BNK_GRADIENT;
c14b763aSAlp Dener        } else {
c14b763aSAlp Dener          /* We have the BFGS matrix, so attempt to use the BFGS direction */
c14b763aSAlp Dener          ierr = MatLMVMSolve(bnk->M, tao->gradient, tao->stepdirection);CHKERRQ(ierr);
c14b763aSAlp Dener          ierr = VecScale(tao->stepdirection, -1.0);CHKERRQ(ierr);
c14b763aSAlp Dener
c14b763aSAlp Dener          /* Check for success (descent direction) */
c14b763aSAlp Dener          ierr = VecDot(tao->stepdirection, tao->gradient, &gdx);CHKERRQ(ierr);
c14b763aSAlp Dener          if ((gdx >= 0) || PetscIsInfOrNanReal(gdx)) {
c14b763aSAlp Dener            /* BFGS direction is not descent or direction produced not a number
c14b763aSAlp Dener               We can assert bfgsUpdates > 1 in this case because
c14b763aSAlp Dener               the first solve produces the scaled gradient direction,
c14b763aSAlp Dener               which is guaranteed to be descent */
c14b763aSAlp Dener
c14b763aSAlp Dener            /* Use steepest descent direction (scaled) */
c14b763aSAlp Dener            if (bnk->f != 0.0) {
c14b763aSAlp Dener              delta = 2.0 * PetscAbsScalar(bnk->f) / (bnk->gnorm*bnk->gnorm);
c14b763aSAlp Dener            } else {
c14b763aSAlp Dener              delta = 2.0 / (bnk->gnorm*bnk->gnorm);
c14b763aSAlp Dener            }
c14b763aSAlp Dener            ierr = MatLMVMSetDelta(bnk->M, delta);CHKERRQ(ierr);
c14b763aSAlp Dener            ierr = MatLMVMReset(bnk->M);CHKERRQ(ierr);
c14b763aSAlp Dener            ierr = MatLMVMUpdate(bnk->M, tao->solution, tao->gradient);CHKERRQ(ierr);
c14b763aSAlp Dener            ierr = MatLMVMSolve(bnk->M, tao->gradient, tao->stepdirection);CHKERRQ(ierr);
c14b763aSAlp Dener            ierr = VecScale(tao->stepdirection, -1.0);CHKERRQ(ierr);
c14b763aSAlp Dener
c14b763aSAlp Dener            ++bnk->sgrad;
c14b763aSAlp Dener            stepType = BNK_SCALED_GRADIENT;
c14b763aSAlp Dener          } else {
c14b763aSAlp Dener            ierr = MatLMVMGetUpdates(bnk->M, &bfgsUpdates);CHKERRQ(ierr);
c14b763aSAlp Dener            if (1 == bfgsUpdates) {
c14b763aSAlp Dener              /* The first BFGS direction is always the scaled gradient */
c14b763aSAlp Dener              ++bnk->sgrad;
c14b763aSAlp Dener              stepType = BNK_SCALED_GRADIENT;
c14b763aSAlp Dener            } else {
c14b763aSAlp Dener              ++bnk->bfgs;
c14b763aSAlp Dener              stepType = BNK_BFGS;
c14b763aSAlp Dener            }
c14b763aSAlp Dener          }
c14b763aSAlp Dener        }
c14b763aSAlp Dener      }
c14b763aSAlp Dener
c14b763aSAlp Dener      /* Trigger the line search */
c14b763aSAlp Dener      ierr = TaoBNKPerformLineSearch(tao, stepType, &steplen, &ls_reason);CHKERRQ(ierr);
c14b763aSAlp Dener      if (ls_reason != TAOLINESEARCH_SUCCESS && ls_reason != TAOLINESEARCH_SUCCESS_USER) {
c14b763aSAlp Dener        /* Line search failed, revert solution and terminate */
c14b763aSAlp Dener        bnk->f = bnk->fold;
c14b763aSAlp Dener        ierr = VecCopy(bnk->Xold, tao->solution);CHKERRQ(ierr);
c14b763aSAlp Dener        ierr = VecCopy(bnk->Gold, tao->gradient);CHKERRQ(ierr);
c14b763aSAlp Dener        ierr = VecCopy(bnk->unprojected_gradient_old, bnk->unprojected_gradient);CHKERRQ(ierr);
c14b763aSAlp Dener        tao->trust = 0.0;
c14b763aSAlp Dener        tao->reason = TAO_DIVERGED_LS_FAILURE;
c14b763aSAlp Dener      } else {
c14b763aSAlp Dener        /* Line search succeeded so we should update the trust radius based on the LS step length */
c14b763aSAlp Dener        updateType = bnk->update_type;
c14b763aSAlp Dener        bnk->update_type = BNK_UPDATE_STEP;
c14b763aSAlp Dener        ierr = TaoBNKUpdateTrustRadius(tao, prered, actred, stepType, &stepAccepted);CHKERRQ(ierr);
c14b763aSAlp Dener        bnk->update_type = updateType;
c14b763aSAlp Dener      }
c14b763aSAlp Dener    }
c14b763aSAlp Dener
c14b763aSAlp Dener    /*  Check for termination */
c14b763aSAlp Dener    ierr = TaoGradientNorm(tao, tao->gradient, NORM_2, &bnk->gnorm);CHKERRQ(ierr);
c14b763aSAlp Dener    if (PetscIsInfOrNanReal(bnk->gnorm)) SETERRQ(PETSC_COMM_SELF,1,"User provided compute function generated Not-a-Number");
c14b763aSAlp Dener    ierr = TaoLogConvergenceHistory(tao,bnk->f,bnk->gnorm,0.0,tao->ksp_its);CHKERRQ(ierr);
c14b763aSAlp Dener    ierr = TaoMonitor(tao,tao->niter,bnk->f,bnk->gnorm,0.0,tao->trust);CHKERRQ(ierr);
c14b763aSAlp Dener    ierr = (*tao->ops->convergencetest)(tao,tao->cnvP);CHKERRQ(ierr);
c14b763aSAlp Dener  }
c14b763aSAlp Dener  PetscFunctionReturn(0);
c14b763aSAlp Dener}
c14b763aSAlp Dener
*df278d8fSAlp Dener/*------------------------------------------------------------*/
*df278d8fSAlp Dener
c14b763aSAlp DenerPETSC_EXTERN PetscErrorCode TaoCreate_BNTL(Tao tao)
c14b763aSAlp Dener{
c14b763aSAlp Dener  TAO_BNK        *bnk;
c14b763aSAlp Dener  PetscErrorCode ierr;
c14b763aSAlp Dener
c14b763aSAlp Dener  PetscFunctionBegin;
c14b763aSAlp Dener  ierr = TaoCreate_BNK(tao);CHKERRQ(ierr);
c14b763aSAlp Dener  tao->ops->solve=TaoSolve_BNTL;
c14b763aSAlp Dener
c14b763aSAlp Dener  bnk = (TAO_BNK *)tao->data;
c14b763aSAlp Dener  bnk->update_type = BNK_UPDATE_REDUCTION; /* trust region updates based on predicted/actual reduction */
c14b763aSAlp Dener  bnk->sval = 0.0; /* disable Hessian shifting */
c14b763aSAlp Dener  PetscFunctionReturn(0);
c14b763aSAlp Dener}