impls/bnk/bntl.c

*c14b763aSAlp Dener#include <../src/tao/bound/impls/bnk/bnk.h>
*c14b763aSAlp Dener#include <petscksp.h>
*c14b763aSAlp Dener
*c14b763aSAlp Dener/*
*c14b763aSAlp Dener Implements Newton's Method with a trust region approach for solving
*c14b763aSAlp Dener bound constrained minimization problems. This version includes a
*c14b763aSAlp Dener line search fall-back in the event of a trust region failure.
*c14b763aSAlp Dener
*c14b763aSAlp Dener The linear system solve should be done with a conjugate gradient
*c14b763aSAlp Dener method, although any method can be used.
*c14b763aSAlp Dener*/
*c14b763aSAlp Dener
*c14b763aSAlp Denerstatic PetscErrorCode TaoSolve_BNTL(Tao tao)
*c14b763aSAlp Dener{
*c14b763aSAlp Dener  PetscErrorCode               ierr;
*c14b763aSAlp Dener  TAO_BNK                      *bnk = (TAO_BNK *)tao->data;
*c14b763aSAlp Dener  TaoLineSearchConvergedReason ls_reason;
*c14b763aSAlp Dener
*c14b763aSAlp Dener  PetscReal                    oldTrust, prered, actred, stepNorm, gdx, delta, steplen;
*c14b763aSAlp Dener  PetscBool                    stepAccepted = PETSC_TRUE;
*c14b763aSAlp Dener  PetscInt                     stepType, bfgsUpdates, updateType;
*c14b763aSAlp Dener
*c14b763aSAlp Dener  PetscFunctionBegin;
*c14b763aSAlp Dener  /*   Project the current point onto the feasible set */
*c14b763aSAlp Dener  ierr = TaoComputeVariableBounds(tao);CHKERRQ(ierr);
*c14b763aSAlp Dener  ierr = TaoLineSearchSetVariableBounds(tao->linesearch,tao->XL,tao->XU);CHKERRQ(ierr);
*c14b763aSAlp Dener
*c14b763aSAlp Dener  /* Project the initial point onto the feasible region */
*c14b763aSAlp Dener  ierr = VecMedian(tao->XL,tao->solution,tao->XU,tao->solution);CHKERRQ(ierr);
*c14b763aSAlp Dener
*c14b763aSAlp Dener  /* Check convergence criteria */
*c14b763aSAlp Dener  ierr = TaoComputeObjectiveAndGradient(tao, tao->solution, &bnk->f, bnk->unprojected_gradient);CHKERRQ(ierr);
*c14b763aSAlp Dener  ierr = VecBoundGradientProjection(bnk->unprojected_gradient,tao->solution,tao->XL,tao->XU,tao->gradient);CHKERRQ(ierr);
*c14b763aSAlp Dener  ierr = TaoGradientNorm(tao, tao->gradient,NORM_2,&bnk->gnorm);CHKERRQ(ierr);
*c14b763aSAlp Dener  if (PetscIsInfOrNanReal(bnk->f) || PetscIsInfOrNanReal(bnk->gnorm)) SETERRQ(PETSC_COMM_SELF,1, "User provided compute function generated Inf or NaN");
*c14b763aSAlp Dener
*c14b763aSAlp Dener  tao->reason = TAO_CONTINUE_ITERATING;
*c14b763aSAlp Dener  ierr = TaoLogConvergenceHistory(tao,bnk->f,bnk->gnorm,0.0,tao->ksp_its);CHKERRQ(ierr);
*c14b763aSAlp Dener  ierr = TaoMonitor(tao,tao->niter,bnk->f,bnk->gnorm,0.0,tao->trust);CHKERRQ(ierr);
*c14b763aSAlp Dener  ierr = (*tao->ops->convergencetest)(tao,tao->cnvP);CHKERRQ(ierr);
*c14b763aSAlp Dener  if (tao->reason != TAO_CONTINUE_ITERATING) PetscFunctionReturn(0);
*c14b763aSAlp Dener
*c14b763aSAlp Dener  /* Initialize the preconditioner and trust radius */
*c14b763aSAlp Dener  ierr = TaoBNKInitialize(tao);CHKERRQ(ierr);
*c14b763aSAlp Dener
*c14b763aSAlp Dener  /* Have not converged; continue with Newton method */
*c14b763aSAlp Dener  while (tao->reason == TAO_CONTINUE_ITERATING) {
*c14b763aSAlp Dener
*c14b763aSAlp Dener    if (stepAccepted) {
*c14b763aSAlp Dener      tao->niter++;
*c14b763aSAlp Dener      tao->ksp_its=0;
*c14b763aSAlp Dener      /* Compute the Hessian */
*c14b763aSAlp Dener      ierr = TaoComputeHessian(tao,tao->solution,tao->hessian,tao->hessian_pre);CHKERRQ(ierr);
*c14b763aSAlp Dener      /* Update the BFGS preconditioner */
*c14b763aSAlp Dener      if (BNK_PC_BFGS == bnk->pc_type) {
*c14b763aSAlp Dener        if (BFGS_SCALE_PHESS == bnk->bfgs_scale_type) {
*c14b763aSAlp Dener          /* Obtain diagonal for the bfgs preconditioner  */
*c14b763aSAlp Dener          ierr = MatGetDiagonal(tao->hessian, bnk->Diag);CHKERRQ(ierr);
*c14b763aSAlp Dener          ierr = VecAbs(bnk->Diag);CHKERRQ(ierr);
*c14b763aSAlp Dener          ierr = VecReciprocal(bnk->Diag);CHKERRQ(ierr);
*c14b763aSAlp Dener          ierr = MatLMVMSetScale(bnk->M,bnk->Diag);CHKERRQ(ierr);
*c14b763aSAlp Dener        }
*c14b763aSAlp Dener        /* Update the limited memory preconditioner and get existing # of updates */
*c14b763aSAlp Dener        ierr = MatLMVMUpdate(bnk->M, tao->solution, bnk->unprojected_gradient);CHKERRQ(ierr);
*c14b763aSAlp Dener      }
*c14b763aSAlp Dener    }
*c14b763aSAlp Dener
*c14b763aSAlp Dener    /* Use the common BNK kernel to compute the raw Newton step */
*c14b763aSAlp Dener    ierr = TaoBNKComputeStep(tao, PETSC_FALSE, &stepType);CHKERRQ(ierr);
*c14b763aSAlp Dener
*c14b763aSAlp Dener    /* Store current solution before it changes */
*c14b763aSAlp Dener    oldTrust = tao->trust;
*c14b763aSAlp Dener    bnk->fold = bnk->f;
*c14b763aSAlp Dener    ierr = VecCopy(tao->solution, bnk->Xold);CHKERRQ(ierr);
*c14b763aSAlp Dener    ierr = VecCopy(tao->gradient, bnk->Gold);CHKERRQ(ierr);
*c14b763aSAlp Dener    ierr = VecCopy(bnk->unprojected_gradient, bnk->unprojected_gradient_old);CHKERRQ(ierr);
*c14b763aSAlp Dener
*c14b763aSAlp Dener    /* Temporarily accept the step and project it into the bounds */
*c14b763aSAlp Dener    ierr = VecAXPY(tao->solution, 1.0, tao->stepdirection);CHKERRQ(ierr);
*c14b763aSAlp Dener    ierr = VecMedian(tao->XL, tao->solution, tao->XU, tao->solution);CHKERRQ(ierr);
*c14b763aSAlp Dener
*c14b763aSAlp Dener    /* Check if the projection changed the step direction */
*c14b763aSAlp Dener    ierr = VecCopy(tao->solution, tao->stepdirection);CHKERRQ(ierr);
*c14b763aSAlp Dener    ierr = VecAXPBY(tao->stepdirection, -1.0, 1.0, bnk->Xold);CHKERRQ(ierr);
*c14b763aSAlp Dener    ierr = VecNorm(tao->stepdirection, NORM_2, &stepNorm);CHKERRQ(ierr);
*c14b763aSAlp Dener    if (stepNorm != bnk->dnorm) {
*c14b763aSAlp Dener      /* Projection changed the step, so we have to adjust trust radius and recompute predicted reduction */
*c14b763aSAlp Dener      bnk->dnorm = stepNorm;
*c14b763aSAlp Dener      tao->trust = bnk->dnorm;
*c14b763aSAlp Dener      ierr = MatMult(tao->hessian, tao->stepdirection, bnk->Xwork);CHKERRQ(ierr);
*c14b763aSAlp Dener      ierr = VecAYPX(bnk->Xwork, -0.5, tao->gradient);CHKERRQ(ierr);
*c14b763aSAlp Dener      ierr = VecDot(bnk->Xwork, tao->stepdirection, &prered);
*c14b763aSAlp Dener    } else {
*c14b763aSAlp Dener      /* Step did not change, so we can just recover the pre-computed prediction */
*c14b763aSAlp Dener      ierr = KSPCGGetObjFcn(tao->ksp, &prered);CHKERRQ(ierr);
*c14b763aSAlp Dener    }
*c14b763aSAlp Dener    prered = -prered;
*c14b763aSAlp Dener
*c14b763aSAlp Dener    /* Compute the actual reduction and update the trust radius */
*c14b763aSAlp Dener    ierr = TaoComputeObjective(tao, tao->solution, &bnk->f);CHKERRQ(ierr);
*c14b763aSAlp Dener    actred = bnk->fold - bnk->f;
*c14b763aSAlp Dener    ierr = TaoBNKUpdateTrustRadius(tao, prered, actred, stepType, &stepAccepted);CHKERRQ(ierr);
*c14b763aSAlp Dener
*c14b763aSAlp Dener    if (stepAccepted) {
*c14b763aSAlp Dener      /* Step is good, evaluate the gradient and the hessian */
*c14b763aSAlp Dener      ierr = TaoComputeGradient(tao, tao->solution, bnk->unprojected_gradient);CHKERRQ(ierr);
*c14b763aSAlp Dener      ierr = VecBoundGradientProjection(bnk->unprojected_gradient,tao->solution,tao->XL,tao->XU,tao->gradient);CHKERRQ(ierr);
*c14b763aSAlp Dener    } else {
*c14b763aSAlp Dener      /* Trust-region rejected the step. Revert the solution. */
*c14b763aSAlp Dener      bnk->f = bnk->fold;
*c14b763aSAlp Dener      ierr = VecCopy(bnk->Xold, tao->solution);CHKERRQ(ierr);
*c14b763aSAlp Dener
*c14b763aSAlp Dener      /* Now check to make sure the Newton step is a descent direction... */
*c14b763aSAlp Dener      ierr = VecDot(tao->stepdirection, tao->gradient, &gdx);CHKERRQ(ierr);
*c14b763aSAlp Dener      if ((gdx >= 0.0) || PetscIsInfOrNanReal(gdx)) {
*c14b763aSAlp Dener        /* Newton step is not descent or direction produced Inf or NaN */
*c14b763aSAlp Dener        --bnk->newt;
*c14b763aSAlp Dener        if (BNK_PC_BFGS != bnk->pc_type) {
*c14b763aSAlp Dener          /* We don't have the BFGS matrix around and updated
*c14b763aSAlp Dener             Must use gradient direction in this case */
*c14b763aSAlp Dener          ierr = VecCopy(tao->gradient, tao->stepdirection);CHKERRQ(ierr);
*c14b763aSAlp Dener          ierr = VecScale(tao->stepdirection, -1.0);CHKERRQ(ierr);
*c14b763aSAlp Dener          ++bnk->grad;
*c14b763aSAlp Dener          stepType = BNK_GRADIENT;
*c14b763aSAlp Dener        } else {
*c14b763aSAlp Dener          /* We have the BFGS matrix, so attempt to use the BFGS direction */
*c14b763aSAlp Dener          ierr = MatLMVMSolve(bnk->M, tao->gradient, tao->stepdirection);CHKERRQ(ierr);
*c14b763aSAlp Dener          ierr = VecScale(tao->stepdirection, -1.0);CHKERRQ(ierr);
*c14b763aSAlp Dener
*c14b763aSAlp Dener          /* Check for success (descent direction) */
*c14b763aSAlp Dener          ierr = VecDot(tao->stepdirection, tao->gradient, &gdx);CHKERRQ(ierr);
*c14b763aSAlp Dener          if ((gdx >= 0) || PetscIsInfOrNanReal(gdx)) {
*c14b763aSAlp Dener            /* BFGS direction is not descent or direction produced not a number
*c14b763aSAlp Dener               We can assert bfgsUpdates > 1 in this case because
*c14b763aSAlp Dener               the first solve produces the scaled gradient direction,
*c14b763aSAlp Dener               which is guaranteed to be descent */
*c14b763aSAlp Dener
*c14b763aSAlp Dener            /* Use steepest descent direction (scaled) */
*c14b763aSAlp Dener            if (bnk->f != 0.0) {
*c14b763aSAlp Dener              delta = 2.0 * PetscAbsScalar(bnk->f) / (bnk->gnorm*bnk->gnorm);
*c14b763aSAlp Dener            } else {
*c14b763aSAlp Dener              delta = 2.0 / (bnk->gnorm*bnk->gnorm);
*c14b763aSAlp Dener            }
*c14b763aSAlp Dener            ierr = MatLMVMSetDelta(bnk->M, delta);CHKERRQ(ierr);
*c14b763aSAlp Dener            ierr = MatLMVMReset(bnk->M);CHKERRQ(ierr);
*c14b763aSAlp Dener            ierr = MatLMVMUpdate(bnk->M, tao->solution, tao->gradient);CHKERRQ(ierr);
*c14b763aSAlp Dener            ierr = MatLMVMSolve(bnk->M, tao->gradient, tao->stepdirection);CHKERRQ(ierr);
*c14b763aSAlp Dener            ierr = VecScale(tao->stepdirection, -1.0);CHKERRQ(ierr);
*c14b763aSAlp Dener
*c14b763aSAlp Dener            ++bnk->sgrad;
*c14b763aSAlp Dener            stepType = BNK_SCALED_GRADIENT;
*c14b763aSAlp Dener          } else {
*c14b763aSAlp Dener            ierr = MatLMVMGetUpdates(bnk->M, &bfgsUpdates);CHKERRQ(ierr);
*c14b763aSAlp Dener            if (1 == bfgsUpdates) {
*c14b763aSAlp Dener              /* The first BFGS direction is always the scaled gradient */
*c14b763aSAlp Dener              ++bnk->sgrad;
*c14b763aSAlp Dener              stepType = BNK_SCALED_GRADIENT;
*c14b763aSAlp Dener            } else {
*c14b763aSAlp Dener              ++bnk->bfgs;
*c14b763aSAlp Dener              stepType = BNK_BFGS;
*c14b763aSAlp Dener            }
*c14b763aSAlp Dener          }
*c14b763aSAlp Dener        }
*c14b763aSAlp Dener      }
*c14b763aSAlp Dener
*c14b763aSAlp Dener      /* Trigger the line search */
*c14b763aSAlp Dener      ierr = TaoBNKPerformLineSearch(tao, stepType, &steplen, &ls_reason);CHKERRQ(ierr);
*c14b763aSAlp Dener      if (ls_reason != TAOLINESEARCH_SUCCESS && ls_reason != TAOLINESEARCH_SUCCESS_USER) {
*c14b763aSAlp Dener        /* Line search failed, revert solution and terminate */
*c14b763aSAlp Dener        bnk->f = bnk->fold;
*c14b763aSAlp Dener        ierr = VecCopy(bnk->Xold, tao->solution);CHKERRQ(ierr);
*c14b763aSAlp Dener        ierr = VecCopy(bnk->Gold, tao->gradient);CHKERRQ(ierr);
*c14b763aSAlp Dener        ierr = VecCopy(bnk->unprojected_gradient_old, bnk->unprojected_gradient);CHKERRQ(ierr);
*c14b763aSAlp Dener        tao->trust = 0.0;
*c14b763aSAlp Dener        tao->reason = TAO_DIVERGED_LS_FAILURE;
*c14b763aSAlp Dener      } else {
*c14b763aSAlp Dener        /* Line search succeeded so we should update the trust radius based on the LS step length */
*c14b763aSAlp Dener        updateType = bnk->update_type;
*c14b763aSAlp Dener        bnk->update_type = BNK_UPDATE_STEP;
*c14b763aSAlp Dener        ierr = TaoBNKUpdateTrustRadius(tao, prered, actred, stepType, &stepAccepted);CHKERRQ(ierr);
*c14b763aSAlp Dener        bnk->update_type = updateType;
*c14b763aSAlp Dener      }
*c14b763aSAlp Dener    }
*c14b763aSAlp Dener
*c14b763aSAlp Dener    /*  Check for termination */
*c14b763aSAlp Dener    ierr = TaoGradientNorm(tao, tao->gradient, NORM_2, &bnk->gnorm);CHKERRQ(ierr);
*c14b763aSAlp Dener    if (PetscIsInfOrNanReal(bnk->gnorm)) SETERRQ(PETSC_COMM_SELF,1,"User provided compute function generated Not-a-Number");
*c14b763aSAlp Dener    ierr = TaoLogConvergenceHistory(tao,bnk->f,bnk->gnorm,0.0,tao->ksp_its);CHKERRQ(ierr);
*c14b763aSAlp Dener    ierr = TaoMonitor(tao,tao->niter,bnk->f,bnk->gnorm,0.0,tao->trust);CHKERRQ(ierr);
*c14b763aSAlp Dener    ierr = (*tao->ops->convergencetest)(tao,tao->cnvP);CHKERRQ(ierr);
*c14b763aSAlp Dener  }
*c14b763aSAlp Dener  PetscFunctionReturn(0);
*c14b763aSAlp Dener}
*c14b763aSAlp Dener
*c14b763aSAlp DenerPETSC_EXTERN PetscErrorCode TaoCreate_BNTL(Tao tao)
*c14b763aSAlp Dener{
*c14b763aSAlp Dener  TAO_BNK        *bnk;
*c14b763aSAlp Dener  PetscErrorCode ierr;
*c14b763aSAlp Dener
*c14b763aSAlp Dener  PetscFunctionBegin;
*c14b763aSAlp Dener  ierr = TaoCreate_BNK(tao);CHKERRQ(ierr);
*c14b763aSAlp Dener  tao->ops->solve=TaoSolve_BNTL;
*c14b763aSAlp Dener
*c14b763aSAlp Dener  bnk = (TAO_BNK *)tao->data;
*c14b763aSAlp Dener  bnk->update_type = BNK_UPDATE_REDUCTION; /* trust region updates based on predicted/actual reduction */
*c14b763aSAlp Dener  bnk->sval = 0.0; /* disable Hessian shifting */
*c14b763aSAlp Dener  PetscFunctionReturn(0);
*c14b763aSAlp Dener}