impls/bnk/bntr.c

fed79b8eSAlp Dener#include <../src/tao/bound/impls/bnk/bnk.h>
fed79b8eSAlp Dener#include <petscksp.h>
fed79b8eSAlp Dener
fed79b8eSAlp Dener/*
fed79b8eSAlp Dener Implements Newton's Method with a trust region approach for solving
fed79b8eSAlp Dener bound constrained minimization problems.
fed79b8eSAlp Dener
198282dbSAlp Dener ------------------------------------------------------------
198282dbSAlp Dener
198282dbSAlp Dener initialize trust radius (default: BNK_INIT_INTERPOLATION)
198282dbSAlp Dener x_0 = VecMedian(x_0)
198282dbSAlp Dener f_0, g_0 = TaoComputeObjectiveAndGradient(x_0)
198282dbSAlp Dener pg_0 = VecBoundGradientProjection(g_0)
198282dbSAlp Dener check convergence at pg_0
198282dbSAlp Dener niter = 0
198282dbSAlp Dener step_accepted = true
198282dbSAlp Dener
198282dbSAlp Dener while niter <= max_it
198282dbSAlp Dener    if step_accepted
198282dbSAlp Dener      niter += 1
198282dbSAlp Dener      H_k = TaoComputeHessian(x_k)
198282dbSAlp Dener      if pc_type == BNK_PC_BFGS
198282dbSAlp Dener        add correction to BFGS approx
198282dbSAlp Dener        if scale_type == BNK_SCALE_AHESS
198282dbSAlp Dener          D = VecMedian(1e-6, abs(diag(H_k)), 1e6)
198282dbSAlp Dener          scale BFGS with VecReciprocal(D)
198282dbSAlp Dener        end
198282dbSAlp Dener      end
198282dbSAlp Dener    end
198282dbSAlp Dener
198282dbSAlp Dener    if pc_type = BNK_PC_BFGS
198282dbSAlp Dener      B_k = BFGS
198282dbSAlp Dener    else
198282dbSAlp Dener      B_k = VecMedian(1e-6, abs(diag(H_k)), 1e6)
198282dbSAlp Dener      B_k = VecReciprocal(B_k)
198282dbSAlp Dener    end
198282dbSAlp Dener    w = x_k - VecMedian(x_k - 0.001*B_k*g_k)
198282dbSAlp Dener    eps = min(eps, norm2(w))
198282dbSAlp Dener    determine the active and inactive index sets such that
198282dbSAlp Dener      L = {i : (x_k)_i <= l_i + eps && (g_k)_i > 0}
198282dbSAlp Dener      U = {i : (x_k)_i >= u_i - eps && (g_k)_i < 0}
198282dbSAlp Dener      F = {i : l_i = (x_k)_i = u_i}
198282dbSAlp Dener      A = {L + U + F}
198282dbSAlp Dener      I = {i : i not in A}
198282dbSAlp Dener
198282dbSAlp Dener    generate the reduced system Hr_k dr_k = -gr_k for variables in I
198282dbSAlp Dener    if pc_type == BNK_PC_BFGS && scale_type == BNK_SCALE_PHESS
198282dbSAlp Dener      D = VecMedian(1e-6, abs(diag(Hr_k)), 1e6)
198282dbSAlp Dener      scale BFGS with VecReciprocal(D)
198282dbSAlp Dener    end
198282dbSAlp Dener    solve Hr_k dr_k = -gr_k
198282dbSAlp Dener    set d_k to (l - x) for variables in L, (u - x) for variables in U, and 0 for variables in F
198282dbSAlp Dener
198282dbSAlp Dener    x_{k+1} = VecMedian(x_k + d_k)
198282dbSAlp Dener    s = x_{k+1} - x_k
198282dbSAlp Dener    prered = dot(s, 0.5*gr_k - Hr_k*s)
198282dbSAlp Dener    f_{k+1} = TaoComputeObjective(x_{k+1})
198282dbSAlp Dener    actred = f_k - f_{k+1}
198282dbSAlp Dener
198282dbSAlp Dener    oldTrust = trust
198282dbSAlp Dener    step_accepted, trust = TaoBNKUpdateTrustRadius(default: BNK_UPDATE_REDUCTION)
198282dbSAlp Dener    if step_accepted
198282dbSAlp Dener      g_{k+1} = TaoComputeGradient(x_{k+1})
198282dbSAlp Dener      pg_{k+1} = VecBoundGradientProjection(g_{k+1})
198282dbSAlp Dener      count the accepted Newton step
198282dbSAlp Dener    else
198282dbSAlp Dener      f_{k+1} = f_k
198282dbSAlp Dener      x_{k+1} = x_k
198282dbSAlp Dener      g_{k+1} = g_k
198282dbSAlp Dener      pg_{k+1} = pg_k
198282dbSAlp Dener      if trust == oldTrust
198282dbSAlp Dener        terminate because we cannot shrink the radius any further
198282dbSAlp Dener      end
198282dbSAlp Dener    end
198282dbSAlp Dener
198282dbSAlp Dener    check convergence at pg_{k+1}
198282dbSAlp Dener end
fed79b8eSAlp Dener*/
fed79b8eSAlp Dener
fed79b8eSAlp Denerstatic PetscErrorCode TaoSolve_BNTR(Tao tao)
fed79b8eSAlp Dener{
fed79b8eSAlp Dener  PetscErrorCode               ierr;
fed79b8eSAlp Dener  TAO_BNK                      *bnk = (TAO_BNK *)tao->data;
e465cd6fSAlp Dener  KSPConvergedReason           ksp_reason;
fed79b8eSAlp Dener
*9b6ef848SAlp Dener  PetscReal                    resnorm, oldTrust, prered, actred, stepNorm, steplen;
62675beeSAlp Dener  PetscBool                    stepAccepted = PETSC_TRUE, shift = PETSC_FALSE;
e465cd6fSAlp Dener  PetscInt                     stepType = BNK_NEWTON;
fed79b8eSAlp Dener
fed79b8eSAlp Dener  PetscFunctionBegin;
28017e9fSAlp Dener  /* Initialize the preconditioner, KSP solver and trust radius/line search */
fed79b8eSAlp Dener  tao->reason = TAO_CONTINUE_ITERATING;
62675beeSAlp Dener  ierr = TaoBNKInitialize(tao, bnk->init_type);CHKERRQ(ierr);
28017e9fSAlp Dener  if (tao->reason != TAO_CONTINUE_ITERATING) PetscFunctionReturn(0);
fed79b8eSAlp Dener
fed79b8eSAlp Dener  /* Have not converged; continue with Newton method */
fed79b8eSAlp Dener  while (tao->reason == TAO_CONTINUE_ITERATING) {
66ed3702SAlp Dener
fed79b8eSAlp Dener    if (stepAccepted) {
fed79b8eSAlp Dener      tao->niter++;
fed79b8eSAlp Dener      tao->ksp_its=0;
62675beeSAlp Dener      /* Compute the hessian and update the BFGS preconditioner at the new iterate*/
62675beeSAlp Dener      ierr = TaoBNKComputeHessian(tao);CHKERRQ(ierr);
fed79b8eSAlp Dener    }
fed79b8eSAlp Dener
8d5ead36SAlp Dener    /* Use the common BNK kernel to compute the Newton step (for inactive variables only) */
62675beeSAlp Dener    ierr = TaoBNKComputeStep(tao, shift, &ksp_reason);CHKERRQ(ierr);
fed79b8eSAlp Dener
fed79b8eSAlp Dener    /* Store current solution before it changes */
fed79b8eSAlp Dener    oldTrust = tao->trust;
fed79b8eSAlp Dener    bnk->fold = bnk->f;
fed79b8eSAlp Dener    ierr = VecCopy(tao->solution, bnk->Xold);CHKERRQ(ierr);
fed79b8eSAlp Dener    ierr = VecCopy(tao->gradient, bnk->Gold);CHKERRQ(ierr);
fed79b8eSAlp Dener    ierr = VecCopy(bnk->unprojected_gradient, bnk->unprojected_gradient_old);CHKERRQ(ierr);
fed79b8eSAlp Dener
b1c2d0e3SAlp Dener    /* Temporarily accept the step and project it into the bounds */
fed79b8eSAlp Dener    ierr = VecAXPY(tao->solution, 1.0, tao->stepdirection);CHKERRQ(ierr);
b1c2d0e3SAlp Dener    ierr = VecMedian(tao->XL, tao->solution, tao->XU, tao->solution);CHKERRQ(ierr);
b1c2d0e3SAlp Dener
b1c2d0e3SAlp Dener    /* Check if the projection changed the step direction */
b1c2d0e3SAlp Dener    ierr = VecCopy(tao->solution, tao->stepdirection);CHKERRQ(ierr);
8d5ead36SAlp Dener    ierr = VecAXPY(tao->stepdirection, -1.0, bnk->Xold);CHKERRQ(ierr);
b1c2d0e3SAlp Dener    ierr = VecNorm(tao->stepdirection, NORM_2, &stepNorm);CHKERRQ(ierr);
b1c2d0e3SAlp Dener    if (stepNorm != bnk->dnorm) {
8d5ead36SAlp Dener      /* Projection changed the step, so we have to recompute predicted reduction.
8d5ead36SAlp Dener         However, we deliberately do not change the step norm and the trust radius
8d5ead36SAlp Dener         in order for the safeguard to more closely mimic a piece-wise linesearch
8d5ead36SAlp Dener         along the bounds. */
28017e9fSAlp Dener      ierr = MatMult(bnk->H_inactive, tao->stepdirection, bnk->Xwork);CHKERRQ(ierr);
198282dbSAlp Dener      ierr = VecAYPX(bnk->Xwork, -0.5, bnk->G_inactive);CHKERRQ(ierr);
b1c2d0e3SAlp Dener      ierr = VecDot(bnk->Xwork, tao->stepdirection, &prered);
b1c2d0e3SAlp Dener    } else {
b1c2d0e3SAlp Dener      /* Step did not change, so we can just recover the pre-computed prediction */
b1c2d0e3SAlp Dener      ierr = KSPCGGetObjFcn(tao->ksp, &prered);CHKERRQ(ierr);
b1c2d0e3SAlp Dener    }
b1c2d0e3SAlp Dener    prered = -prered;
b1c2d0e3SAlp Dener
b1c2d0e3SAlp Dener    /* Compute the actual reduction and update the trust radius */
fed79b8eSAlp Dener    ierr = TaoComputeObjective(tao, tao->solution, &bnk->f);CHKERRQ(ierr);
b1c2d0e3SAlp Dener    actred = bnk->fold - bnk->f;
28017e9fSAlp Dener    ierr = TaoBNKUpdateTrustRadius(tao, prered, actred, bnk->update_type, stepType, &stepAccepted);CHKERRQ(ierr);
fed79b8eSAlp Dener
fed79b8eSAlp Dener    if (stepAccepted) {
66ed3702SAlp Dener      /* Step is good, evaluate the gradient and the hessian */
8d5ead36SAlp Dener      steplen = 1.0;
e465cd6fSAlp Dener      ++bnk->newt;
fed79b8eSAlp Dener      ierr = TaoComputeGradient(tao, tao->solution, bnk->unprojected_gradient);CHKERRQ(ierr);
fed79b8eSAlp Dener      ierr = VecBoundGradientProjection(bnk->unprojected_gradient,tao->solution,tao->XL,tao->XU,tao->gradient);CHKERRQ(ierr);
*9b6ef848SAlp Dener      ierr = VecNorm(tao->gradient, NORM_2, &bnk->gnorm);CHKERRQ(ierr);
*9b6ef848SAlp Dener      if (PetscIsInfOrNanReal(bnk->gnorm)) SETERRQ(PETSC_COMM_SELF,1,"User provided compute function generated Not-a-Number");
fed79b8eSAlp Dener    } else {
fed79b8eSAlp Dener      /* Step is bad, revert old solution and re-solve with new radius*/
8d5ead36SAlp Dener      steplen = 0.0;
fed79b8eSAlp Dener      bnk->f = bnk->fold;
fed79b8eSAlp Dener      ierr = VecCopy(bnk->Xold, tao->solution);CHKERRQ(ierr);
fed79b8eSAlp Dener      ierr = VecCopy(bnk->Gold, tao->gradient);CHKERRQ(ierr);
fed79b8eSAlp Dener      ierr = VecCopy(bnk->unprojected_gradient_old, bnk->unprojected_gradient);CHKERRQ(ierr);
73e4db90SAlp Dener      if (oldTrust == tao->trust) {
73e4db90SAlp Dener        /* Can't change the radius anymore so just terminate */
fed79b8eSAlp Dener        tao->reason = TAO_DIVERGED_TR_REDUCTION;
fed79b8eSAlp Dener      }
fed79b8eSAlp Dener    }
fed79b8eSAlp Dener
fed79b8eSAlp Dener    /*  Check for termination */
*9b6ef848SAlp Dener    ierr = VecFischer(tao->solution, bnk->unprojected_gradient, tao->XL, tao->XU, bnk->Gwork);CHKERRQ(ierr);
*9b6ef848SAlp Dener    ierr = VecNorm(bnk->Gwork, NORM_2, &resnorm);CHKERRQ(ierr);
*9b6ef848SAlp Dener    ierr = TaoLogConvergenceHistory(tao, bnk->f, resnorm, 0.0, tao->ksp_its);CHKERRQ(ierr);
*9b6ef848SAlp Dener    ierr = TaoMonitor(tao, tao->niter, bnk->f, resnorm, 0.0, steplen);CHKERRQ(ierr);
fed79b8eSAlp Dener    ierr = (*tao->ops->convergencetest)(tao, tao->cnvP);CHKERRQ(ierr);
fed79b8eSAlp Dener  }
fed79b8eSAlp Dener  PetscFunctionReturn(0);
fed79b8eSAlp Dener}
fed79b8eSAlp Dener
df278d8fSAlp Dener/*------------------------------------------------------------*/
df278d8fSAlp Dener
*9b6ef848SAlp DenerPETSC_INTERN PetscErrorCode TaoSetUp_BNTR(Tao tao)
*9b6ef848SAlp Dener{
*9b6ef848SAlp Dener  TAO_BNK        *bnk = (TAO_BNK *)tao->data;
*9b6ef848SAlp Dener  PetscErrorCode ierr;
*9b6ef848SAlp Dener
*9b6ef848SAlp Dener  PetscFunctionBegin;
*9b6ef848SAlp Dener  ierr = TaoSetUp_BNK(tao);CHKERRQ(ierr);
*9b6ef848SAlp Dener  if (!bnk->is_nash && !bnk->is_stcg && !bnk->is_gltr) SETERRQ(PETSC_COMM_SELF,1,"Must use a trust-region CG method for KSP (KSPNASH, KSPSTCG, KSPGLTR)");
*9b6ef848SAlp Dener  PetscFunctionReturn(0);
*9b6ef848SAlp Dener}
*9b6ef848SAlp Dener
*9b6ef848SAlp Dener/*------------------------------------------------------------*/
*9b6ef848SAlp Dener
*9b6ef848SAlp DenerPETSC_INTERN PetscErrorCode TaoCreate_BNTR(Tao tao)
fed79b8eSAlp Dener{
fed79b8eSAlp Dener  TAO_BNK        *bnk;
fed79b8eSAlp Dener  PetscErrorCode ierr;
fed79b8eSAlp Dener
fed79b8eSAlp Dener  PetscFunctionBegin;
fed79b8eSAlp Dener  ierr = TaoCreate_BNK(tao);CHKERRQ(ierr);
fed79b8eSAlp Dener  tao->ops->solve=TaoSolve_BNTR;
*9b6ef848SAlp Dener  tao->ops->setup=TaoSetUp_BNTR;
fed79b8eSAlp Dener
fed79b8eSAlp Dener  bnk = (TAO_BNK *)tao->data;
66ed3702SAlp Dener  bnk->update_type = BNK_UPDATE_REDUCTION; /* trust region updates based on predicted/actual reduction */
66ed3702SAlp Dener  bnk->sval = 0.0; /* disable Hessian shifting */
fed79b8eSAlp Dener  PetscFunctionReturn(0);
fed79b8eSAlp Dener}