impls/bnk/bnk.h

eb910715SAlp Dener/*
eb910715SAlp DenerContext for bounded Newton-Krylov type optimization algorithms
eb910715SAlp Dener*/
eb910715SAlp Dener
eb910715SAlp Dener#if !defined(__TAO_BNK_H)
eb910715SAlp Dener#define __TAO_BNK_H
eb910715SAlp Dener#include <petsc/private/taoimpl.h>
eb910715SAlp Dener#include <../src/tao/matrix/lmvmmat.h>
eb910715SAlp Dener
eb910715SAlp Denertypedef struct {
09164190SAlp Dener  Mat H_inactive, Hpre_inactive, M;
2f75a4aaSAlp Dener  Vec W, Xwork, Gwork, inactive_work, active_work;
*62675beeSAlp Dener  Vec Xold, Gold, Diag, Diag_min, Diag_max;
09164190SAlp Dener  Vec unprojected_gradient, unprojected_gradient_old;
2f75a4aaSAlp Dener  IS  inactive_idx, active_idx, active_lower, active_upper, active_fixed;
eb910715SAlp Dener
080d2917SAlp Dener  /* Scalar values for the solution and step */
080d2917SAlp Dener  PetscReal fold, f, gnorm, dnorm;
eb910715SAlp Dener
2f75a4aaSAlp Dener  /* Parameters for active set estimation */
0a4511e9SAlp Dener  PetscReal as_tol;
0a4511e9SAlp Dener  PetscReal as_step;
2f75a4aaSAlp Dener
eb910715SAlp Dener  /* Parameters when updating the perturbation added to the Hessian matrix
eb910715SAlp Dener     according to the following scheme:
eb910715SAlp Dener
eb910715SAlp Dener     pert = sval;
eb910715SAlp Dener
eb910715SAlp Dener     do until convergence
eb910715SAlp Dener       shift Hessian by pert
eb910715SAlp Dener       solve Newton system
eb910715SAlp Dener
eb910715SAlp Dener       if (linear solver failed or did not compute a descent direction)
eb910715SAlp Dener         use steepest descent direction and increase perturbation
eb910715SAlp Dener
eb910715SAlp Dener         if (0 == pert)
eb910715SAlp Dener           initialize perturbation
eb910715SAlp Dener           pert = min(imax, max(imin, imfac * norm(G)))
eb910715SAlp Dener         else
eb910715SAlp Dener           increase perturbation
eb910715SAlp Dener           pert = min(pmax, max(pgfac * pert, pmgfac * norm(G)))
eb910715SAlp Dener         fi
eb910715SAlp Dener       else
eb910715SAlp Dener         use linear solver direction and decrease perturbation
eb910715SAlp Dener
eb910715SAlp Dener         pert = min(psfac * pert, pmsfac * norm(G))
eb910715SAlp Dener         if (pert < pmin)
eb910715SAlp Dener           pert = 0
eb910715SAlp Dener         fi
eb910715SAlp Dener       fi
eb910715SAlp Dener
eb910715SAlp Dener       perform line search
eb910715SAlp Dener       function and gradient evaluation
eb910715SAlp Dener       check convergence
eb910715SAlp Dener     od
eb910715SAlp Dener  */
eb910715SAlp Dener  PetscReal sval;               /*  Starting perturbation value, default zero */
eb910715SAlp Dener
eb910715SAlp Dener  PetscReal imin;               /*  Minimum perturbation added during initialization  */
eb910715SAlp Dener  PetscReal imax;               /*  Maximum perturbation added during initialization */
eb910715SAlp Dener  PetscReal imfac;              /*  Merit function factor during initialization */
eb910715SAlp Dener
eb910715SAlp Dener  PetscReal pert;               /*  Current perturbation value */
eb910715SAlp Dener  PetscReal pmin;               /*  Minimim perturbation value */
eb910715SAlp Dener  PetscReal pmax;               /*  Maximum perturbation value */
eb910715SAlp Dener  PetscReal pgfac;              /*  Perturbation growth factor */
eb910715SAlp Dener  PetscReal psfac;              /*  Perturbation shrink factor */
eb910715SAlp Dener  PetscReal pmgfac;             /*  Merit function growth factor */
eb910715SAlp Dener  PetscReal pmsfac;             /*  Merit function shrink factor */
eb910715SAlp Dener
eb910715SAlp Dener  /* Parameters when updating the trust-region radius based on steplength
eb910715SAlp Dener     if   step < nu1            (very bad step)
eb910715SAlp Dener       radius = omega1 * min(norm(d), radius)
eb910715SAlp Dener     elif step < nu2            (bad step)
eb910715SAlp Dener       radius = omega2 * min(norm(d), radius)
eb910715SAlp Dener     elif step < nu3            (okay step)
eb910715SAlp Dener       radius = omega3 * radius;
eb910715SAlp Dener     elif step < nu4            (good step)
eb910715SAlp Dener       radius = max(omega4 * norm(d), radius)
eb910715SAlp Dener     else                       (very good step)
eb910715SAlp Dener       radius = max(omega5 * norm(d), radius)
eb910715SAlp Dener     fi
eb910715SAlp Dener  */
eb910715SAlp Dener  PetscReal nu1;                /*  used to compute trust-region radius */
eb910715SAlp Dener  PetscReal nu2;                /*  used to compute trust-region radius */
eb910715SAlp Dener  PetscReal nu3;                /*  used to compute trust-region radius */
eb910715SAlp Dener  PetscReal nu4;                /*  used to compute trust-region radius */
eb910715SAlp Dener
eb910715SAlp Dener  PetscReal omega1;             /*  factor used for trust-region update */
eb910715SAlp Dener  PetscReal omega2;             /*  factor used for trust-region update */
eb910715SAlp Dener  PetscReal omega3;             /*  factor used for trust-region update */
eb910715SAlp Dener  PetscReal omega4;             /*  factor used for trust-region update */
eb910715SAlp Dener  PetscReal omega5;             /*  factor used for trust-region update */
eb910715SAlp Dener
eb910715SAlp Dener  /* Parameters when updating the trust-region radius based on reduction
eb910715SAlp Dener
eb910715SAlp Dener     kappa = ared / pred
eb910715SAlp Dener     if   kappa < eta1          (very bad step)
eb910715SAlp Dener       radius = alpha1 * min(norm(d), radius)
eb910715SAlp Dener     elif kappa < eta2          (bad step)
eb910715SAlp Dener       radius = alpha2 * min(norm(d), radius)
eb910715SAlp Dener     elif kappa < eta3          (okay step)
eb910715SAlp Dener       radius = alpha3 * radius;
eb910715SAlp Dener     elif kappa < eta4          (good step)
eb910715SAlp Dener       radius = max(alpha4 * norm(d), radius)
eb910715SAlp Dener     else                       (very good step)
eb910715SAlp Dener       radius = max(alpha5 * norm(d), radius)
eb910715SAlp Dener     fi
eb910715SAlp Dener  */
eb910715SAlp Dener  PetscReal eta1;               /*  used to compute trust-region radius */
eb910715SAlp Dener  PetscReal eta2;               /*  used to compute trust-region radius */
eb910715SAlp Dener  PetscReal eta3;               /*  used to compute trust-region radius */
eb910715SAlp Dener  PetscReal eta4;               /*  used to compute trust-region radius */
eb910715SAlp Dener
eb910715SAlp Dener  PetscReal alpha1;             /*  factor used for trust-region update */
eb910715SAlp Dener  PetscReal alpha2;             /*  factor used for trust-region update */
eb910715SAlp Dener  PetscReal alpha3;             /*  factor used for trust-region update */
eb910715SAlp Dener  PetscReal alpha4;             /*  factor used for trust-region update */
eb910715SAlp Dener  PetscReal alpha5;             /*  factor used for trust-region update */
eb910715SAlp Dener
eb910715SAlp Dener  /* Parameters when updating the trust-region radius based on interpolation
eb910715SAlp Dener
eb910715SAlp Dener     kappa = ared / pred
eb910715SAlp Dener     if   kappa >= 1.0 - mu1    (very good step)
eb910715SAlp Dener       choose tau in [gamma3, gamma4]
eb910715SAlp Dener       radius = max(tau * norm(d), radius)
eb910715SAlp Dener     elif kappa >= 1.0 - mu2    (good step)
eb910715SAlp Dener       choose tau in [gamma2, gamma3]
eb910715SAlp Dener       if (tau >= 1.0)
eb910715SAlp Dener         radius = max(tau * norm(d), radius)
eb910715SAlp Dener       else
eb910715SAlp Dener         radius = tau * min(norm(d), radius)
eb910715SAlp Dener       fi
eb910715SAlp Dener     else                       (bad step)
eb910715SAlp Dener       choose tau in [gamma1, 1.0]
eb910715SAlp Dener       radius = tau * min(norm(d), radius)
eb910715SAlp Dener     fi
eb910715SAlp Dener  */
eb910715SAlp Dener  PetscReal mu1;                /*  used for model agreement in interpolation */
eb910715SAlp Dener  PetscReal mu2;                /*  used for model agreement in interpolation */
eb910715SAlp Dener
eb910715SAlp Dener  PetscReal gamma1;             /*  factor used for interpolation */
eb910715SAlp Dener  PetscReal gamma2;             /*  factor used for interpolation */
eb910715SAlp Dener  PetscReal gamma3;             /*  factor used for interpolation */
eb910715SAlp Dener  PetscReal gamma4;             /*  factor used for interpolation */
eb910715SAlp Dener
eb910715SAlp Dener  PetscReal theta;              /*  factor used for interpolation */
eb910715SAlp Dener
eb910715SAlp Dener  /*  Parameters when initializing trust-region radius based on interpolation */
eb910715SAlp Dener  PetscReal mu1_i;              /*  used for model agreement in interpolation */
eb910715SAlp Dener  PetscReal mu2_i;              /*  used for model agreement in interpolation */
eb910715SAlp Dener
eb910715SAlp Dener  PetscReal gamma1_i;           /*  factor used for interpolation */
eb910715SAlp Dener  PetscReal gamma2_i;           /*  factor used for interpolation */
eb910715SAlp Dener  PetscReal gamma3_i;           /*  factor used for interpolation */
eb910715SAlp Dener  PetscReal gamma4_i;           /*  factor used for interpolation */
eb910715SAlp Dener
eb910715SAlp Dener  PetscReal theta_i;            /*  factor used for interpolation */
eb910715SAlp Dener
eb910715SAlp Dener  /*  Other parameters */
eb910715SAlp Dener  PetscReal min_radius;         /*  lower bound on initial radius value */
eb910715SAlp Dener  PetscReal max_radius;         /*  upper bound on trust region radius */
eb910715SAlp Dener  PetscReal epsilon;            /*  tolerance used when computing ared/pred */
*62675beeSAlp Dener  PetscReal dmin, dmax;         /*  upper and lower bounds for the Hessian diagonal vector */
eb910715SAlp Dener
eb910715SAlp Dener  PetscInt newt;                /*  Newton directions attempted */
eb910715SAlp Dener  PetscInt bfgs;                /*  BFGS directions attempted */
eb910715SAlp Dener  PetscInt sgrad;               /*  Scaled gradient directions attempted */
eb910715SAlp Dener  PetscInt grad;                /*  Gradient directions attempted */
eb910715SAlp Dener
*62675beeSAlp Dener  PetscInt as_type;             /*   Active set estimation method */
eb910715SAlp Dener  PetscInt pc_type;             /*  Preconditioner for the code */
eb910715SAlp Dener  PetscInt bfgs_scale_type;     /*  Scaling matrix to used for the bfgs preconditioner */
eb910715SAlp Dener  PetscInt init_type;           /*  Trust-region initialization method */
eb910715SAlp Dener  PetscInt update_type;         /*  Trust-region update method */
eb910715SAlp Dener
2f75a4aaSAlp Dener  /* Trackers for KSP solution type and convergence reasons */
eb910715SAlp Dener  PetscInt ksp_atol;
eb910715SAlp Dener  PetscInt ksp_rtol;
eb910715SAlp Dener  PetscInt ksp_ctol;
eb910715SAlp Dener  PetscInt ksp_negc;
eb910715SAlp Dener  PetscInt ksp_dtol;
eb910715SAlp Dener  PetscInt ksp_iter;
eb910715SAlp Dener  PetscInt ksp_othr;
eb910715SAlp Dener  PetscBool is_nash, is_stcg, is_gltr;
eb910715SAlp Dener} TAO_BNK;
eb910715SAlp Dener
eb910715SAlp Dener#endif /* if !defined(__TAO_BNK_H) */
eb910715SAlp Dener
eb910715SAlp Dener#define BNK_NEWTON              0
eb910715SAlp Dener#define BNK_BFGS                1
eb910715SAlp Dener#define BNK_SCALED_GRADIENT     2
eb910715SAlp Dener#define BNK_GRADIENT            3
eb910715SAlp Dener
eb910715SAlp Dener#define BNK_PC_NONE     0
eb910715SAlp Dener#define BNK_PC_AHESS    1
eb910715SAlp Dener#define BNK_PC_BFGS     2
eb910715SAlp Dener#define BNK_PC_PETSC    3
eb910715SAlp Dener#define BNK_PC_TYPES    4
eb910715SAlp Dener
eb910715SAlp Dener#define BFGS_SCALE_AHESS        0
eb910715SAlp Dener#define BFGS_SCALE_PHESS        1
eb910715SAlp Dener#define BFGS_SCALE_BFGS         2
eb910715SAlp Dener#define BFGS_SCALE_TYPES        3
eb910715SAlp Dener
eb910715SAlp Dener#define BNK_INIT_CONSTANT         0
eb910715SAlp Dener#define BNK_INIT_DIRECTION        1
eb910715SAlp Dener#define BNK_INIT_INTERPOLATION    2
eb910715SAlp Dener#define BNK_INIT_TYPES            3
eb910715SAlp Dener
eb910715SAlp Dener#define BNK_UPDATE_STEP           0
eb910715SAlp Dener#define BNK_UPDATE_REDUCTION      1
eb910715SAlp Dener#define BNK_UPDATE_INTERPOLATION  2
eb910715SAlp Dener#define BNK_UPDATE_TYPES          3
eb910715SAlp Dener
2f75a4aaSAlp Dener#define BNK_AS_NONE             0
2f75a4aaSAlp Dener#define BNK_AS_BERTSEKAS        1
2f75a4aaSAlp Dener#define BNK_AS_TYPES            2
2f75a4aaSAlp Dener
eb910715SAlp Denerstatic const char *BNK_PC[64] = {"none", "ahess", "bfgs", "petsc"};
eb910715SAlp Dener
eb910715SAlp Denerstatic const char *BFGS_SCALE[64] = {"ahess", "phess", "bfgs"};
eb910715SAlp Dener
eb910715SAlp Denerstatic const char *BNK_INIT[64] = {"constant", "direction", "interpolation"};
eb910715SAlp Dener
eb910715SAlp Denerstatic const char *BNK_UPDATE[64] = {"step", "reduction", "interpolation"};
eb910715SAlp Dener
2f75a4aaSAlp Denerstatic const char *BNK_AS[64] = {"none", "bertsekas"};
2f75a4aaSAlp Dener
eb910715SAlp DenerPETSC_INTERN PetscErrorCode TaoCreate_BNK(Tao);
eb910715SAlp Dener
eb910715SAlp DenerPETSC_INTERN PetscErrorCode MatLMVMSolveShell(PC, Vec, Vec);
*62675beeSAlp DenerPETSC_INTERN PetscErrorCode TaoBNKInitialize(Tao, PetscInt);
2f75a4aaSAlp DenerPETSC_INTERN PetscErrorCode TaoBNKEstimateActiveSet(Tao);
*62675beeSAlp DenerPETSC_INTERN PetscErrorCode TaoBNKComputeHessian(Tao);
2f75a4aaSAlp DenerPETSC_INTERN PetscErrorCode TaoBNKBoundStep(Tao, Vec);
*62675beeSAlp DenerPETSC_INTERN PetscErrorCode TaoBNKComputeStep(Tao, PetscBool, KSPConvergedReason*);
e465cd6fSAlp DenerPETSC_INTERN PetscErrorCode TaoBNKSafeguardStep(Tao, KSPConvergedReason, PetscInt*);
c14b763aSAlp DenerPETSC_INTERN PetscErrorCode TaoBNKPerformLineSearch(Tao, PetscInt, PetscReal*, TaoLineSearchConvergedReason*);
28017e9fSAlp DenerPETSC_INTERN PetscErrorCode TaoBNKUpdateTrustRadius(Tao, PetscReal, PetscReal, PetscInt, PetscInt, PetscBool*);
*62675beeSAlp DenerPETSC_INTERN PetscErrorCode TaoBNKAddStepCounts(Tao, PetscInt);