Rocstar-legacy/Misc_2MsqHessian_8cpp_source.html

 /* *****************************************************************

     MESQUITE -- The Mesh Quality Improvement Toolkit


     Copyright 2004 Sandia Corporation and Argonne National

     Laboratory.  Under the terms of Contract DE-AC04-94AL85000

     with Sandia Corporation, the U.S. Government retains certain

     rights in this software.


     This library is free software; you can redistribute it and/or

     modify it under the terms of the GNU Lesser General Public

     License as published by the Free Software Foundation; either

     version 2.1 of the License, or (at your option) any later version.


     This library is distributed in the hope that it will be useful,

     but WITHOUT ANY WARRANTY; without even the implied warranty of

     MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU

     Lesser General Public License for more details.


     You should have received a copy of the GNU Lesser General Public License

     (lgpl.txt) along with this library; if not, write to the Free Software

     Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA


     diachin2@llnl.gov, djmelan@sandia.gov, mbrewer@sandia.gov,

     pknupp@sandia.gov, tleurent@mcs.anl.gov, tmunson@mcs.anl.gov


   ***************************************************************** */

 // -*- Mode : c++; tab-width: 3; c-tab-always-indent: t; indent-tabs-mode: nil; c-basic-offset: 3 -*-

 //

 //    AUTHOR: Todd Munson <tmunson@mcs.anl.gov>

 //       ORG: Argonne National Laboratory

 //    E-MAIL: tmunson@mcs.anl.gov

 //

 // ORIG-DATE:  2-Jan-03 at 11:02:19 by Thomas Leurent

 //  LAST-MOD: 26-Nov-03 at 15:47:42 by Thomas Leurent

 //

 // DESCRIPTION:

 // ============

 #include "MsqHessian.hpp"

 #include "MsqTimer.hpp"


 #ifdef MSQ_USE_OLD_C_HEADERS

 #  include <math.h>

 #else

 #  include <cmath>

 #endif


 #ifdef MSQ_USE_OLD_IO_HEADERS

 #  include <iostream.h>

 #else

 #  include <iostream>

 #endif


 namespace Mesquite {


 MsqHessian::MsqHessian() :

   origin_pd(0), mEntries(0), mRowStart(0), mColIndex(0),

   mAccumulation(0), mAccumElemStart(0), mSize(0),

   mPreconditioner(0), precondArraySize(0),

   mR(0), mZ(0), mP(0), mW(0), cgArraySizes(0), maxCGiter(50)

 { }


 MsqHessian::~MsqHessian()

 {

   delete[] mEntries;

   delete[] mRowStart;

   delete[] mColIndex;


   delete[] mAccumulation;

   delete[] mAccumElemStart;


   delete[] mPreconditioner;


   delete[] mR;

   delete[] mZ;

   delete[] mP;

   delete[] mW;

 }


 void MsqHessian::initialize(PatchData &pd, MsqError &err)

 {

   MSQ_FUNCTION_TIMER( "MsqHession::initialize" );

   delete[] mEntries;

   delete[] mRowStart;

   delete[] mColIndex;

   delete[] mAccumulation;

   delete[] mAccumElemStart;


   size_t num_vertices = pd.num_vertices();

   size_t num_elements = pd.num_elements();

   size_t const * vtx_list;

   size_t e, r, rs, re, c, cs, ce, nz, nnz, nve, i, j;

   patchElemArray = pd.get_element_array(err); MSQ_CHKERR(err);


   if (num_vertices == 0) {

     MSQ_SETERR( err )( "No vertices in PatchData", MsqError::INVALID_ARG);

     return;

   }


   mSize = num_vertices;


   // Calculate the offsets for a CSC representation of the accumulation

   // pattern.


   size_t* col_start = new size_t[num_vertices + 1];

   mAccumElemStart = new size_t[num_elements+1];

   mAccumElemStart[0] = 0;


   for (i = 0; i < num_vertices; ++i) {

     col_start[i] = 0;

   }


   for (e = 0; e < num_elements; ++e) {

     nve = patchElemArray[e].vertex_count();

     vtx_list = patchElemArray[e].get_vertex_index_array();

     mAccumElemStart[e+1] = mAccumElemStart[e] + (nve+1)*nve/2;


     for (i = 0; i < nve; ++i) {

       r = vtx_list[i];


       for (j = i; j < nve; ++j) {

         c = vtx_list[j];


         if (r <= c) {

           col_start[c]++;

         }

         else {

           col_start[r]++;

         }

       }

     }

   }


   nz = 0;

   for (i = 0; i < num_vertices; ++i) {

     j = col_start[i];

     col_start[i] = nz;

     nz += j;

   }

   col_start[i] = nz;


   // Finished putting matrix into CSC representation


   int* row_instr = new int[5*nz];

   size_t* row_index = new size_t[nz];


   nz = 0;

   for (e = 0; e < num_elements; ++e) {

     nve = patchElemArray[e].vertex_count();

     vtx_list = patchElemArray[e].get_vertex_index_array();


     for (i = 0; i < nve; ++i) {

       r = vtx_list[i];


       for (j = i; j < nve; ++j) {

         c = vtx_list[j];


         if (r <= c) {

           row_index[col_start[c]] = r;

           row_instr[col_start[c]] = nz;

           ++col_start[c];

         }

         else {

           row_index[col_start[r]] = c;

           row_instr[col_start[r]] = -nz;

           ++col_start[r];

         }


         ++nz;

       }

     }

   }


   for (i = num_vertices-1; i > 0; --i) {

     col_start[i+1] = col_start[i];

   }

   col_start[1] = col_start[0];

   col_start[0] = 0;


   //   cout << "col_start: ";

   //   for (int t=0; t<num_vertices+1; ++t)

   //     cout << col_start[t] << " ";

   //   cout << endl;

   //   cout << "row_index: ";

   //   for (int t=0; t<nz; ++t)

   //     cout << row_index[t] << " ";

   //   cout << endl;

   //   cout << "row_instr: ";

   //   for (int t=0; t<nz; ++t)

   //     cout << row_instr[t] << " ";

   //   cout << endl;


   // Convert CSC to CSR

   // First calculate the offsets in the row


   size_t* row_start = new size_t[num_vertices + 1];


   for (i = 0; i < num_vertices; ++i) {

     row_start[i] = 0;

   }


   for (i = 0; i < nz; ++i) {

     ++row_start[row_index[i]];

   }


   nz = 0;

   for (i = 0; i < num_vertices; ++i) {

     j = row_start[i];

     row_start[i] = nz;

     nz += j;

   }

   row_start[i] = nz;


   // Now calculate the pattern


   size_t* col_index = new size_t[nz];

   int* col_instr = new int[nz];


   for (i = 0; i < num_vertices; ++i) {

     cs = col_start[i];

     ce = col_start[i+1];


     while(cs < ce) {

       r = row_index[cs];


       col_index[row_start[r]] = i;

       col_instr[row_start[r]] = row_instr[cs];


       ++row_start[r];

       ++cs;

     }

   }


   for (i = num_vertices-1; i > 0; --i) {

     row_start[i+1] = row_start[i];

   }

   row_start[1] = row_start[0];

   row_start[0] = 0;


   delete[] row_index;


   // Now that the matrix is CSR

   // Column indices for each row are sorted


   // Compaction -- count the number of nonzeros

   mRowStart = col_start;   // don't need to reallocate

   mAccumulation = row_instr;   // don't need to reallocate


   for (i = 0; i <= num_vertices; ++i) {

     mRowStart[i] = 0;

   }


   nnz = 0;

   for (i = 0; i < num_vertices; ++i) {

     rs = row_start[i];

     re = row_start[i+1];


     c = num_vertices;

     while(rs < re) {

       if (c != col_index[rs]) {

         // This is an unseen nonzero


         c = col_index[rs];

         ++mRowStart[i];

         ++nnz;

       }


       if (col_instr[rs] >= 0) {

         mAccumulation[col_instr[rs]] = nnz - 1;

       }

       else {

         mAccumulation[-col_instr[rs]] = 1 - nnz;

       }


       ++rs;

     }

   }


   nnz = 0;

   for (i = 0; i < num_vertices; ++i) {

     j = mRowStart[i];

     mRowStart[i] = nnz;

     nnz += j;

   }

   mRowStart[i] = nnz;


   delete [] col_instr;


   // Fill in the compacted hessian matrix


   mColIndex = new size_t[nnz];


   for (i = 0; i < num_vertices; ++i) {

     rs = row_start[i];

     re = row_start[i+1];


     c = num_vertices;

     while(rs < re) {

       if (c != col_index[rs]) {

         // This is an unseen nonzero


         c = col_index[rs];

         mColIndex[mRowStart[i]] = c;

         mRowStart[i]++;

       }

       ++rs;

     }

   }


   for (i = num_vertices-1; i > 0; --i) {

     mRowStart[i+1] = mRowStart[i];

   }

   mRowStart[1] = mRowStart[0];

   mRowStart[0] = 0;


   delete [] row_start;

   delete [] col_index;


   mEntries = new Matrix3D[nnz]; // On Solaris, no initializer allowed for new of an array

   for (i=0;i<nnz;++i) mEntries[i] = 0.; // so we initialize all entries manually.


   origin_pd = &pd;


   return;

 }


 void MsqHessian::get_diagonal_blocks(msq_std::vector<Matrix3D> &diag,

                                      MsqError &/*err*/)

 {

   // make sure we have enough memory, so that no reallocation is needed later.

   if (diag.size() != size()) {

     diag.reserve(size());

   }


   for (size_t i=0; i<size(); ++i) {

     diag[i] = mEntries[mRowStart[i]];

   }

 }


 void MsqHessian::compute_preconditioner(MsqError &/*err*/)

 {

   // reallocates arrays if size of the Hessian has changed too much.

   if (mSize > precondArraySize || mSize < precondArraySize/10 ) {

     delete[] mPreconditioner;

     mPreconditioner = new Matrix3D[mSize];

   }


   Matrix3D* diag_block;

   double sum, tmp;

   size_t m;

   // For each diagonal block, the (inverted) preconditioner is

   // the inverse of the sum of the diagonal entries.

   for (m=0; m<mSize; ++m) {

     diag_block = mEntries + mRowStart[m]; // Gets block at position m,m .


 #if DIAGONAL_PRECONDITIONER

     // find sum, and computes inverse, or 0 if sum = 0 .

     sum = (*diag_block)[0][0] + (*diag_block)[1][1] + (*diag_block)[2][2];

     double inv_sum;

     if (sum != 0.)

       inv_sum = 1 / sum;

     else

       inv_sum = 0.;


     mPreconditioner[m][0][0] = inv_sum;

     mPreconditioner[m][1][1] = inv_sum;

     mPreconditioner[m][2][2] = inv_sum;

 #else

     // calculate LDL^T factorization of the diagonal block

     //  L = [1 pre[0][1] pre[0][2]]

     //      [0 1         pre[1][2]]

     //      [0 0         1        ]

     //  inv(D) = [pre[0][0] 0         0        ]

     //           [0         pre[1][1] 0        ]

     //           [0         0         pre[2][2]]


     if ((*diag_block)[0][0] == 0.0) {

       // Either this is a fixed vertex or the diagonal block is not

       // invertible.  Switch to the diagonal preconditioner in this

       // case.


       sum = (*diag_block)[0][0] + (*diag_block)[1][1] + (*diag_block)[2][2];

       if (sum != 0.0)

         sum = 1 / sum;


       mPreconditioner[m][0][0] = sum;

       mPreconditioner[m][0][1] = 0.0;

       mPreconditioner[m][0][2] = 0.0;

       mPreconditioner[m][1][1] = sum;

       mPreconditioner[m][1][2] = 0.0;

       mPreconditioner[m][2][2] = sum;

     }

     else {

       mPreconditioner[m][0][0] = 1.0 / (*diag_block)[0][0];

       mPreconditioner[m][0][1] = (*diag_block)[0][1] * mPreconditioner[m][0][0];

       mPreconditioner[m][0][2] = (*diag_block)[0][2] * mPreconditioner[m][0][0];


       mPreconditioner[m][1][1] =

         1.0 / ((*diag_block)[1][1] -

                (*diag_block)[0][1] * mPreconditioner[m][0][1]);


       tmp = (*diag_block)[1][2] -

             (*diag_block)[0][2] * mPreconditioner[m][0][1];


       mPreconditioner[m][1][2] = mPreconditioner[m][1][1] * tmp;


       mPreconditioner[m][2][2] =

         1.0 / ((*diag_block)[2][2] -

                (*diag_block)[0][2]*mPreconditioner[m][0][2] -

                mPreconditioner[m][1][2]*tmp);

     }

 #endif

   }

 }


 void MsqHessian::cg_solver(Vector3D x[], Vector3D b[], MsqError &err)

 {

   MSQ_FUNCTION_TIMER( "MsqHessian::cg_solver" );


   // reallocates arrays if size of the Hessian has changed too much.

   if (mSize > cgArraySizes || mSize < cgArraySizes/10 ) {

     delete[] mR;

     delete[] mZ;

     delete[] mP;

     delete[] mW;

     mR = new Vector3D[mSize];

     mZ = new Vector3D[mSize];

     mP = new Vector3D[mSize];

     mW = new Vector3D[mSize];

     cgArraySizes = mSize;

   }


   size_t i;

   double alpha_, alpha, beta;

   double cg_tol = 1e-2; // 1e-2 will give a reasonably good solution (~1%).

   double norm_g = length(b, mSize);

   double norm_r = norm_g;

   double rzm1; // r^T_{k-1} z_{k-1}

   double rzm2; // r^T_{k-2} z_{k-2}


   this->compute_preconditioner(err); MSQ_CHKERR(err); // get M^{-1} for diagonal blocks


   for (i=0; i<mSize; ++i)  x[i] = 0. ;

   for (i=0; i<mSize; ++i)  mR[i] = -b[i] ;  // r = -b because x_0 = 0 and we solve H*x = -b

   norm_g *= cg_tol;


   this->apply_preconditioner(mZ, mR, err); // solve Mz = r (computes z = M^-1 r)

   for (i=0; i<mSize; ++i)  mP[i] = mZ[i] ; // p_1 = z_0

   rzm1 = inner(mZ,mR,mSize); // inner product r_{k-1}^T z_{k-1}


   size_t cg_iter = 0;

   while ((norm_r > norm_g) && (cg_iter < maxCGiter)) {

     ++cg_iter;


     axpy(mW, mSize, *this, mP, mSize, 0,0,err); // w = A * p_k


     alpha_ = inner(mP,mW,mSize); // alpha_ = p_k^T A p_k

     if (alpha_ <= 0.0) {

       if (1 == cg_iter) {

         for (i=0; i<mSize; ++i)  x[i] += mP[i]; // x_{k+1} = x_k + p_{k+1}

       }

       break; // Newton goes on with this direction of negative curvature

     }


     alpha = rzm1 / alpha_;


     for (i=0; i<mSize; ++i)  x[i] += alpha*mP[i]; // x_{k+1} = x_k + alpha_{k+1} p_{k+1}

     for (i=0; i<mSize; ++i)  mR[i] -= alpha*mW[i]; // r_{k+1} = r_k - alpha_{k+1} A p_{k+1}

     norm_r = length(mR, mSize);


     this->apply_preconditioner(mZ, mR, err); // solve Mz = r (computes z = M^-1 r)


     rzm2 = rzm1;

     rzm1 = inner(mZ,mR,mSize); // inner product r_{k-1}^T z_{k-1}

     beta = rzm1 / rzm2;

     for (i=0; i<mSize; ++i)  mP[i] = mZ[i] + beta*mP[i]; // p_k = z_{k-1} + Beta_k * p_{k-1}

   }

 }


 /* ------------------ I/O ----------------- */


 msq_stdio::ostream& operator<<(msq_stdio::ostream &s, const MsqHessian &h)

 {

   size_t i,j;

   s << "MsqHessian of size: " << h.mSize <<"x"<< h.mSize << "\n";

   for (i=0; i<h.mSize; ++i) {

     s << " ROW " << i << " ------------------------\n";

     for (j=h.mRowStart[i]; j<h.mRowStart[i+1]; ++j) {

       s << "   column " << h.mColIndex[j] << " ----\n";

       s << h.mEntries[j];

     }

   }

   return s;

 }


 } // namespace Mesquite


rs
subroutine rs(nm, n, a, w, matz, z, fv1, fv2, ierr)
Definition: arruda_boyce.f90:259

Mesquite::MsqHessian::origin_pd
PatchData * origin_pd
Definition: includeLinks/MsqHessian.hpp:78

Mesquite::MsqError
Used to hold the error state and return it to the application.
Definition: includeLinks/MsqError.hpp:106

Mesquite::MsqHessian::apply_preconditioner
void apply_preconditioner(Vector3D zloc[], Vector3D rloc[], MsqError &err)
Definition: includeLinks/MsqHessian.hpp:240

s
double s
Definition: blastest.C:80

Mesquite::MsqHessian::mAccumElemStart
size_t * mAccumElemStart
Starting index in mAccumulation for element i, i=1,...
Definition: includeLinks/MsqHessian.hpp:87

Mesquite::MsqHessian::~MsqHessian
~MsqHessian()
Definition: Misc/MsqHessian.cpp:70

Mesquite::Vector3D
Vector3D is the object that effeciently stores information about about three-deminsional vectors...
Definition: includeLinks/Vector3D.hpp:64

Mesquite::MsqHessian::compute_preconditioner
void compute_preconditioner(MsqError &err)
Definition: Misc/MsqHessian.cpp:358

Mesquite::MsqHessian
Vector3D is the object that effeciently stores the objective function Hessian each entry is a Matrix3...
Definition: includeLinks/MsqHessian.hpp:75

Mesquite::MsqHessian::mZ
Vector3D * mZ
array used in the CG solver
Definition: includeLinks/MsqHessian.hpp:95

Mesquite::PatchData
Definition: includeLinks/PatchData.hpp:87

Mesquite::length
double length(Vector3D *const v, int n)
Definition: includeLinks/Vector3D.hpp:400

Mesquite::MsqHessian::maxCGiter
size_t maxCGiter
max nb of iterations of the CG solver.
Definition: includeLinks/MsqHessian.hpp:99

Mesquite::MsqHessian::size
size_t size()
Definition: includeLinks/MsqHessian.hpp:107

Mesquite::MsqError::INVALID_ARG
invalid function argument passed
Definition: includeLinks/MsqError.hpp:119

Mesquite::PatchData::num_elements
size_t num_elements() const
number of elements in the Patch.
Definition: includeLinks/PatchData.hpp:179

Mesquite::MsqHessian::mSize
size_t mSize
number of rows (or number of columns, this is a square matrix).
Definition: includeLinks/MsqHessian.hpp:89

Mesquite::MsqMeshEntity::vertex_count
msq_stdc::size_t vertex_count() const
Returns the number of vertices in this element, based on its element type.
Definition: includeLinks/MsqMeshEntity.hpp:185

MSQ_CHKERR
#define MSQ_CHKERR(err)
Mesquite&#39;s Error Checking macro.
Definition: includeLinks/MsqError.hpp:62

Mesquite::Matrix3D
3*3 Matric class, row-oriented, 0-based [i][j] indexing.
Definition: includeLinks/Matrix3D.hpp:78

Mesquite::MsqHessian::cg_solver
void cg_solver(Vector3D x[], Vector3D b[], MsqError &err)
Definition: Misc/MsqHessian.cpp:440

MSQ_SETERR
#define MSQ_SETERR(err)
Macro to set error - use err.clear() to clear.
Definition: includeLinks/MsqError.hpp:83

Mesquite::MsqHessian::mR
Vector3D * mR
array used in the CG solver
Definition: includeLinks/MsqHessian.hpp:94

i
blockLoc i
Definition: read.cpp:79

x
void int int REAL * x
Definition: read.cpp:74

Mesquite::MsqHessian::axpy
friend void axpy(Vector3D res[], size_t size_r, const MsqHessian &H, const Vector3D x[], size_t size_x, const Vector3D y[], size_t size_y, MsqError &err)
Hessian - vector product, summed with a second vector (optional).
Definition: includeLinks/MsqHessian.hpp:187

MsqHessian.hpp

Mesquite::MsqHessian::mW
Vector3D * mW
array used in the CG solver
Definition: includeLinks/MsqHessian.hpp:97

Mesquite::PatchData::num_vertices
size_t num_vertices() const
number of vertices in the patch.
Definition: includeLinks/PatchData.hpp:176

Mesquite::MsqHessian::mColIndex
size_t * mColIndex
CSR block structure: column indexes of the row entries.
Definition: includeLinks/MsqHessian.hpp:84

Mesquite::MsqHessian::mEntries
Matrix3D * mEntries
CSR block entries. size: nb of nonzero blocks, i.e. mRowStart[mSize] .
Definition: includeLinks/MsqHessian.hpp:82

j
j indices j
Definition: Indexing.h:6

Mesquite::MsqMeshEntity::get_vertex_index_array
const msq_stdc::size_t * get_vertex_index_array() const
Very efficient retrieval of vertices indexes (corresponding to the PatchData vertex array)...
Definition: includeLinks/MsqMeshEntity.hpp:196

Mesquite::MsqHessian::patchElemArray
MsqMeshEntity * patchElemArray
stored once during initialization for
Definition: includeLinks/MsqHessian.hpp:79

MSQ_FUNCTION_TIMER
#define MSQ_FUNCTION_TIMER(NAME)
Definition: includeLinks/MsqTimer.hpp:216

Mesquite::MsqHessian::initialize
void initialize(PatchData &pd, MsqError &err)
creates a sparse structure for a Hessian, based on the connectivity information contained in the Patc...
Definition: Misc/MsqHessian.cpp:91

Mesquite::operator<<
msq_stdio::ostream & operator<<(msq_stdio::ostream &s, const Matrix3D &A)
Definition: includeLinks/Matrix3D.hpp:250

Mesquite::MsqHessian::MsqHessian
MsqHessian()
Definition: Misc/MsqHessian.cpp:62

Mesquite::PatchData::get_element_array
const MsqMeshEntity * get_element_array(MsqError &err) const
Returns a pointer to the start of the element array.
Definition: includeLinks/PatchData.hpp:530

Mesquite::MsqHessian::precondArraySize
size_t precondArraySize
Definition: includeLinks/MsqHessian.hpp:92

Mesquite::MsqHessian::mRowStart
size_t * mRowStart
start of each row in mEntries. size: nb of vertices (mSize).
Definition: includeLinks/MsqHessian.hpp:83

Mesquite::inner
double inner(const Vector3D lhs[], const Vector3D rhs[], int n)
Definition: includeLinks/Vector3D.hpp:340

Mesquite::MsqHessian::get_diagonal_blocks
void get_diagonal_blocks(msq_std::vector< Matrix3D > &diag, MsqError &err)
returns the diagonal blocks, memory must be allocated before call.
Definition: Misc/MsqHessian.cpp:341

Mesquite::MsqHessian::mPreconditioner
Matrix3D * mPreconditioner
Definition: includeLinks/MsqHessian.hpp:91

MsqTimer.hpp

Mesquite::MsqHessian::cgArraySizes
size_t cgArraySizes
size of arrays allocated in the CG solver.
Definition: includeLinks/MsqHessian.hpp:98

Mesquite::MsqHessian::mAccumulation
int * mAccumulation
accumulation pattern instructions
Definition: includeLinks/MsqHessian.hpp:86

Mesquite::MsqHessian::mP
Vector3D * mP
array used in the CG solver
Definition: includeLinks/MsqHessian.hpp:96