xref: /petsc/src/mat/impls/sbaij/seq/sbaijfact12.c (revision 1b3064de9470dbd60d150f19c08c02c240869b9c)
1*1b3064deSBarry Smith /*$Id: sbaijfact.c,v 1.56 2001/01/31 19:06:52 balay Exp bsmith $*/
281278733SSatish Balay #include "sbaij.h"
381278733SSatish Balay #include "src/inline/ilu.h"
481278733SSatish Balay 
581278733SSatish Balay /*
681278733SSatish Balay       Version for when blocks are 7 by 7 Using natural ordering
781278733SSatish Balay */
881278733SSatish Balay #undef __FUNC__
981278733SSatish Balay #define __FUNC__ "MatCholeskyFactorNumeric_SeqSBAIJ_7_NaturalOrdering"
1081278733SSatish Balay int MatCholeskyFactorNumeric_SeqSBAIJ_7_NaturalOrdering(Mat A,Mat *B)
1181278733SSatish Balay {
1281278733SSatish Balay   Mat                C = *B;
1381278733SSatish Balay   Mat_SeqSBAIJ       *a = (Mat_SeqSBAIJ*)A->data,*b = (Mat_SeqSBAIJ *)C->data;
1481278733SSatish Balay   int                ierr,i,j,mbs=a->mbs,*bi=b->i,*bj=b->j;
1581278733SSatish Balay   int                *ai,*aj,k,k1,jmin,jmax,*jl,*il,vj,nexti,ili;
1681278733SSatish Balay   MatScalar          *ba = b->a,*aa,*ap,*dk,*uik;
17*1b3064deSBarry Smith   MatScalar          *u,*d,*w,*wp,u0,u1,u2,u3,u4,u5,u6,u7,u8,u9,u10,u11,u12;
18*1b3064deSBarry Smith   MatScalar          u13,u14,u15,u16,u17,u18,u19,u20,u21,u22,u23,u24,u25,u26,u27;
19*1b3064deSBarry Smith   MatScalar          u28,u29,u30,u31,u32,u33,u34,u35,u36,u37,u38,u39,u40,u41;
20*1b3064deSBarry Smith   MatScalar          u42,u43,u44,u45,u46,u47,u48;
2181278733SSatish Balay 
2281278733SSatish Balay   PetscFunctionBegin;
2381278733SSatish Balay 
2481278733SSatish Balay   /* initialization */
2581278733SSatish Balay   ierr = PetscMalloc(49*mbs*sizeof(MatScalar),&w);CHKERRQ(ierr);
2681278733SSatish Balay   ierr = PetscMemzero(w,49*mbs*sizeof(MatScalar));CHKERRQ(ierr);
2781278733SSatish Balay   ierr = PetscMalloc(2*mbs*sizeof(int),&il);CHKERRQ(ierr);
2881278733SSatish Balay   jl = il + mbs;
2981278733SSatish Balay   for (i=0; i<mbs; i++) {
3081278733SSatish Balay     jl[i] = mbs; il[0] = 0;
3181278733SSatish Balay   }
3281278733SSatish Balay   ierr = PetscMalloc(98*sizeof(MatScalar),&dk);CHKERRQ(ierr);
3381278733SSatish Balay   uik   = dk + 49;
3481278733SSatish Balay 
3581278733SSatish Balay   ai = a->i; aj = a->j; aa = a->a;
3681278733SSatish Balay 
3781278733SSatish Balay   /* for each row k */
3881278733SSatish Balay   for (k = 0; k<mbs; k++){
3981278733SSatish Balay 
4081278733SSatish Balay     /*initialize k-th row with elements nonzero in row k of A */
4181278733SSatish Balay     jmin = ai[k]; jmax = ai[k+1];
4281278733SSatish Balay     if (jmin < jmax) {
4381278733SSatish Balay       ap = aa + jmin*49;
4481278733SSatish Balay       for (j = jmin; j < jmax; j++){
4581278733SSatish Balay         vj = aj[j];         /* block col. index */
4681278733SSatish Balay         wp = w + vj*49;
4781278733SSatish Balay         for (i=0; i<49; i++) *wp++ = *ap++;
4881278733SSatish Balay       }
4981278733SSatish Balay     }
5081278733SSatish Balay 
5181278733SSatish Balay     /* modify k-th row by adding in those rows i with U(i,k) != 0 */
5281278733SSatish Balay     ierr = PetscMemcpy(dk,w+k*49,49*sizeof(MatScalar));CHKERRQ(ierr);
5381278733SSatish Balay     i = jl[k]; /* first row to be added to k_th row  */
5481278733SSatish Balay 
5581278733SSatish Balay     while (i < mbs){
5681278733SSatish Balay       nexti = jl[i]; /* next row to be added to k_th row */
5781278733SSatish Balay 
5881278733SSatish Balay       /* compute multiplier */
5981278733SSatish Balay       ili = il[i];  /* index of first nonzero element in U(i,k:bms-1) */
6081278733SSatish Balay 
6181278733SSatish Balay       /* uik = -inv(Di)*U_bar(i,k) */
6281278733SSatish Balay       d = ba + i*49;
6381278733SSatish Balay       u = ba + ili*49;
6481278733SSatish Balay 
65*1b3064deSBarry Smith       u0 = u[0]; u1 = u[1]; u2 = u[2]; u3 = u[3]; u4 = u[4]; u5 = u[5]; u6 = u[6];
66*1b3064deSBarry Smith       u7 = u[7]; u8 = u[8]; u9 = u[9]; u10 = u[10]; u11 = u[11]; u12 = u[12]; u13 = u[13];
67*1b3064deSBarry Smith       u14 = u[14]; u15 = u[15]; u16 = u[16]; u17 = u[17]; u18 = u[18]; u19 = u[19]; u20 = u[20];
68*1b3064deSBarry Smith       u21 = u[21]; u22 = u[22]; u23 = u[23]; u24 = u[24]; u25 = u[25]; u26 = u[26]; u27 = u[27];
69*1b3064deSBarry Smith       u28 = u[28]; u29 = u[29]; u30 = u[30]; u31 = u[31]; u32 = u[32]; u33 = u[33]; u34 = u[34];
70*1b3064deSBarry Smith       u35 = u[35]; u36 = u[36]; u37 = u[37]; u38 = u[38]; u39 = u[39]; u40 = u[40]; u41 = u[41]; u42 = u[42];
71*1b3064deSBarry Smith       u43 = u[43]; u44 = u[44]; u45 = u[45]; u46 = u[46]; u47 = u[47]; u48 = u[48];
7281278733SSatish Balay 
73*1b3064deSBarry Smith       uik[0] = -(d[0]*u0 + d[7]*u1+ d[14]*u2+ d[21]*u3+ d[28]*u4+ d[35]*u5+ d[42]*u6);
74*1b3064deSBarry Smith       uik[1] = -(d[1]*u0 + d[8]*u1+ d[15]*u2+ d[22]*u3+ d[29]*u4+ d[36]*u5+ d[43]*u6);
75*1b3064deSBarry Smith       uik[2] = -(d[2]*u0 + d[9]*u1+ d[16]*u2+ d[23]*u3+ d[30]*u4+ d[37]*u5+ d[44]*u6);
76*1b3064deSBarry Smith       uik[3] = -(d[3]*u0+ d[10]*u1+ d[17]*u2+ d[24]*u3+ d[31]*u4+ d[38]*u5+ d[45]*u6);
77*1b3064deSBarry Smith       uik[4] = -(d[4]*u0+ d[11]*u1+ d[18]*u2+ d[25]*u3+ d[32]*u4+ d[39]*u5+ d[46]*u6);
78*1b3064deSBarry Smith       uik[5] = -(d[5]*u0+ d[12]*u1+ d[19]*u2+ d[26]*u3+ d[33]*u4+ d[40]*u5+ d[47]*u6);
79*1b3064deSBarry Smith       uik[6] = -(d[6]*u0+ d[13]*u1+ d[20]*u2+ d[27]*u3+ d[34]*u4+ d[41]*u5+ d[48]*u6);
8081278733SSatish Balay 
81*1b3064deSBarry Smith       uik[7] = -(d[0]*u7 + d[7]*u8+ d[14]*u9+ d[21]*u10+ d[28]*u11+ d[35]*u12+ d[42]*u13);
82*1b3064deSBarry Smith       uik[8] = -(d[1]*u7 + d[8]*u8+ d[15]*u9+ d[22]*u10+ d[29]*u11+ d[36]*u12+ d[43]*u13);
83*1b3064deSBarry Smith       uik[9] = -(d[2]*u7 + d[9]*u8+ d[16]*u9+ d[23]*u10+ d[30]*u11+ d[37]*u12+ d[44]*u13);
84*1b3064deSBarry Smith       uik[10]= -(d[3]*u7+ d[10]*u8+ d[17]*u9+ d[24]*u10+ d[31]*u11+ d[38]*u12+ d[45]*u13);
85*1b3064deSBarry Smith       uik[11]= -(d[4]*u7+ d[11]*u8+ d[18]*u9+ d[25]*u10+ d[32]*u11+ d[39]*u12+ d[46]*u13);
86*1b3064deSBarry Smith       uik[12]= -(d[5]*u7+ d[12]*u8+ d[19]*u9+ d[26]*u10+ d[33]*u11+ d[40]*u12+ d[47]*u13);
87*1b3064deSBarry Smith       uik[13]= -(d[6]*u7+ d[13]*u8+ d[20]*u9+ d[27]*u10+ d[34]*u11+ d[41]*u12+ d[48]*u13);
8881278733SSatish Balay 
89*1b3064deSBarry Smith       uik[14]= -(d[0]*u14 + d[7]*u15+ d[14]*u16+ d[21]*u17+ d[28]*u18+ d[35]*u19+ d[42]*u20);
90*1b3064deSBarry Smith       uik[15]= -(d[1]*u14 + d[8]*u15+ d[15]*u16+ d[22]*u17+ d[29]*u18+ d[36]*u19+ d[43]*u20);
91*1b3064deSBarry Smith       uik[16]= -(d[2]*u14 + d[9]*u15+ d[16]*u16+ d[23]*u17+ d[30]*u18+ d[37]*u19+ d[44]*u20);
92*1b3064deSBarry Smith       uik[17]= -(d[3]*u14+ d[10]*u15+ d[17]*u16+ d[24]*u17+ d[31]*u18+ d[38]*u19+ d[45]*u20);
93*1b3064deSBarry Smith       uik[18]= -(d[4]*u14+ d[11]*u15+ d[18]*u16+ d[25]*u17+ d[32]*u18+ d[39]*u19+ d[46]*u20);
94*1b3064deSBarry Smith       uik[19]= -(d[5]*u14+ d[12]*u15+ d[19]*u16+ d[26]*u17+ d[33]*u18+ d[40]*u19+ d[47]*u20);
95*1b3064deSBarry Smith       uik[20]= -(d[6]*u14+ d[13]*u15+ d[20]*u16+ d[27]*u17+ d[34]*u18+ d[41]*u19+ d[48]*u20);
9681278733SSatish Balay 
97*1b3064deSBarry Smith       uik[21]= -(d[0]*u21 + d[7]*u22+ d[14]*u23+ d[21]*u24+ d[28]*u25+ d[35]*u26+ d[42]*u27);
98*1b3064deSBarry Smith       uik[22]= -(d[1]*u21 + d[8]*u22+ d[15]*u23+ d[22]*u24+ d[29]*u25+ d[36]*u26+ d[43]*u27);
99*1b3064deSBarry Smith       uik[23]= -(d[2]*u21 + d[9]*u22+ d[16]*u23+ d[23]*u24+ d[30]*u25+ d[37]*u26+ d[44]*u27);
100*1b3064deSBarry Smith       uik[24]= -(d[3]*u21+ d[10]*u22+ d[17]*u23+ d[24]*u24+ d[31]*u25+ d[38]*u26+ d[45]*u27);
101*1b3064deSBarry Smith       uik[25]= -(d[4]*u21+ d[11]*u22+ d[18]*u23+ d[25]*u24+ d[32]*u25+ d[39]*u26+ d[46]*u27);
102*1b3064deSBarry Smith       uik[26]= -(d[5]*u21+ d[12]*u22+ d[19]*u23+ d[26]*u24+ d[33]*u25+ d[40]*u26+ d[47]*u27);
103*1b3064deSBarry Smith       uik[27]= -(d[6]*u21+ d[13]*u22+ d[20]*u23+ d[27]*u24+ d[34]*u25+ d[41]*u26+ d[48]*u27);
10481278733SSatish Balay 
105*1b3064deSBarry Smith       uik[28]= -(d[0]*u28 + d[7]*u29+ d[14]*u30+ d[21]*u31+ d[28]*u32+ d[35]*u33+ d[42]*u34);
106*1b3064deSBarry Smith       uik[29]= -(d[1]*u28 + d[8]*u29+ d[15]*u30+ d[22]*u31+ d[29]*u32+ d[36]*u33+ d[43]*u34);
107*1b3064deSBarry Smith       uik[30]= -(d[2]*u28 + d[9]*u29+ d[16]*u30+ d[23]*u31+ d[30]*u32+ d[37]*u33+ d[44]*u34);
108*1b3064deSBarry Smith       uik[31]= -(d[3]*u28+ d[10]*u29+ d[17]*u30+ d[24]*u31+ d[31]*u32+ d[38]*u33+ d[45]*u34);
109*1b3064deSBarry Smith       uik[32]= -(d[4]*u28+ d[11]*u29+ d[18]*u30+ d[25]*u31+ d[32]*u32+ d[39]*u33+ d[46]*u34);
110*1b3064deSBarry Smith       uik[33]= -(d[5]*u28+ d[12]*u29+ d[19]*u30+ d[26]*u31+ d[33]*u32+ d[40]*u33+ d[47]*u34);
111*1b3064deSBarry Smith       uik[34]= -(d[6]*u28+ d[13]*u29+ d[20]*u30+ d[27]*u31+ d[34]*u32+ d[41]*u33+ d[48]*u34);
11281278733SSatish Balay 
113*1b3064deSBarry Smith       uik[35]= -(d[0]*u35 + d[7]*u36+ d[14]*u37+ d[21]*u38+ d[28]*u39+ d[35]*u40+ d[42]*u41);
114*1b3064deSBarry Smith       uik[36]= -(d[1]*u35 + d[8]*u36+ d[15]*u37+ d[22]*u38+ d[29]*u39+ d[36]*u40+ d[43]*u41);
115*1b3064deSBarry Smith       uik[37]= -(d[2]*u35 + d[9]*u36+ d[16]*u37+ d[23]*u38+ d[30]*u39+ d[37]*u40+ d[44]*u41);
116*1b3064deSBarry Smith       uik[38]= -(d[3]*u35+ d[10]*u36+ d[17]*u37+ d[24]*u38+ d[31]*u39+ d[38]*u40+ d[45]*u41);
117*1b3064deSBarry Smith       uik[39]= -(d[4]*u35+ d[11]*u36+ d[18]*u37+ d[25]*u38+ d[32]*u39+ d[39]*u40+ d[46]*u41);
118*1b3064deSBarry Smith       uik[40]= -(d[5]*u35+ d[12]*u36+ d[19]*u37+ d[26]*u38+ d[33]*u39+ d[40]*u40+ d[47]*u41);
119*1b3064deSBarry Smith       uik[41]= -(d[6]*u35+ d[13]*u36+ d[20]*u37+ d[27]*u38+ d[34]*u39+ d[41]*u40+ d[48]*u41);
120*1b3064deSBarry Smith 
121*1b3064deSBarry Smith       uik[42]= -(d[0]*u42 + d[7]*u43+ d[14]*u44+ d[21]*u45+ d[28]*u46+ d[35]*u47+ d[42]*u48);
122*1b3064deSBarry Smith       uik[43]= -(d[1]*u42 + d[8]*u43+ d[15]*u44+ d[22]*u45+ d[29]*u46+ d[36]*u47+ d[43]*u48);
123*1b3064deSBarry Smith       uik[44]= -(d[2]*u42 + d[9]*u43+ d[16]*u44+ d[23]*u45+ d[30]*u46+ d[37]*u47+ d[44]*u48);
124*1b3064deSBarry Smith       uik[45]= -(d[3]*u42+ d[10]*u43+ d[17]*u44+ d[24]*u45+ d[31]*u46+ d[38]*u47+ d[45]*u48);
125*1b3064deSBarry Smith       uik[46]= -(d[4]*u42+ d[11]*u43+ d[18]*u44+ d[25]*u45+ d[32]*u46+ d[39]*u47+ d[46]*u48);
126*1b3064deSBarry Smith       uik[47]= -(d[5]*u42+ d[12]*u43+ d[19]*u44+ d[26]*u45+ d[33]*u46+ d[40]*u47+ d[47]*u48);
127*1b3064deSBarry Smith       uik[48]= -(d[6]*u42+ d[13]*u43+ d[20]*u44+ d[27]*u45+ d[34]*u46+ d[41]*u47+ d[48]*u48);
12881278733SSatish Balay 
12981278733SSatish Balay       /* update D(k) += -U(i,k)^T * U_bar(i,k) */
130*1b3064deSBarry Smith       dk[0]+=  uik[0]*u0 + uik[1]*u1 + uik[2]*u2 + uik[3]*u3 + uik[4]*u4 + uik[5]*u5 + uik[6]*u6;
131*1b3064deSBarry Smith       dk[1]+=  uik[7]*u0 + uik[8]*u1 + uik[9]*u2+ uik[10]*u3+ uik[11]*u4+ uik[12]*u5+ uik[13]*u6;
132*1b3064deSBarry Smith       dk[2]+= uik[14]*u0+ uik[15]*u1+ uik[16]*u2+ uik[17]*u3+ uik[18]*u4+ uik[19]*u5+ uik[20]*u6;
133*1b3064deSBarry Smith       dk[3]+= uik[21]*u0+ uik[22]*u1+ uik[23]*u2+ uik[24]*u3+ uik[25]*u4+ uik[26]*u5+ uik[27]*u6;
134*1b3064deSBarry Smith       dk[4]+= uik[28]*u0+ uik[29]*u1+ uik[30]*u2+ uik[31]*u3+ uik[32]*u4+ uik[33]*u5+ uik[34]*u6;
135*1b3064deSBarry Smith       dk[5]+= uik[35]*u0+ uik[36]*u1+ uik[37]*u2+ uik[38]*u3+ uik[39]*u4+ uik[40]*u5+ uik[41]*u6;
136*1b3064deSBarry Smith       dk[6]+= uik[42]*u0+ uik[43]*u1+ uik[44]*u2+ uik[45]*u3+ uik[46]*u4+ uik[47]*u5+ uik[48]*u6;
13781278733SSatish Balay 
138*1b3064deSBarry Smith       dk[7]+=  uik[0]*u7 + uik[1]*u8 + uik[2]*u9 + uik[3]*u10 + uik[4]*u11 + uik[5]*u12 + uik[6]*u13;
139*1b3064deSBarry Smith       dk[8]+=  uik[7]*u7 + uik[8]*u8 + uik[9]*u9+ uik[10]*u10+ uik[11]*u11+ uik[12]*u12+ uik[13]*u13;
140*1b3064deSBarry Smith       dk[9]+= uik[14]*u7+ uik[15]*u8+ uik[16]*u9+ uik[17]*u10+ uik[18]*u11+ uik[19]*u12+ uik[20]*u13;
141*1b3064deSBarry Smith       dk[10]+=uik[21]*u7+ uik[22]*u8+ uik[23]*u9+ uik[24]*u10+ uik[25]*u11+ uik[26]*u12+ uik[27]*u13;
142*1b3064deSBarry Smith       dk[11]+=uik[28]*u7+ uik[29]*u8+ uik[30]*u9+ uik[31]*u10+ uik[32]*u11+ uik[33]*u12+ uik[34]*u13;
143*1b3064deSBarry Smith       dk[12]+=uik[35]*u7+ uik[36]*u8+ uik[37]*u9+ uik[38]*u10+ uik[39]*u11+ uik[40]*u12+ uik[41]*u13;
144*1b3064deSBarry Smith       dk[13]+=uik[42]*u7+ uik[43]*u8+ uik[44]*u9+ uik[45]*u10+ uik[46]*u11+ uik[47]*u12+ uik[48]*u13;
14581278733SSatish Balay 
146*1b3064deSBarry Smith       dk[14]+=  uik[0]*u14 + uik[1]*u15 + uik[2]*u16 + uik[3]*u17 + uik[4]*u18 + uik[5]*u19 + uik[6]*u20;
147*1b3064deSBarry Smith       dk[15]+=  uik[7]*u14 + uik[8]*u15 + uik[9]*u16+ uik[10]*u17+ uik[11]*u18+ uik[12]*u19+ uik[13]*u20;
148*1b3064deSBarry Smith       dk[16]+= uik[14]*u14+ uik[15]*u15+ uik[16]*u16+ uik[17]*u17+ uik[18]*u18+ uik[19]*u19+ uik[20]*u20;
149*1b3064deSBarry Smith       dk[17]+= uik[21]*u14+ uik[22]*u15+ uik[23]*u16+ uik[24]*u17+ uik[25]*u18+ uik[26]*u19+ uik[27]*u20;
150*1b3064deSBarry Smith       dk[18]+= uik[28]*u14+ uik[29]*u15+ uik[30]*u16+ uik[31]*u17+ uik[32]*u18+ uik[33]*u19+ uik[34]*u20;
151*1b3064deSBarry Smith       dk[19]+= uik[35]*u14+ uik[36]*u15+ uik[37]*u16+ uik[38]*u17+ uik[39]*u18+ uik[40]*u19+ uik[41]*u20;
152*1b3064deSBarry Smith       dk[20]+= uik[42]*u14+ uik[43]*u15+ uik[44]*u16+ uik[45]*u17+ uik[46]*u18+ uik[47]*u19+ uik[48]*u20;
15381278733SSatish Balay 
154*1b3064deSBarry Smith       dk[21]+=  uik[0]*u21 + uik[1]*u22 + uik[2]*u23 + uik[3]*u24 + uik[4]*u25 + uik[5]*u26 + uik[6]*u27;
155*1b3064deSBarry Smith       dk[22]+=  uik[7]*u21 + uik[8]*u22 + uik[9]*u23+ uik[10]*u24+ uik[11]*u25+ uik[12]*u26+ uik[13]*u27;
156*1b3064deSBarry Smith       dk[23]+= uik[14]*u21+ uik[15]*u22+ uik[16]*u23+ uik[17]*u24+ uik[18]*u25+ uik[19]*u26+ uik[20]*u27;
157*1b3064deSBarry Smith       dk[24]+= uik[21]*u21+ uik[22]*u22+ uik[23]*u23+ uik[24]*u24+ uik[25]*u25+ uik[26]*u26+ uik[27]*u27;
158*1b3064deSBarry Smith       dk[25]+= uik[28]*u21+ uik[29]*u22+ uik[30]*u23+ uik[31]*u24+ uik[32]*u25+ uik[33]*u26+ uik[34]*u27;
159*1b3064deSBarry Smith       dk[26]+= uik[35]*u21+ uik[36]*u22+ uik[37]*u23+ uik[38]*u24+ uik[39]*u25+ uik[40]*u26+ uik[41]*u27;
160*1b3064deSBarry Smith       dk[27]+= uik[42]*u21+ uik[43]*u22+ uik[44]*u23+ uik[45]*u24+ uik[46]*u25+ uik[47]*u26+ uik[48]*u27;
16181278733SSatish Balay 
162*1b3064deSBarry Smith       dk[28]+=  uik[0]*u28 + uik[1]*u29 + uik[2]*u30 + uik[3]*u31 + uik[4]*u32 + uik[5]*u33 + uik[6]*u34;
163*1b3064deSBarry Smith       dk[29]+=  uik[7]*u28 + uik[8]*u29 + uik[9]*u30+ uik[10]*u31+ uik[11]*u32+ uik[12]*u33+ uik[13]*u34;
164*1b3064deSBarry Smith       dk[30]+= uik[14]*u28+ uik[15]*u29+ uik[16]*u30+ uik[17]*u31+ uik[18]*u32+ uik[19]*u33+ uik[20]*u34;
165*1b3064deSBarry Smith       dk[31]+= uik[21]*u28+ uik[22]*u29+ uik[23]*u30+ uik[24]*u31+ uik[25]*u32+ uik[26]*u33+ uik[27]*u34;
166*1b3064deSBarry Smith       dk[32]+= uik[28]*u28+ uik[29]*u29+ uik[30]*u30+ uik[31]*u31+ uik[32]*u32+ uik[33]*u33+ uik[34]*u34;
167*1b3064deSBarry Smith       dk[33]+= uik[35]*u28+ uik[36]*u29+ uik[37]*u30+ uik[38]*u31+ uik[39]*u32+ uik[40]*u33+ uik[41]*u34;
168*1b3064deSBarry Smith       dk[34]+= uik[42]*u28+ uik[43]*u29+ uik[44]*u30+ uik[45]*u31+ uik[46]*u32+ uik[47]*u33+ uik[48]*u34;
16981278733SSatish Balay 
170*1b3064deSBarry Smith       dk[35]+=  uik[0]*u35 + uik[1]*u36 + uik[2]*u37 + uik[3]*u38 + uik[4]*u39 + uik[5]*u40 + uik[6]*u41;
171*1b3064deSBarry Smith       dk[36]+=  uik[7]*u35 + uik[8]*u36 + uik[9]*u37+ uik[10]*u38+ uik[11]*u39+ uik[12]*u40+ uik[13]*u41;
172*1b3064deSBarry Smith       dk[37]+= uik[14]*u35+ uik[15]*u36+ uik[16]*u37+ uik[17]*u38+ uik[18]*u39+ uik[19]*u40+ uik[20]*u41;
173*1b3064deSBarry Smith       dk[38]+= uik[21]*u35+ uik[22]*u36+ uik[23]*u37+ uik[24]*u38+ uik[25]*u39+ uik[26]*u40+ uik[27]*u41;
174*1b3064deSBarry Smith       dk[39]+= uik[28]*u35+ uik[29]*u36+ uik[30]*u37+ uik[31]*u38+ uik[32]*u39+ uik[33]*u40+ uik[34]*u41;
175*1b3064deSBarry Smith       dk[40]+= uik[35]*u35+ uik[36]*u36+ uik[37]*u37+ uik[38]*u38+ uik[39]*u39+ uik[40]*u40+ uik[41]*u41;
176*1b3064deSBarry Smith       dk[41]+= uik[42]*u35+ uik[43]*u36+ uik[44]*u37+ uik[45]*u38+ uik[46]*u39+ uik[47]*u40+ uik[48]*u41;
17781278733SSatish Balay 
178*1b3064deSBarry Smith       dk[42]+=  uik[0]*u42 + uik[1]*u43 + uik[2]*u44 + uik[3]*u45 + uik[4]*u46 + uik[5]*u47 + uik[6]*u48;
179*1b3064deSBarry Smith       dk[43]+=  uik[7]*u42 + uik[8]*u43 + uik[9]*u44+ uik[10]*u45+ uik[11]*u46+ uik[12]*u47+ uik[13]*u48;
180*1b3064deSBarry Smith       dk[44]+= uik[14]*u42+ uik[15]*u43+ uik[16]*u44+ uik[17]*u45+ uik[18]*u46+ uik[19]*u47+ uik[20]*u48;
181*1b3064deSBarry Smith       dk[45]+= uik[21]*u42+ uik[22]*u43+ uik[23]*u44+ uik[24]*u45+ uik[25]*u46+ uik[26]*u47+ uik[27]*u48;
182*1b3064deSBarry Smith       dk[46]+= uik[28]*u42+ uik[29]*u43+ uik[30]*u44+ uik[31]*u45+ uik[32]*u46+ uik[33]*u47+ uik[34]*u48;
183*1b3064deSBarry Smith       dk[47]+= uik[35]*u42+ uik[36]*u43+ uik[37]*u44+ uik[38]*u45+ uik[39]*u46+ uik[40]*u47+ uik[41]*u48;
184*1b3064deSBarry Smith       dk[48]+= uik[42]*u42+ uik[43]*u43+ uik[44]*u44+ uik[45]*u45+ uik[46]*u46+ uik[47]*u47+ uik[48]*u48;
18581278733SSatish Balay 
18681278733SSatish Balay       /* update -U(i,k) */
18781278733SSatish Balay       ierr = PetscMemcpy(ba+ili*49,uik,49*sizeof(MatScalar));CHKERRQ(ierr);
18881278733SSatish Balay 
18981278733SSatish Balay       /* add multiple of row i to k-th row ... */
19081278733SSatish Balay       jmin = ili + 1; jmax = bi[i+1];
19181278733SSatish Balay       if (jmin < jmax){
19281278733SSatish Balay         for (j=jmin; j<jmax; j++) {
19381278733SSatish Balay           /* w += -U(i,k)^T * U_bar(i,j) */
19481278733SSatish Balay           wp = w + bj[j]*49;
19581278733SSatish Balay           u  = ba + j*49;
19681278733SSatish Balay 
197*1b3064deSBarry Smith 	  u0 = u[0]; u1 = u[1]; u2 = u[2]; u3 = u[3]; u4 = u[4]; u5 = u[5]; u6 = u[6];
198*1b3064deSBarry Smith 	  u7 = u[7]; u8 = u[8]; u9 = u[9]; u10 = u[10]; u11 = u[11]; u12 = u[12]; u13 = u[13];
199*1b3064deSBarry Smith 	  u14 = u[14]; u15 = u[15]; u16 = u[16]; u17 = u[17]; u18 = u[18]; u19 = u[19]; u20 = u[20];
200*1b3064deSBarry Smith 	  u21 = u[21]; u22 = u[22]; u23 = u[23]; u24 = u[24]; u25 = u[25]; u26 = u[26]; u27 = u[27];
201*1b3064deSBarry Smith 	  u28 = u[28]; u29 = u[29]; u30 = u[30]; u31 = u[31]; u32 = u[32]; u33 = u[33]; u34 = u[34];
202*1b3064deSBarry Smith 	  u35 = u[35]; u36 = u[36]; u37 = u[37]; u38 = u[38]; u39 = u[39]; u40 = u[40]; u41 = u[41]; u42 = u[42];
203*1b3064deSBarry Smith 	  u43 = u[43]; u44 = u[44]; u45 = u[45]; u46 = u[46]; u47 = u[47]; u48 = u[48];
20481278733SSatish Balay 
205*1b3064deSBarry Smith           wp[0]+=  uik[0]*u0 + uik[1]*u1 + uik[2]*u2 + uik[3]*u3 + uik[4]*u4 + uik[5]*u5 + uik[6]*u6;
206*1b3064deSBarry Smith           wp[1]+=  uik[7]*u0 + uik[8]*u1 + uik[9]*u2+ uik[10]*u3+ uik[11]*u4+ uik[12]*u5+ uik[13]*u6;
207*1b3064deSBarry Smith           wp[2]+= uik[14]*u0+ uik[15]*u1+ uik[16]*u2+ uik[17]*u3+ uik[18]*u4+ uik[19]*u5+ uik[20]*u6;
208*1b3064deSBarry Smith           wp[3]+= uik[21]*u0+ uik[22]*u1+ uik[23]*u2+ uik[24]*u3+ uik[25]*u4+ uik[26]*u5+ uik[27]*u6;
209*1b3064deSBarry Smith           wp[4]+= uik[28]*u0+ uik[29]*u1+ uik[30]*u2+ uik[31]*u3+ uik[32]*u4+ uik[33]*u5+ uik[34]*u6;
210*1b3064deSBarry Smith           wp[5]+= uik[35]*u0+ uik[36]*u1+ uik[37]*u2+ uik[38]*u3+ uik[39]*u4+ uik[40]*u5+ uik[41]*u6;
211*1b3064deSBarry Smith           wp[6]+= uik[42]*u0+ uik[43]*u1+ uik[44]*u2+ uik[45]*u3+ uik[46]*u4+ uik[47]*u5+ uik[48]*u6;
21281278733SSatish Balay 
213*1b3064deSBarry Smith           wp[7]+=  uik[0]*u7 + uik[1]*u8 + uik[2]*u9 + uik[3]*u10 + uik[4]*u11 + uik[5]*u12 + uik[6]*u13;
214*1b3064deSBarry Smith           wp[8]+=  uik[7]*u7 + uik[8]*u8 + uik[9]*u9+ uik[10]*u10+ uik[11]*u11+ uik[12]*u12+ uik[13]*u13;
215*1b3064deSBarry Smith           wp[9]+= uik[14]*u7+ uik[15]*u8+ uik[16]*u9+ uik[17]*u10+ uik[18]*u11+ uik[19]*u12+ uik[20]*u13;
216*1b3064deSBarry Smith           wp[10]+=uik[21]*u7+ uik[22]*u8+ uik[23]*u9+ uik[24]*u10+ uik[25]*u11+ uik[26]*u12+ uik[27]*u13;
217*1b3064deSBarry Smith           wp[11]+=uik[28]*u7+ uik[29]*u8+ uik[30]*u9+ uik[31]*u10+ uik[32]*u11+ uik[33]*u12+ uik[34]*u13;
218*1b3064deSBarry Smith           wp[12]+=uik[35]*u7+ uik[36]*u8+ uik[37]*u9+ uik[38]*u10+ uik[39]*u11+ uik[40]*u12+ uik[41]*u13;
219*1b3064deSBarry Smith           wp[13]+=uik[42]*u7+ uik[43]*u8+ uik[44]*u9+ uik[45]*u10+ uik[46]*u11+ uik[47]*u12+ uik[48]*u13;
22081278733SSatish Balay 
221*1b3064deSBarry Smith           wp[14]+=  uik[0]*u14 + uik[1]*u15 + uik[2]*u16 + uik[3]*u17 + uik[4]*u18 + uik[5]*u19 + uik[6]*u20;
222*1b3064deSBarry Smith           wp[15]+=  uik[7]*u14 + uik[8]*u15 + uik[9]*u16+ uik[10]*u17+ uik[11]*u18+ uik[12]*u19+ uik[13]*u20;
223*1b3064deSBarry Smith           wp[16]+= uik[14]*u14+ uik[15]*u15+ uik[16]*u16+ uik[17]*u17+ uik[18]*u18+ uik[19]*u19+ uik[20]*u20;
224*1b3064deSBarry Smith           wp[17]+= uik[21]*u14+ uik[22]*u15+ uik[23]*u16+ uik[24]*u17+ uik[25]*u18+ uik[26]*u19+ uik[27]*u20;
225*1b3064deSBarry Smith           wp[18]+= uik[28]*u14+ uik[29]*u15+ uik[30]*u16+ uik[31]*u17+ uik[32]*u18+ uik[33]*u19+ uik[34]*u20;
226*1b3064deSBarry Smith           wp[19]+= uik[35]*u14+ uik[36]*u15+ uik[37]*u16+ uik[38]*u17+ uik[39]*u18+ uik[40]*u19+ uik[41]*u20;
227*1b3064deSBarry Smith           wp[20]+= uik[42]*u14+ uik[43]*u15+ uik[44]*u16+ uik[45]*u17+ uik[46]*u18+ uik[47]*u19+ uik[48]*u20;
22881278733SSatish Balay 
229*1b3064deSBarry Smith           wp[21]+=  uik[0]*u21 + uik[1]*u22 + uik[2]*u23 + uik[3]*u24 + uik[4]*u25 + uik[5]*u26 + uik[6]*u27;
230*1b3064deSBarry Smith           wp[22]+=  uik[7]*u21 + uik[8]*u22 + uik[9]*u23+ uik[10]*u24+ uik[11]*u25+ uik[12]*u26+ uik[13]*u27;
231*1b3064deSBarry Smith           wp[23]+= uik[14]*u21+ uik[15]*u22+ uik[16]*u23+ uik[17]*u24+ uik[18]*u25+ uik[19]*u26+ uik[20]*u27;
232*1b3064deSBarry Smith           wp[24]+= uik[21]*u21+ uik[22]*u22+ uik[23]*u23+ uik[24]*u24+ uik[25]*u25+ uik[26]*u26+ uik[27]*u27;
233*1b3064deSBarry Smith           wp[25]+= uik[28]*u21+ uik[29]*u22+ uik[30]*u23+ uik[31]*u24+ uik[32]*u25+ uik[33]*u26+ uik[34]*u27;
234*1b3064deSBarry Smith           wp[26]+= uik[35]*u21+ uik[36]*u22+ uik[37]*u23+ uik[38]*u24+ uik[39]*u25+ uik[40]*u26+ uik[41]*u27;
235*1b3064deSBarry Smith           wp[27]+= uik[42]*u21+ uik[43]*u22+ uik[44]*u23+ uik[45]*u24+ uik[46]*u25+ uik[47]*u26+ uik[48]*u27;
23681278733SSatish Balay 
237*1b3064deSBarry Smith           wp[28]+=  uik[0]*u28 + uik[1]*u29 + uik[2]*u30 + uik[3]*u31 + uik[4]*u32 + uik[5]*u33 + uik[6]*u34;
238*1b3064deSBarry Smith           wp[29]+=  uik[7]*u28 + uik[8]*u29 + uik[9]*u30+ uik[10]*u31+ uik[11]*u32+ uik[12]*u33+ uik[13]*u34;
239*1b3064deSBarry Smith           wp[30]+= uik[14]*u28+ uik[15]*u29+ uik[16]*u30+ uik[17]*u31+ uik[18]*u32+ uik[19]*u33+ uik[20]*u34;
240*1b3064deSBarry Smith           wp[31]+= uik[21]*u28+ uik[22]*u29+ uik[23]*u30+ uik[24]*u31+ uik[25]*u32+ uik[26]*u33+ uik[27]*u34;
241*1b3064deSBarry Smith           wp[32]+= uik[28]*u28+ uik[29]*u29+ uik[30]*u30+ uik[31]*u31+ uik[32]*u32+ uik[33]*u33+ uik[34]*u34;
242*1b3064deSBarry Smith           wp[33]+= uik[35]*u28+ uik[36]*u29+ uik[37]*u30+ uik[38]*u31+ uik[39]*u32+ uik[40]*u33+ uik[41]*u34;
243*1b3064deSBarry Smith           wp[34]+= uik[42]*u28+ uik[43]*u29+ uik[44]*u30+ uik[45]*u31+ uik[46]*u32+ uik[47]*u33+ uik[48]*u34;
24481278733SSatish Balay 
245*1b3064deSBarry Smith           wp[35]+=  uik[0]*u35 + uik[1]*u36 + uik[2]*u37 + uik[3]*u38 + uik[4]*u39 + uik[5]*u40 + uik[6]*u41;
246*1b3064deSBarry Smith           wp[36]+=  uik[7]*u35 + uik[8]*u36 + uik[9]*u37+ uik[10]*u38+ uik[11]*u39+ uik[12]*u40+ uik[13]*u41;
247*1b3064deSBarry Smith           wp[37]+= uik[14]*u35+ uik[15]*u36+ uik[16]*u37+ uik[17]*u38+ uik[18]*u39+ uik[19]*u40+ uik[20]*u41;
248*1b3064deSBarry Smith           wp[38]+= uik[21]*u35+ uik[22]*u36+ uik[23]*u37+ uik[24]*u38+ uik[25]*u39+ uik[26]*u40+ uik[27]*u41;
249*1b3064deSBarry Smith           wp[39]+= uik[28]*u35+ uik[29]*u36+ uik[30]*u37+ uik[31]*u38+ uik[32]*u39+ uik[33]*u40+ uik[34]*u41;
250*1b3064deSBarry Smith           wp[40]+= uik[35]*u35+ uik[36]*u36+ uik[37]*u37+ uik[38]*u38+ uik[39]*u39+ uik[40]*u40+ uik[41]*u41;
251*1b3064deSBarry Smith           wp[41]+= uik[42]*u35+ uik[43]*u36+ uik[44]*u37+ uik[45]*u38+ uik[46]*u39+ uik[47]*u40+ uik[48]*u41;
252*1b3064deSBarry Smith 
253*1b3064deSBarry Smith           wp[42]+=  uik[0]*u42 + uik[1]*u43 + uik[2]*u44 + uik[3]*u45 + uik[4]*u46 + uik[5]*u47 + uik[6]*u48;
254*1b3064deSBarry Smith           wp[43]+=  uik[7]*u42 + uik[8]*u43 + uik[9]*u44+ uik[10]*u45+ uik[11]*u46+ uik[12]*u47+ uik[13]*u48;
255*1b3064deSBarry Smith           wp[44]+= uik[14]*u42+ uik[15]*u43+ uik[16]*u44+ uik[17]*u45+ uik[18]*u46+ uik[19]*u47+ uik[20]*u48;
256*1b3064deSBarry Smith           wp[45]+= uik[21]*u42+ uik[22]*u43+ uik[23]*u44+ uik[24]*u45+ uik[25]*u46+ uik[26]*u47+ uik[27]*u48;
257*1b3064deSBarry Smith           wp[46]+= uik[28]*u42+ uik[29]*u43+ uik[30]*u44+ uik[31]*u45+ uik[32]*u46+ uik[33]*u47+ uik[34]*u48;
258*1b3064deSBarry Smith           wp[47]+= uik[35]*u42+ uik[36]*u43+ uik[37]*u44+ uik[38]*u45+ uik[39]*u46+ uik[40]*u47+ uik[41]*u48;
259*1b3064deSBarry Smith           wp[48]+= uik[42]*u42+ uik[43]*u43+ uik[44]*u44+ uik[45]*u45+ uik[46]*u46+ uik[47]*u47+ uik[48]*u48;
26081278733SSatish Balay         }
26181278733SSatish Balay 
26281278733SSatish Balay         /* ... add i to row list for next nonzero entry */
26381278733SSatish Balay         il[i] = jmin;             /* update il(i) in column k+1, ... mbs-1 */
26481278733SSatish Balay         j     = bj[jmin];
26581278733SSatish Balay         jl[i] = jl[j]; jl[j] = i; /* update jl */
26681278733SSatish Balay       }
26781278733SSatish Balay       i = nexti;
26881278733SSatish Balay     }
26981278733SSatish Balay 
27081278733SSatish Balay     /* save nonzero entries in k-th row of U ... */
27181278733SSatish Balay 
27281278733SSatish Balay     /* invert diagonal block */
27381278733SSatish Balay     d = ba+k*49;
27481278733SSatish Balay     ierr = PetscMemcpy(d,dk,49*sizeof(MatScalar));CHKERRQ(ierr);
27581278733SSatish Balay     ierr = Kernel_A_gets_inverse_A_7(d);CHKERRQ(ierr);
27681278733SSatish Balay 
27781278733SSatish Balay     jmin = bi[k]; jmax = bi[k+1];
27881278733SSatish Balay     if (jmin < jmax) {
27981278733SSatish Balay       for (j=jmin; j<jmax; j++){
28081278733SSatish Balay          vj = bj[j];           /* block col. index of U */
28181278733SSatish Balay          u   = ba + j*49;
28281278733SSatish Balay          wp = w + vj*49;
28381278733SSatish Balay          for (k1=0; k1<49; k1++){
28481278733SSatish Balay            *u++        = *wp;
28581278733SSatish Balay            *wp++ = 0.0;
28681278733SSatish Balay          }
28781278733SSatish Balay       }
28881278733SSatish Balay 
28981278733SSatish Balay       /* ... add k to row list for first nonzero entry in k-th row */
29081278733SSatish Balay       il[k] = jmin;
29181278733SSatish Balay       i     = bj[jmin];
29281278733SSatish Balay       jl[k] = jl[i]; jl[i] = k;
29381278733SSatish Balay     }
29481278733SSatish Balay   }
29581278733SSatish Balay 
29681278733SSatish Balay   ierr = PetscFree(w);CHKERRQ(ierr);
29781278733SSatish Balay   ierr = PetscFree(il);CHKERRQ(ierr);
29881278733SSatish Balay   ierr = PetscFree(dk);CHKERRQ(ierr);
29981278733SSatish Balay 
30081278733SSatish Balay   C->factor    = FACTOR_CHOLESKY;
30181278733SSatish Balay   C->assembled = PETSC_TRUE;
30281278733SSatish Balay   C->preallocated = PETSC_TRUE;
30381278733SSatish Balay   PetscLogFlops(1.3333*343*b->mbs); /* from inverting diagonal blocks */
30481278733SSatish Balay   PetscFunctionReturn(0);
30527e0cc20SSatish Balay }
306