fasp/ItrSmootherCSRpoly_8c_source.html

#include <math.h>

#include <time.h>

#include <float.h>

#include <limits.h>


#ifdef _OPENMP

#include <omp.h>

#endif


#include "fasp.h"

#include "fasp_functs.h"


/*---------------------------------*/

/*--  Declare Private Functions  --*/

/*---------------------------------*/


static void bminax (REAL *,INT *,INT *, REAL *, REAL *,INT *, REAL *);

static void Diaginv (dCSRmat *, REAL *);

static REAL DinvAnorminf (dCSRmat *, REAL *);

static void Diagx (REAL *, INT, REAL *, REAL *);

static void Rr (dCSRmat *, REAL *, REAL *, REAL *, REAL *, REAL *, REAL *, REAL *, INT);

static void fasp_aux_uuplv0_ (REAL *, REAL *, INT *);

static void fasp_aux_norm1_ (INT *, INT *, REAL *, INT *, REAL *);


/*---------------------------------*/

/*--      Public Function        --*/

/*---------------------------------*/


void fasp_smoother_dcsr_poly (dCSRmat *Amat,

                              dvector *brhs,

                              dvector *usol,

                              INT      n,

                              INT      ndeg,

                              INT      L)

{

    // local variables

    INT i;

    REAL *b = brhs->val, *u = usol->val;

    REAL *Dinv = NULL, *r = NULL, *rbar = NULL, *v0 = NULL, *v1 = NULL;

    REAL *error = NULL, *k = NULL;

    REAL mu0, mu1, smu0, smu1;


    /* allocate memory */

    Dinv  = (REAL *) fasp_mem_calloc(n,sizeof(REAL));

    r     = (REAL *) fasp_mem_calloc(n,sizeof(REAL));

    rbar  = (REAL *) fasp_mem_calloc(n,sizeof(REAL));

    v0    = (REAL *) fasp_mem_calloc(n,sizeof(REAL));

    v1    = (REAL *) fasp_mem_calloc(n,sizeof(REAL));

    error = (REAL *) fasp_mem_calloc(n,sizeof(REAL));

    k     = (REAL *) fasp_mem_calloc(6,sizeof(REAL)); // coefficients for calculation


    // get the inverse of the diagonal of A

    Diaginv(Amat, Dinv);


    // set up parameter

    mu0 = DinvAnorminf(Amat, Dinv); // get the inf norm of Dinv*A;


    mu0 = 1.0/mu0; mu1 = 4.0*mu0; // default set 8;

    smu0 =  sqrt(mu0); smu1 = sqrt(mu1);


    k[1] = (mu0+mu1)/2.0;

    k[2] = (smu0 + smu1)*(smu0 + smu1)/2.0;

    k[3] = mu0 * mu1;


    // 4.0*mu0*mu1/(sqrt(mu0)+sqrt(mu1))/(sqrt(mu0)+sqrt(mu1));

    k[4] = 2.0*k[3]/k[2];


    // square of (sqrt(kappa)-1)/(sqrt(kappa)+1);

    k[5] = (mu1-2.0*smu0*smu1+mu0)/(mu1+2.0*smu0*smu1+mu0);


#if DEBUG_MODE > 0

    printf("### DEBUG: [-Begin-] %s ...\n", __FUNCTION__);

#endif


    // Update

    for ( i=0; i<L; i++ ) {

        // get residual

        fasp_blas_dcsr_mxv(Amat, u, r);// r= Amat*u;

        fasp_blas_darray_axpyz(n, -1, r, b, r);// r= -r+b;


        // Get correction error = R*r

        Rr(Amat, Dinv, r, rbar, v0, v1, error, k, ndeg);


        // update solution

        fasp_blas_darray_axpy(n, 1, error, u);


    }


#if DEBUG_MODE > 1

    printf("### DEBUG: Degree of polysmoothing is: %d\n",ndeg);

#endif


    // free memory

    fasp_mem_free(Dinv);  Dinv  = NULL;

    fasp_mem_free(r);     r     = NULL;

    fasp_mem_free(rbar);  rbar  = NULL;

    fasp_mem_free(v0);    v0    = NULL;

    fasp_mem_free(v1);    v1    = NULL;

    fasp_mem_free(error); error = NULL;

    fasp_mem_free(k);     k     = NULL;


#if DEBUG_MODE > 0

    printf("### DEBUG: [--End--] %s ...\n", __FUNCTION__);

#endif


    return;

}


void fasp_smoother_dcsr_poly_old (dCSRmat *Amat,

                                  dvector *brhs,

                                  dvector *usol,

                                  INT      n,

                                  INT      ndeg,

                                  INT      L)

{

    INT  *ia=Amat->IA,*ja=Amat->JA;

    INT   i,j,k,it,jk,iaa,iab,ndeg0;  // id and ij for scaling of A


    REAL *a=Amat->val, *b=brhs->val, *u=usol->val;

    REAL *v,*v0,*r,*vsave;  // one can get away without r as well;

    REAL  smaxa,smina,delinv,s,smu0,smu1,skappa,th,th1,sq;

    REAL  ri,ari,vj,ravj,snj,sm,sm01,smsqrt,delta,delta2,chi;


#ifdef _OPENMP

    // variables for OpenMP

    INT myid, mybegin, myend;

    INT nthreads = fasp_get_num_threads();

#endif


#if DEBUG_MODE > 0

    printf("### DEBUG: [-Begin-] %s ...\n", __FUNCTION__);

#endif


    /* WORKING MEM */

    v     = (REAL *) fasp_mem_calloc(n,sizeof(REAL));

    v0    = (REAL *) fasp_mem_calloc(n,sizeof(REAL));

    vsave = (REAL *) fasp_mem_calloc(n,sizeof(REAL));

    r     = (REAL *) fasp_mem_calloc(n,sizeof(REAL));


    /* COMPUTE PARAMS*/

    // min INT for approx -- could be done upfront

    // i.e., only once per level... only norm1 ...

    fasp_aux_norm1_(ia,ja,a,&n,&smaxa);

    smina=smaxa/8;

    delinv=(smaxa+smina)/(smaxa-smina);

    th=delinv+sqrt(delinv*delinv-1e+00);

    th1=1e+00/th;

    sq=(th-th1)*(th-th1);

    //

    ndeg0=(int)floor(log(2*(2e0+th+th1)/sq)/log(th)+1e0);

    if (ndeg0 < ndeg) ndeg0=ndeg;

    //

    smu0=1e+00/smaxa;

    smu1=1e+00/smina;

    skappa=sqrt(smaxa/smina);

    delta=(skappa-1e+00)/(skappa+1);

    delta2=delta*delta;

    s=sqrt(smu0)+sqrt(smu1);

    s=s*s;

    smsqrt=0.5e+00*s;

    chi=4e+00*smu0*smu1/s;

    sm=0.5e+00*(smu0+smu1);

    sm01=smu0*smu1;


#if DEBUG_MODE > 1

    printf("### DEBUG: Degree of polysmoothing is: %d\n",ndeg);

#endif


    /* BEGIN POLY ITS */


    /* auv_(ia,ja,a,u,u,&n,&err0); NA: u = 0 */

    //bminax(b,ia,ja,a,u,&n,r);

    //for (i=0; i < n; ++i) {res0 += r[i]*r[i];}

    //res0=sqrt(res0);


    for (it = 0 ; it < L; it++) {

        bminax(b,ia,ja,a,u,&n,r);

#ifdef _OPENMP

#pragma omp parallel for private(myid,mybegin,myend,i,iaa,iab,ari,jk,j,ri) if(n>OPENMP_HOLDS)

        for (myid=0; myid<nthreads; ++myid) {

            fasp_get_start_end(myid, nthreads, n, &mybegin, &myend);

            for (i=mybegin; i<myend; ++i) {

#else

            for (i=0; i < n ; ++i) {

#endif

                iaa = ia[i];

                iab = ia[i+1];

                ari=0e+00; /* ari is (A*r)[i] */

                if(iab > iaa) {

                    for (jk = iaa; jk < iab; jk++) {

                        j=ja[jk];

                        ari += a[jk] * r[j];

                    }

                }

                ri=r[i];

                v0[i]=sm*ri;

                v[i]=smsqrt*ri-sm01*ari;

            }

#ifdef _OPENMP

        }

#endif

        for (i=1; i < ndeg0; ++i) {

            //for (j=0; j < n ; ++j) vsave[j]=v[j];

            fasp_darray_cp(n, v, vsave);


#ifdef _OPENMP

#pragma omp parallel for private(myid,mybegin,myend,j,ravj,iaa,iab,jk,k,vj,snj) if(n>OPENMP_HOLDS)

            for (myid=0; myid<nthreads; ++myid) {

                fasp_get_start_end(myid, nthreads, n, &mybegin, &myend);

                for (j=mybegin; j<myend; ++j) {

#else

                for (j=0; j < n ; ++j) {

#endif

                    /* ravj = (r- A*v)[j] */

                    ravj= r[j];

                    iaa = ia[j];

                    iab = ia[j+1];

                    if(iab > iaa) {

                        for (jk = iaa; jk < iab; jk++) {

                            k=ja[jk];

                            ravj -= a[jk] * vsave[k];

                        }

                    }

                    vj=v[j];

                    snj = chi*ravj+delta2*(vj-v0[j]);

                    v0[j]=vj;

                    v[j]=vj+snj;

                }

            }

#ifdef _OPENMP

        }

#endif

        fasp_aux_uuplv0_(u,v,&n);

        //bminax(b,ia,ja,a,u,&n,r);

        //for (i=0; i < n ; ++i)

        //resk += r[i]*r[i];

        //resk=sqrt(resk);

        //fprintf("\nres0=%12.5g\n",res0);

        //fprintf("\nresk=%12.5g\n",resk);

        //res0=resk;

        //resk=0.0e0;

    }


    fasp_mem_free(v);     v     = NULL;

    fasp_mem_free(v0);    v0    = NULL;

    fasp_mem_free(r);     r     = NULL;

    fasp_mem_free(vsave); vsave = NULL;


#if DEBUG_MODE > 0

    printf("### DEBUG: [--End--] %s ...\n", __FUNCTION__);

#endif


    return;

}


/*---------------------------------*/

/*--      Private Functions      --*/

/*---------------------------------*/


static void bminax (REAL *b,

                    INT  *ia,

                    INT  *ja,

                    REAL *a,

                    REAL *x,

                    INT  *nn,

                    REAL *res)

{

    /* Computes b-A*x */


    INT i,j,jk,iaa,iab;

    INT n;

    REAL u;

    n=*nn;


#ifdef _OPENMP

    // variables for OpenMP

    INT myid, mybegin, myend;

    INT nthreads = fasp_get_num_threads();

#endif


#ifdef _OPENMP

#pragma omp parallel for private(myid,mybegin,myend,i,iaa,iab,u,jk,j) if(n>OPENMP_HOLDS)

    for (myid=0; myid<nthreads; ++myid) {

        fasp_get_start_end(myid, nthreads, n, &mybegin, &myend);

        for (i=mybegin; i<myend; ++i) {

#else

        for (i=0; i < n ; ++i) {

#endif

            iaa = ia[i];

            iab = ia[i+1];

            u = b[i];

            if(iab > iaa)

            for (jk = iaa; jk < iab; jk++) {

                j=ja[jk];

                u -= a[jk] * x[j];

            }

            res[i] = u;

        }

#ifdef _OPENMP

    }

#endif

    return;

}


static void Diaginv (dCSRmat *Amat,

                     REAL    *Dinv)

{

    const INT   n  = Amat->row;

    const INT  *ia = Amat->IA, *ja = Amat->JA;

    const REAL *a  = Amat->val;

    INT i,j;


#ifdef _OPENMP

#pragma omp parallel for private(j) if(n>OPENMP_HOLDS)

#endif

    for (i=0; i<n; i++) {

        for(j=ia[i]; j<ia[i+1]; j++) {

            if(i==ja[j]) // find the diagonal

                break;

        }

        Dinv[i] = 1.0/a[j];

    }

    return;

}


static REAL DinvAnorminf (dCSRmat *Amat,

                          REAL    *Dinv)

{

    //local variable

    const INT   n  = Amat->row;

    const INT  *ia = Amat->IA;

    const REAL *a  = Amat->val;


    INT i,j;

    REAL norm, temp;


#ifdef _OPENMP

    // variables for OpenMP

    INT myid, mybegin, myend;

    REAL sub_norm = 0.0;

    INT nthreads = fasp_get_num_threads();

#endif


    norm = 0.0;


    // get the infinity norm of Dinv*A

#ifdef _OPENMP

#pragma omp parallel for private(myid,mybegin,myend,i,temp,sub_norm) if(n>OPENMP_HOLDS)

    for (myid=0; myid<nthreads; ++myid) {

        fasp_get_start_end(myid, nthreads, n, &mybegin, &myend);

        sub_norm = 0.0;

        for (i=mybegin; i<myend; ++i) {

#else

        for (i=0; i<n; i++) {

#endif

            temp = 0.0;

            for (j=ia[i]; j<ia[i+1]; j++) {

                temp += ABS(a[j]);

            }

            temp *= Dinv[i]; // temp is the L1 norm of the ith row of Dinv*A;

#ifdef _OPENMP

            sub_norm = MAX(sub_norm, temp);

#else

            norm = MAX(norm, temp);

#endif

        }

#ifdef _OPENMP

#pragma omp critical(norm)

        norm = MAX(norm, sub_norm);

    }

#endif


    return norm;

}


static void Diagx (REAL *Dinv,

                   INT   n,

                   REAL *x,

                   REAL *b)

{

    INT i;


    // Variables for OpenMP

    SHORT nthreads = 1, use_openmp = FALSE;

    INT myid, mybegin, myend;


#ifdef _OPENMP

    if (n > OPENMP_HOLDS) {

        use_openmp = TRUE;

        nthreads = fasp_get_num_threads();

    }

#endif


    if (use_openmp) {

#ifdef _OPENMP

#pragma omp parallel for private(myid, mybegin, myend, i)

#endif

        for (myid = 0; myid < nthreads; myid++) {

            fasp_get_start_end(myid, nthreads, n, &mybegin, &myend);

            for (i = mybegin; i < myend; i++) {

                b[i] = Dinv[i] * x[i];

            }

        }

    }

    else {

        for (i=0; i<n; i++) {

            b[i] = Dinv[i] * x[i];

        }

    }

    return;

}


static void Rr (dCSRmat *Amat,

                REAL    *Dinv,

                REAL    *r,

                REAL    *rbar,

                REAL    *v0,

                REAL    *v1,

                REAL    *vnew,

                REAL    *k,

                INT      m)

{

    // local variables

    const INT   n  = Amat->row;

    INT i,j;


#ifdef _OPENMP

    // variables for OpenMP

    INT myid, mybegin, myend;

    INT nthreads = fasp_get_num_threads();

#endif


    //1 set up rbar

    Diagx(Dinv, n, r, rbar);// rbar = Dinv *r;


    //2 set up v0, v1;

    fasp_blas_dcsr_mxv(Amat, rbar, v1);//v1= A*rbar;

    Diagx(Dinv, n, v1, v1); // v1=Dinv *v1;


#ifdef _OPENMP

#pragma omp parallel for if(n>OPENMP_HOLDS)

#endif

    for(i=0;i<n;i++) {

        v0[i] = k[1] * rbar[i];

        v1[i] = k[2] * rbar[i] - k[3] * v1[i];

    }


    //3 iterate to get v_(j+1)


    for (j=1;j<m;j++) {

        fasp_blas_dcsr_mxv(Amat, v1, rbar);//rbar= A*v_(j);


#ifdef _OPENMP

#pragma omp parallel for private(myid,mybegin,myend,i) if(n>OPENMP_HOLDS)

        for (myid=0; myid<nthreads; ++myid) {

            fasp_get_start_end(myid, nthreads, n, &mybegin, &myend);

            for (i=mybegin; i<myend; ++i) {

#else

            for(i=0;i<n;i++) {

#endif

                rbar[i] = (r[i] - rbar[i])*Dinv[i];// indeed rbar=Dinv*(r-A*v_(j));

                vnew[i] = v1[i] + k[5] *(v1[i] - v0[i]) + k[4] * rbar[i];// compute v_(j+1)

                // prepare for next cycle

                v0[i]=v1[i];

                v1[i]=vnew[i];

            }

#ifdef _OPENMP

        }

#endif

    }

}


static void fasp_aux_uuplv0_ (REAL *u,

                              REAL *v,

                              INT *n)

{

    /*

     This computes y = y + x.

     */

    INT i;

    for ( i=0; i < *n; i++ ) u[i] += v[i];

    return;

}


static void fasp_aux_norm1_ (INT   *ia,

                             INT   *ja,

                             REAL  *a,

                             INT   *nn,

                             REAL  *a1norm)

{

    INT  n,i,jk,iaa,iab;

    REAL sum,s;

    /* computes one norm of a matrix a and stores it in the variable

       pointed to by *a1norm*/

    n = *nn;

    s = 0.0;

    for ( i=0; i < n ; i++ ) {

        iaa = ia[i];

        iab = ia[i+1];

        sum = 0e+00;

        for ( jk = iaa; jk < iab; jk++ ) sum += fabs(a[jk]);

        if ( sum > s ) s = sum;

    }

    *a1norm=s;

}


/*---------------------------------*/

/*--        End of File          --*/

/*---------------------------------*/

fasp_darray_cp
void fasp_darray_cp(const INT n, const REAL *x, REAL *y)
Copy an array to the other y=x.
Definition: AuxArray.c:210

fasp_mem_free
void fasp_mem_free(void *mem)
Free up previous allocated memory body and set pointer to NULL.
Definition: AuxMemory.c:152

fasp_mem_calloc
void * fasp_mem_calloc(const unsigned int size, const unsigned int type)
Allocate, initiate, and check memory.
Definition: AuxMemory.c:65

fasp_get_start_end
void fasp_get_start_end(const INT procid, const INT nprocs, const INT n, INT *start, INT *end)
Assign Load to each thread.
Definition: AuxThreads.c:93

fasp_blas_darray_axpyz
void fasp_blas_darray_axpyz(const INT n, const REAL a, const REAL *x, const REAL *y, REAL *z)
z = a*x + y
Definition: BlaArray.c:403

fasp_blas_darray_axpy
void fasp_blas_darray_axpy(const INT n, const REAL a, const REAL *x, REAL *y)
y = a*x + y
Definition: BlaArray.c:90

fasp_blas_dcsr_mxv
void fasp_blas_dcsr_mxv(const dCSRmat *A, const REAL *x, REAL *y)
Matrix-vector multiplication y = A*x.
Definition: BlaSpmvCSR.c:242

fasp_smoother_dcsr_poly_old
void fasp_smoother_dcsr_poly_old(dCSRmat *Amat, dvector *brhs, dvector *usol, INT n, INT ndeg, INT L)
poly approx to A^{-1} as MG smoother: JK&LTZ2010
Definition: ItrSmootherCSRpoly.c:165

fasp_smoother_dcsr_poly
void fasp_smoother_dcsr_poly(dCSRmat *Amat, dvector *brhs, dvector *usol, INT n, INT ndeg, INT L)
poly approx to A^{-1} as MG smoother
Definition: ItrSmootherCSRpoly.c:67

fasp.h
Main header file for the FASP project.

REAL
#define REAL
Definition: fasp.h:75

SHORT
#define SHORT
FASP integer and floating point numbers.
Definition: fasp.h:71

ABS
#define ABS(a)
Definition: fasp.h:84

MAX
#define MAX(a, b)
Definition of max, min, abs.
Definition: fasp.h:82

INT
#define INT
Definition: fasp.h:72

OPENMP_HOLDS
#define OPENMP_HOLDS
Definition: fasp_const.h:269

TRUE
#define TRUE
Definition of logic type.
Definition: fasp_const.h:61

FALSE
#define FALSE
Definition: fasp_const.h:62

dCSRmat
Sparse matrix of REAL type in CSR format.
Definition: fasp.h:151

dCSRmat::val
REAL * val
nonzero entries of A
Definition: fasp.h:169

dCSRmat::row
INT row
row number of matrix A, m
Definition: fasp.h:154

dCSRmat::IA
INT * IA
integer array of row pointers, the size is m+1
Definition: fasp.h:163

dCSRmat::JA
INT * JA
integer array of column indexes, the size is nnz
Definition: fasp.h:166

dvector
Vector with n entries of REAL type.
Definition: fasp.h:354

dvector::val
REAL * val
actual vector entries
Definition: fasp.h:360