fasp/ItrSmootherBSR_8c_source.html

#include <math.h>


#ifdef _OPENMP

#include <omp.h>

#endif


#include "fasp.h"

#include "fasp_functs.h"


/*---------------------------------*/

/*--  Declare Private Functions  --*/

/*---------------------------------*/


#ifdef _OPENMP


#if ILU_MC_OMP

static inline void perm(const INT, const INT, const REAL*, const INT*, REAL*);

static inline void invperm(const INT, const INT, const REAL*, const INT*, REAL*);

#endif


#endif


REAL ilu_solve_time = 0.0;

/*---------------------------------*/

/*--      Public Functions       --*/

/*---------------------------------*/


void fasp_smoother_dbsr_jacobi(dBSRmat* A, dvector* b, dvector* u)

{

    // members of A

    const INT   ROW  = A->ROW;

    const INT   nb   = A->nb;

    const INT   nb2  = nb * nb;

    const INT   size = ROW * nb2;

    const INT*  IA   = A->IA;

    const INT*  JA   = A->JA;

    const REAL* val  = A->val;


    // local variables

    INT   i, k;

    SHORT nthreads = 1, use_openmp = FALSE;

    REAL* diaginv = (REAL*)fasp_mem_calloc(size, sizeof(REAL));


#ifdef _OPENMP

    if (ROW > OPENMP_HOLDS) {

        use_openmp = TRUE;

        nthreads   = fasp_get_num_threads();

    }

#endif


    // get all the diagonal sub-blocks

    if (use_openmp) {

        INT mybegin, myend, myid;

#ifdef _OPENMP

#pragma omp parallel for private(myid, mybegin, myend, i, k)

#endif

        for (myid = 0; myid < nthreads; myid++) {

            fasp_get_start_end(myid, nthreads, ROW, &mybegin, &myend);

            for (i = mybegin; i < myend; i++) {

                for (k = IA[i]; k < IA[i + 1]; ++k)

                    if (JA[k] == i)

                        memcpy(diaginv + i * nb2, val + k * nb2, nb2 * sizeof(REAL));

            }

        }

    } else {

        for (i = 0; i < ROW; ++i) {

            for (k = IA[i]; k < IA[i + 1]; ++k) {

                if (JA[k] == i)

                    memcpy(diaginv + i * nb2, val + k * nb2, nb2 * sizeof(REAL));

            }

        }

    }


    // compute the inverses of all the diagonal sub-blocks

    if (nb > 1) {

        if (use_openmp) {

            INT mybegin, myend, myid;

#ifdef _OPENMP

#pragma omp parallel for private(myid, mybegin, myend, i)

#endif

            for (myid = 0; myid < nthreads; myid++) {

                fasp_get_start_end(myid, nthreads, ROW, &mybegin, &myend);

                for (i = mybegin; i < myend; i++) {

                    fasp_smat_inv(diaginv + i * nb2, nb);

                }

            }

        } else {

            for (i = 0; i < ROW; ++i) {

                fasp_smat_inv(diaginv + i * nb2, nb);

            }

        }

    } else {

        if (use_openmp) {

            INT mybegin, myend, myid;

#ifdef _OPENMP

#pragma omp parallel for private(myid, mybegin, myend, i)

#endif

            for (myid = 0; myid < nthreads; myid++) {

                fasp_get_start_end(myid, nthreads, ROW, &mybegin, &myend);

                for (i = mybegin; i < myend; i++) {

                    diaginv[i] = 1.0 / diaginv[i];

                }

            }

        } else {

            for (i = 0; i < ROW; ++i) {

                // zero-diagonal should be tested previously

                diaginv[i] = 1.0 / diaginv[i];

            }

        }

    }


    fasp_smoother_dbsr_jacobi1(A, b, u, diaginv);


    fasp_mem_free(diaginv);

    diaginv = NULL;

}


void fasp_smoother_dbsr_jacobi_setup(dBSRmat* A, REAL* diaginv)

{

    // members of A

    const INT   ROW = A->ROW;

    const INT   nb  = A->nb;

    const INT   nb2 = nb * nb;

    const INT*  IA  = A->IA;

    const INT*  JA  = A->JA;

    const REAL* val = A->val;


    // local variables

    INT i, k;


    SHORT nthreads = 1, use_openmp = FALSE;


#ifdef _OPENMP

    if (ROW > OPENMP_HOLDS) {

        use_openmp = TRUE;

        nthreads   = fasp_get_num_threads();

    }

#endif


    // get all the diagonal sub-blocks

    if (use_openmp) {

        INT mybegin, myend, myid;

#ifdef _OPENMP

#pragma omp parallel for private(myid, mybegin, myend, i, k)

#endif

        for (myid = 0; myid < nthreads; myid++) {

            fasp_get_start_end(myid, nthreads, ROW, &mybegin, &myend);

            for (i = mybegin; i < myend; i++) {

                for (k = IA[i]; k < IA[i + 1]; ++k)

                    if (JA[k] == i)

                        memcpy(diaginv + i * nb2, val + k * nb2, nb2 * sizeof(REAL));

            }

        }

    } else {

        for (i = 0; i < ROW; ++i) {

            for (k = IA[i]; k < IA[i + 1]; ++k) {

                if (JA[k] == i)

                    memcpy(diaginv + i * nb2, val + k * nb2, nb2 * sizeof(REAL));

            }

        }

    }


    // compute the inverses of all the diagonal sub-blocks

    if (nb > 1) {

        if (use_openmp) {

            INT mybegin, myend, myid;

#ifdef _OPENMP

#pragma omp parallel for private(myid, mybegin, myend, i)

#endif

            for (myid = 0; myid < nthreads; myid++) {

                fasp_get_start_end(myid, nthreads, ROW, &mybegin, &myend);

                for (i = mybegin; i < myend; i++) {

                    fasp_smat_inv(diaginv + i * nb2, nb);

                }

            }

        } else {

            for (i = 0; i < ROW; ++i) {

                fasp_smat_inv(diaginv + i * nb2, nb);

            }

        }

    } else {

        if (use_openmp) {

            INT mybegin, myend, myid;

#ifdef _OPENMP

#pragma omp parallel for private(myid, mybegin, myend, i)

#endif

            for (myid = 0; myid < nthreads; myid++) {

                fasp_get_start_end(myid, nthreads, ROW, &mybegin, &myend);

                for (i = mybegin; i < myend; i++) {

                    diaginv[i] = 1.0 / diaginv[i];

                }

            }

        } else {

            for (i = 0; i < ROW; ++i) {

                // zero-diagonal should be tested previously

                diaginv[i] = 1.0 / diaginv[i];

            }

        }

    }

}


void fasp_smoother_dbsr_jacobi1(dBSRmat* A, dvector* b, dvector* u, REAL* diaginv)

{

    // members of A

    const INT  ROW  = A->ROW;

    const INT  nb   = A->nb;

    const INT  nb2  = nb * nb;

    const INT  size = ROW * nb;

    const INT* IA   = A->IA;

    const INT* JA   = A->JA;

    REAL*      val  = A->val;


    SHORT nthreads = 1, use_openmp = FALSE;


#ifdef _OPENMP

    if (ROW > OPENMP_HOLDS) {

        use_openmp = TRUE;

        nthreads   = fasp_get_num_threads();

    }

#endif


    // values of dvector b and u

    REAL* b_val = b->val;

    REAL* u_val = u->val;


    // auxiliary array

    REAL* b_tmp = NULL;


    // local variables

    INT i, j, k;

    INT pb;


    // b_tmp = b_val

    b_tmp = (REAL*)fasp_mem_calloc(size, sizeof(REAL));

    memcpy(b_tmp, b_val, size * sizeof(REAL));


    // No need to assign the smoothing order since the result doesn't depend on it

    if (nb == 1) {

        if (use_openmp) {

            INT mybegin, myend, myid;

#ifdef _OPENMP

#pragma omp parallel for private(myid, mybegin, myend, i, j, k)

#endif

            for (myid = 0; myid < nthreads; myid++) {

                fasp_get_start_end(myid, nthreads, ROW, &mybegin, &myend);

                for (i = mybegin; i < myend; i++) {

                    for (k = IA[i]; k < IA[i + 1]; ++k) {

                        j = JA[k];

                        if (j != i) b_tmp[i] -= val[k] * u_val[j];

                    }

                }

            }

#ifdef _OPENMP

#pragma omp parallel for private(myid, mybegin, myend, i)

#endif

            for (myid = 0; myid < nthreads; myid++) {

                fasp_get_start_end(myid, nthreads, ROW, &mybegin, &myend);

                for (i = mybegin; i < myend; i++) {

                    u_val[i] = b_tmp[i] * diaginv[i];

                }

            }

        } else {

            for (i = 0; i < ROW; ++i) {

                for (k = IA[i]; k < IA[i + 1]; ++k) {

                    j = JA[k];

                    if (j != i) b_tmp[i] -= val[k] * u_val[j];

                }

            }

            for (i = 0; i < ROW; ++i) {

                u_val[i] = b_tmp[i] * diaginv[i];

            }

        }


        fasp_mem_free(b_tmp);

        b_tmp = NULL;

    } else if (nb > 1) {

        if (use_openmp) {

            INT mybegin, myend, myid;

#ifdef _OPENMP

#pragma omp parallel for private(myid, mybegin, myend, i, pb, k, j)

#endif

            for (myid = 0; myid < nthreads; myid++) {

                fasp_get_start_end(myid, nthreads, ROW, &mybegin, &myend);

                for (i = mybegin; i < myend; i++) {

                    pb = i * nb;

                    for (k = IA[i]; k < IA[i + 1]; ++k) {

                        j = JA[k];

                        if (j != i)

                            fasp_blas_smat_ymAx(val + k * nb2, u_val + j * nb,

                                                b_tmp + pb, nb);

                    }

                }

            }

#ifdef _OPENMP

#pragma omp parallel for private(myid, mybegin, myend, i, pb)

#endif

            for (myid = 0; myid < nthreads; myid++) {

                fasp_get_start_end(myid, nthreads, ROW, &mybegin, &myend);

                for (i = mybegin; i < myend; i++) {

                    pb = i * nb;

                    fasp_blas_smat_mxv(diaginv + nb2 * i, b_tmp + pb, u_val + pb, nb);

                }

            }

        } else {

            for (i = 0; i < ROW; ++i) {

                pb = i * nb;

                for (k = IA[i]; k < IA[i + 1]; ++k) {

                    j = JA[k];

                    if (j != i)

                        fasp_blas_smat_ymAx(val + k * nb2, u_val + j * nb, b_tmp + pb,

                                            nb);

                }

            }


            for (i = 0; i < ROW; ++i) {

                pb = i * nb;

                fasp_blas_smat_mxv(diaginv + nb2 * i, b_tmp + pb, u_val + pb, nb);

            }

        }

        fasp_mem_free(b_tmp);

        b_tmp = NULL;

    } else {

        printf("### ERROR: nb is illegal! [%s:%d]\n", __FILE__, __LINE__);

        fasp_chkerr(ERROR_NUM_BLOCKS, __FUNCTION__);

    }

}


void fasp_smoother_dbsr_gs(dBSRmat* A, dvector* b, dvector* u, INT order, INT* mark)

{

    // members of A

    const INT   ROW  = A->ROW;

    const INT   nb   = A->nb;

    const INT   nb2  = nb * nb;

    const INT   size = ROW * nb2;

    const INT*  IA   = A->IA;

    const INT*  JA   = A->JA;

    const REAL* val  = A->val;


    // local variables

    INT   i, k;

    SHORT nthreads = 1, use_openmp = FALSE;

    REAL* diaginv = (REAL*)fasp_mem_calloc(size, sizeof(REAL));


#ifdef _OPENMP

    if (ROW > OPENMP_HOLDS) {

        use_openmp = TRUE;

        nthreads   = fasp_get_num_threads();

    }

#endif


    // get all the diagonal sub-blocks

    if (use_openmp) {

        INT mybegin, myend, myid;

#ifdef _OPENMP

#pragma omp parallel for private(myid, mybegin, myend, i, k)

#endif

        for (myid = 0; myid < nthreads; myid++) {

            fasp_get_start_end(myid, nthreads, ROW, &mybegin, &myend);

            for (i = mybegin; i < myend; i++) {

                for (k = IA[i]; k < IA[i + 1]; ++k)

                    if (JA[k] == i)

                        memcpy(diaginv + i * nb2, val + k * nb2, nb2 * sizeof(REAL));

            }

        }

    } else {

        for (i = 0; i < ROW; ++i) {

            for (k = IA[i]; k < IA[i + 1]; ++k) {

                if (JA[k] == i)

                    memcpy(diaginv + i * nb2, val + k * nb2, nb2 * sizeof(REAL));

            }

        }

    }


    // compute the inverses of all the diagonal sub-blocks

    if (nb > 1) {

        if (use_openmp) {

            INT mybegin, myend, myid;

#ifdef _OPENMP

#pragma omp parallel for private(myid, mybegin, myend, i)

#endif

            for (myid = 0; myid < nthreads; myid++) {

                fasp_get_start_end(myid, nthreads, ROW, &mybegin, &myend);

                for (i = mybegin; i < myend; i++) {

                    fasp_smat_inv(diaginv + i * nb2, nb);

                }

            }

        } else {

            for (i = 0; i < ROW; ++i) {

                fasp_smat_inv(diaginv + i * nb2, nb);

            }

        }

    } else {

        if (use_openmp) {

            INT mybegin, myend, myid;

#ifdef _OPENMP

#pragma omp parallel for private(myid, mybegin, myend, i)

#endif

            for (myid = 0; myid < nthreads; myid++) {

                fasp_get_start_end(myid, nthreads, ROW, &mybegin, &myend);

                for (i = mybegin; i < myend; i++) {

                    diaginv[i] = 1.0 / diaginv[i];

                }

            }

        } else {

            for (i = 0; i < ROW; ++i) {

                // zero-diagonal should be tested previously

                diaginv[i] = 1.0 / diaginv[i];

            }

        }

    }


    fasp_smoother_dbsr_gs1(A, b, u, order, mark, diaginv);


    fasp_mem_free(diaginv);

    diaginv = NULL;

}


void fasp_smoother_dbsr_gs1(

    dBSRmat* A, dvector* b, dvector* u, INT order, INT* mark, REAL* diaginv)

{

    if (!mark) {

        if (order == ASCEND) // smooth ascendingly

        {

            fasp_smoother_dbsr_gs_ascend(A, b, u, diaginv);

        } else if (order == DESCEND) // smooth descendingly

        {

            fasp_smoother_dbsr_gs_descend(A, b, u, diaginv);

        }

    }

    // smooth according to the order 'mark' defined by user

    else {

        fasp_smoother_dbsr_gs_order1(A, b, u, diaginv, mark);

    }

}


void fasp_smoother_dbsr_gs_ascend(dBSRmat* A, dvector* b, dvector* u, REAL* diaginv)

{

    // members of A

    const INT  ROW = A->ROW;

    const INT  nb  = A->nb;

    const INT  nb2 = nb * nb;

    const INT* IA  = A->IA;

    const INT* JA  = A->JA;

    REAL*      val = A->val;


    // values of dvector b and u

    REAL* b_val = b->val;

    REAL* u_val = u->val;


    // local variables

    INT  i, j, k;

    INT  pb;

    REAL rhs = 0.0;


    if (nb == 1) {

        for (i = 0; i < ROW; ++i) {

            rhs = b_val[i];

            for (k = IA[i]; k < IA[i + 1]; ++k) {

                j = JA[k];

                if (j != i) rhs -= val[k] * u_val[j];

            }

            u_val[i] = rhs * diaginv[i];

        }

    } else if (nb > 1) {

        REAL* b_tmp = (REAL*)fasp_mem_calloc(nb, sizeof(REAL));


        for (i = 0; i < ROW; ++i) {

            pb = i * nb;

            memcpy(b_tmp, b_val + pb, nb * sizeof(REAL));

            for (k = IA[i]; k < IA[i + 1]; ++k) {

                j = JA[k];

                if (j != i)

                    fasp_blas_smat_ymAx(val + k * nb2, u_val + j * nb, b_tmp, nb);

            }

            fasp_blas_smat_mxv(diaginv + nb2 * i, b_tmp, u_val + pb, nb);

        }


        fasp_mem_free(b_tmp);

        b_tmp = NULL;

    } else {

        printf("### ERROR: nb is illegal! [%s:%d]\n", __FILE__, __LINE__);

        fasp_chkerr(ERROR_NUM_BLOCKS, __FUNCTION__);

    }

}


void fasp_smoother_dbsr_gs_ascend1(dBSRmat* A, dvector* b, dvector* u)

{

    // members of A

    const INT  ROW = A->ROW;

    const INT  nb  = A->nb;

    const INT  nb2 = nb * nb;

    const INT* IA  = A->IA;

    const INT* JA  = A->JA;

    REAL*      val = A->val;


    // values of dvector b and u

    REAL* b_val = b->val;

    REAL* u_val = u->val;


    // local variables

    INT  i, j, k;

    INT  pb;

    REAL rhs = 0.0;


    if (nb == 1) {

        for (i = 0; i < ROW; ++i) {

            rhs = b_val[i];

            for (k = IA[i]; k < IA[i + 1]; ++k) {

                j = JA[k];

                if (j != i) rhs -= val[k] * u_val[j];

            }

            u_val[i] = rhs;

        }

    } else if (nb > 1) {

        REAL* b_tmp = (REAL*)fasp_mem_calloc(nb, sizeof(REAL));


        for (i = 0; i < ROW; ++i) {

            pb = i * nb;

            memcpy(b_tmp, b_val + pb, nb * sizeof(REAL));

            for (k = IA[i]; k < IA[i + 1]; ++k) {

                j = JA[k];

                if (j != i)

                    fasp_blas_smat_ymAx(val + k * nb2, u_val + j * nb, b_tmp, nb);

            }

            memcpy(u_val + pb, b_tmp, nb * sizeof(REAL));

        }


        fasp_mem_free(b_tmp);

        b_tmp = NULL;

    } else {

        printf("### ERROR: nb is illegal! [%s:%d]\n", __FILE__, __LINE__);

        fasp_chkerr(ERROR_NUM_BLOCKS, __FUNCTION__);

    }

}


void fasp_smoother_dbsr_gs_descend(dBSRmat* A, dvector* b, dvector* u, REAL* diaginv)

{

    // members of A

    const INT  ROW = A->ROW;

    const INT  nb  = A->nb;

    const INT  nb2 = nb * nb;

    const INT* IA  = A->IA;

    const INT* JA  = A->JA;

    REAL*      val = A->val;


    // values of dvector b and u

    REAL* b_val = b->val;

    REAL* u_val = u->val;


    // local variables

    INT  i, j, k;

    INT  pb;

    REAL rhs = 0.0;


    if (nb == 1) {

        for (i = ROW - 1; i >= 0; i--) {

            rhs = b_val[i];

            for (k = IA[i]; k < IA[i + 1]; ++k) {

                j = JA[k];

                if (j != i) rhs -= val[k] * u_val[j];

            }

            u_val[i] = rhs * diaginv[i];

        }

    } else if (nb > 1) {

        REAL* b_tmp = (REAL*)fasp_mem_calloc(nb, sizeof(REAL));


        for (i = ROW - 1; i >= 0; i--) {

            pb = i * nb;

            memcpy(b_tmp, b_val + pb, nb * sizeof(REAL));

            for (k = IA[i]; k < IA[i + 1]; ++k) {

                j = JA[k];

                if (j != i)

                    fasp_blas_smat_ymAx(val + k * nb2, u_val + j * nb, b_tmp, nb);

            }

            fasp_blas_smat_mxv(diaginv + nb2 * i, b_tmp, u_val + pb, nb);

        }


        fasp_mem_free(b_tmp);

        b_tmp = NULL;

    } else {

        printf("### ERROR: nb is illegal! [%s:%d]\n", __FILE__, __LINE__);

        fasp_chkerr(ERROR_NUM_BLOCKS, __FUNCTION__);

    }

}


void fasp_smoother_dbsr_gs_descend1(dBSRmat* A, dvector* b, dvector* u)

{

    // members of A

    const INT  ROW = A->ROW;

    const INT  nb  = A->nb;

    const INT  nb2 = nb * nb;

    const INT* IA  = A->IA;

    const INT* JA  = A->JA;

    REAL*      val = A->val;


    // values of dvector b and u

    REAL* b_val = b->val;

    REAL* u_val = u->val;


    // local variables

    INT  i, j, k;

    INT  pb;

    REAL rhs = 0.0;


    if (nb == 1) {

        for (i = ROW - 1; i >= 0; i--) {

            rhs = b_val[i];

            for (k = IA[i]; k < IA[i + 1]; ++k) {

                j = JA[k];

                if (j != i) rhs -= val[k] * u_val[j];

            }

            u_val[i] = rhs;

        }

    } else if (nb > 1) {

        REAL* b_tmp = (REAL*)fasp_mem_calloc(nb, sizeof(REAL));


        for (i = ROW - 1; i >= 0; i--) {

            pb = i * nb;

            memcpy(b_tmp, b_val + pb, nb * sizeof(REAL));

            for (k = IA[i]; k < IA[i + 1]; ++k) {

                j = JA[k];

                if (j != i)

                    fasp_blas_smat_ymAx(val + k * nb2, u_val + j * nb, b_tmp, nb);

            }

            memcpy(u_val + pb, b_tmp, nb * sizeof(REAL));

        }


        fasp_mem_free(b_tmp);

        b_tmp = NULL;

    } else {

        printf("### ERROR: nb is illegal! [%s:%d]\n", __FILE__, __LINE__);

        fasp_chkerr(ERROR_NUM_BLOCKS, __FUNCTION__);

    }

}


void fasp_smoother_dbsr_gs_order1(

    dBSRmat* A, dvector* b, dvector* u, REAL* diaginv, INT* mark)

{

    // members of A

    const INT  ROW = A->ROW;

    const INT  nb  = A->nb;

    const INT  nb2 = nb * nb;

    const INT* IA  = A->IA;

    const INT* JA  = A->JA;

    REAL*      val = A->val;


    // values of dvector b and u

    REAL* b_val = b->val;

    REAL* u_val = u->val;


    // local variables

    INT  i, j, k;

    INT  I, pb;

    REAL rhs = 0.0;


    if (nb == 1) {

        for (I = 0; I < ROW; ++I) {

            i   = mark[I];

            rhs = b_val[i];

            for (k = IA[i]; k < IA[i + 1]; ++k) {

                j = JA[k];

                if (j != i) rhs -= val[k] * u_val[j];

            }

            u_val[i] = rhs * diaginv[i];

        }

    } else if (nb > 1) {

        REAL* b_tmp = (REAL*)fasp_mem_calloc(nb, sizeof(REAL));


        for (I = 0; I < ROW; ++I) {

            i  = mark[I];

            pb = i * nb;

            memcpy(b_tmp, b_val + pb, nb * sizeof(REAL));

            for (k = IA[i]; k < IA[i + 1]; ++k) {

                j = JA[k];

                if (j != i)

                    fasp_blas_smat_ymAx(val + k * nb2, u_val + j * nb, b_tmp, nb);

            }

            fasp_blas_smat_mxv(diaginv + nb2 * i, b_tmp, u_val + pb, nb);

        }


        fasp_mem_free(b_tmp);

        b_tmp = NULL;

    } else {

        fasp_chkerr(ERROR_NUM_BLOCKS, __FUNCTION__);

    }

}


void fasp_smoother_dbsr_gs_order2(

    dBSRmat* A, dvector* b, dvector* u, INT* mark, REAL* work)

{

    // members of A

    const INT  ROW = A->ROW;

    const INT  nb  = A->nb;

    const INT  nb2 = nb * nb;

    const INT* IA  = A->IA;

    const INT* JA  = A->JA;

    REAL*      val = A->val;


    // values of dvector b and u

    REAL* b_val = b->val;

    REAL* u_val = u->val;


    // auxiliary array

    REAL* b_tmp = work;


    // local variables

    INT  i, j, k, I, pb;

    REAL rhs = 0.0;


    if (nb == 1) {

        for (I = 0; I < ROW; ++I) {

            i   = mark[I];

            rhs = b_val[i];

            for (k = IA[i]; k < IA[i + 1]; ++k) {

                j = JA[k];

                if (j != i) rhs -= val[k] * u_val[j];

            }

            u_val[i] = rhs;

        }

    } else if (nb > 1) {

        for (I = 0; I < ROW; ++I) {

            i  = mark[I];

            pb = i * nb;

            memcpy(b_tmp, b_val + pb, nb * sizeof(REAL));

            for (k = IA[i]; k < IA[i + 1]; ++k) {

                j = JA[k];

                if (j != i)

                    fasp_blas_smat_ymAx(val + k * nb2, u_val + j * nb, b_tmp, nb);

            }

            memcpy(u_val + pb, b_tmp, nb * sizeof(REAL));

        }

    } else {

        fasp_chkerr(ERROR_NUM_BLOCKS, __FUNCTION__);

    }

}


void fasp_smoother_dbsr_sor(

    dBSRmat* A, dvector* b, dvector* u, INT order, INT* mark, REAL weight)

{

    // members of A

    const INT   ROW  = A->ROW;

    const INT   nb   = A->nb;

    const INT   nb2  = nb * nb;

    const INT   size = ROW * nb2;

    const INT*  IA   = A->IA;

    const INT*  JA   = A->JA;

    const REAL* val  = A->val;


    // local variables

    INT   i, k;

    REAL* diaginv = NULL;


    SHORT nthreads = 1, use_openmp = FALSE;


#ifdef _OPENMP

    if (ROW > OPENMP_HOLDS) {

        use_openmp = TRUE;

        nthreads   = fasp_get_num_threads();

    }

#endif


    // allocate memory

    diaginv = (REAL*)fasp_mem_calloc(size, sizeof(REAL));


    // get all the diagonal sub-blocks

    if (use_openmp) {

        INT mybegin, myend, myid;

#ifdef _OPENMP

#pragma omp parallel for private(myid, mybegin, myend, i, k)

#endif

        for (myid = 0; myid < nthreads; myid++) {

            fasp_get_start_end(myid, nthreads, ROW, &mybegin, &myend);

            for (i = mybegin; i < myend; i++) {

                for (k = IA[i]; k < IA[i + 1]; ++k)

                    if (JA[k] == i)

                        memcpy(diaginv + i * nb2, val + k * nb2, nb2 * sizeof(REAL));

            }

        }

    } else {

        for (i = 0; i < ROW; ++i) {

            for (k = IA[i]; k < IA[i + 1]; ++k) {

                if (JA[k] == i)

                    memcpy(diaginv + i * nb2, val + k * nb2, nb2 * sizeof(REAL));

            }

        }

    }


    // compute the inverses of all the diagonal sub-blocks

    if (nb > 1) {

        if (use_openmp) {

            INT mybegin, myend, myid;

#ifdef _OPENMP

#pragma omp parallel for private(myid, mybegin, myend, i)

#endif

            for (myid = 0; myid < nthreads; myid++) {

                fasp_get_start_end(myid, nthreads, ROW, &mybegin, &myend);

                for (i = mybegin; i < myend; i++) {

                    fasp_smat_inv(diaginv + i * nb2, nb);

                }

            }

        } else {

            for (i = 0; i < ROW; ++i) {

                fasp_smat_inv(diaginv + i * nb2, nb);

            }

        }

    } else {

        if (use_openmp) {

            INT mybegin, myend, myid;

#ifdef _OPENMP

#pragma omp parallel for private(myid, mybegin, myend, i)

#endif

            for (myid = 0; myid < nthreads; myid++) {

                fasp_get_start_end(myid, nthreads, ROW, &mybegin, &myend);

                for (i = mybegin; i < myend; i++) {

                    diaginv[i] = 1.0 / diaginv[i];

                }

            }

        } else {

            for (i = 0; i < ROW; ++i) {

                // zero-diagonal should be tested previously

                diaginv[i] = 1.0 / diaginv[i];

            }

        }

    }


    fasp_smoother_dbsr_sor1(A, b, u, order, mark, diaginv, weight);


    fasp_mem_free(diaginv);

    diaginv = NULL;

}


void fasp_smoother_dbsr_sor1(dBSRmat* A,

                             dvector* b,

                             dvector* u,

                             INT      order,

                             INT*     mark,

                             REAL*    diaginv,

                             REAL     weight)

{

    if (!mark) {

        if (order == ASCEND) // smooth ascendingly

        {

            fasp_smoother_dbsr_sor_ascend(A, b, u, diaginv, weight);

        } else if (order == DESCEND) // smooth descendingly

        {

            fasp_smoother_dbsr_sor_descend(A, b, u, diaginv, weight);

        }

    }

    // smooth according to the order 'mark' defined by user

    else {

        fasp_smoother_dbsr_sor_order(A, b, u, diaginv, mark, weight);

    }

}


void fasp_smoother_dbsr_sor_ascend(

    dBSRmat* A, dvector* b, dvector* u, REAL* diaginv, REAL weight)

{

    // members of A

    const INT   ROW = A->ROW;

    const INT   nb  = A->nb;

    const INT*  IA  = A->IA;

    const INT*  JA  = A->JA;

    const REAL* val = A->val;


    // values of dvector b and u

    const REAL* b_val = b->val;

    REAL*       u_val = u->val;


    // local variables

    const INT nb2 = nb * nb;

    INT       i, j, k;

    INT       pb;

    REAL      rhs              = 0.0;

    REAL      one_minus_weight = 1.0 - weight;


#ifdef _OPENMP

    // variables for OpenMP

    INT myid, mybegin, myend;

    INT nthreads = fasp_get_num_threads();

#endif


    if (nb == 1) {

#ifdef _OPENMP

        if (ROW > OPENMP_HOLDS) {

#pragma omp parallel for private(myid, mybegin, myend, i, rhs, k, j)

            for (myid = 0; myid < nthreads; myid++) {

                fasp_get_start_end(myid, nthreads, ROW, &mybegin, &myend);

                for (i = mybegin; i < myend; i++) {

                    rhs = b_val[i];

                    for (k = IA[i]; k < IA[i + 1]; ++k) {

                        j = JA[k];

                        if (j != i) rhs -= val[k] * u_val[j];

                    }

                    u_val[i] =

                        one_minus_weight * u_val[i] + weight * (rhs * diaginv[i]);

                }

            }

        } else {

#endif

            for (i = 0; i < ROW; ++i) {

                rhs = b_val[i];

                for (k = IA[i]; k < IA[i + 1]; ++k) {

                    j = JA[k];

                    if (j != i) rhs -= val[k] * u_val[j];

                }

                u_val[i] = one_minus_weight * u_val[i] + weight * (rhs * diaginv[i]);

            }

#ifdef _OPENMP

        }

#endif

    } else if (nb > 1) {

#ifdef _OPENMP

        if (ROW > OPENMP_HOLDS) {

            REAL* b_tmp = (REAL*)fasp_mem_calloc(nb * nthreads, sizeof(REAL));

#pragma omp parallel for private(myid, mybegin, myend, i, pb, k, j)

            for (myid = 0; myid < nthreads; myid++) {

                fasp_get_start_end(myid, nthreads, ROW, &mybegin, &myend);

                for (i = mybegin; i < myend; i++) {

                    pb = i * nb;

                    memcpy(b_tmp + myid * nb, b_val + pb, nb * sizeof(REAL));

                    for (k = IA[i]; k < IA[i + 1]; ++k) {

                        j = JA[k];

                        if (j != i)

                            fasp_blas_smat_ymAx(val + k * nb2, u_val + j * nb, b_tmp,

                                                nb);

                    }

                    fasp_blas_smat_aAxpby(weight, diaginv + nb2 * i, b_tmp + myid * nb,

                                          one_minus_weight, u_val + pb, nb);

                }

            }

            fasp_mem_free(b_tmp);

            b_tmp = NULL;

        } else {

#endif

            REAL* b_tmp = (REAL*)fasp_mem_calloc(nb, sizeof(REAL));

            for (i = 0; i < ROW; ++i) {

                pb = i * nb;

                memcpy(b_tmp, b_val + pb, nb * sizeof(REAL));

                for (k = IA[i]; k < IA[i + 1]; ++k) {

                    j = JA[k];

                    if (j != i)

                        fasp_blas_smat_ymAx(val + k * nb2, u_val + j * nb, b_tmp, nb);

                }

                fasp_blas_smat_aAxpby(weight, diaginv + nb2 * i, b_tmp,

                                      one_minus_weight, u_val + pb, nb);

            }

            fasp_mem_free(b_tmp);

            b_tmp = NULL;

#ifdef _OPENMP

        }

#endif

    } else {

        fasp_chkerr(ERROR_NUM_BLOCKS, __FUNCTION__);

    }

}


void fasp_smoother_dbsr_sor_descend(

    dBSRmat* A, dvector* b, dvector* u, REAL* diaginv, REAL weight)

{

    // members of A

    const INT  ROW              = A->ROW;

    const INT  nb               = A->nb;

    const INT  nb2              = nb * nb;

    const INT* IA               = A->IA;

    const INT* JA               = A->JA;

    REAL*      val              = A->val;

    const REAL one_minus_weight = 1.0 - weight;


    // values of dvector b and u

    REAL* b_val = b->val;

    REAL* u_val = u->val;


    // local variables

    INT  i, j, k;

    INT  pb;

    REAL rhs = 0.0;


#ifdef _OPENMP

    // variables for OpenMP

    INT myid, mybegin, myend;

    INT nthreads = fasp_get_num_threads();

#endif


    if (nb == 1) {

#ifdef _OPENMP

        if (ROW > OPENMP_HOLDS) {

#pragma omp parallel for private(myid, mybegin, myend, i, rhs, k, j)

            for (myid = 0; myid < nthreads; myid++) {

                fasp_get_start_end(myid, nthreads, ROW, &mybegin, &myend);

                mybegin = ROW - 1 - mybegin;

                myend   = ROW - 1 - myend;

                for (i = mybegin; i > myend; i--) {

                    rhs = b_val[i];

                    for (k = IA[i]; k < IA[i + 1]; ++k) {

                        j = JA[k];

                        if (j != i) rhs -= val[k] * u_val[j];

                    }

                    u_val[i] =

                        one_minus_weight * u_val[i] + weight * (rhs * diaginv[i]);

                }

            }

        } else {

#endif

            for (i = ROW - 1; i >= 0; i--) {

                rhs = b_val[i];

                for (k = IA[i]; k < IA[i + 1]; ++k) {

                    j = JA[k];

                    if (j != i) rhs -= val[k] * u_val[j];

                }

                u_val[i] = one_minus_weight * u_val[i] + weight * (rhs * diaginv[i]);

            }

#ifdef _OPENMP

        }

#endif

    } else if (nb > 1) {

#ifdef _OPENMP

        if (ROW > OPENMP_HOLDS) {

            REAL* b_tmp = (REAL*)fasp_mem_calloc(nb * nthreads, sizeof(REAL));

#pragma omp parallel for private(myid, mybegin, myend, i, pb, k, j)

            for (myid = 0; myid < nthreads; myid++) {

                fasp_get_start_end(myid, nthreads, ROW, &mybegin, &myend);

                mybegin = ROW - 1 - mybegin;

                myend   = ROW - 1 - myend;

                for (i = mybegin; i > myend; i--) {

                    pb = i * nb;

                    memcpy(b_tmp + myid * nb, b_val + pb, nb * sizeof(REAL));

                    for (k = IA[i]; k < IA[i + 1]; ++k) {

                        j = JA[k];

                        if (j != i)

                            fasp_blas_smat_ymAx(val + k * nb2, u_val + j * nb,

                                                b_tmp + myid * nb, nb);

                    }

                    fasp_blas_smat_aAxpby(weight, diaginv + nb2 * i, b_tmp + myid * nb,

                                          one_minus_weight, u_val + pb, nb);

                }

            }

            fasp_mem_free(b_tmp);

            b_tmp = NULL;

        } else {

#endif

            REAL* b_tmp = (REAL*)fasp_mem_calloc(nb, sizeof(REAL));

            for (i = ROW - 1; i >= 0; i--) {

                pb = i * nb;

                memcpy(b_tmp, b_val + pb, nb * sizeof(REAL));

                for (k = IA[i]; k < IA[i + 1]; ++k) {

                    j = JA[k];

                    if (j != i)

                        fasp_blas_smat_ymAx(val + k * nb2, u_val + j * nb, b_tmp, nb);

                }

                fasp_blas_smat_aAxpby(weight, diaginv + nb2 * i, b_tmp,

                                      one_minus_weight, u_val + pb, nb);

            }

            fasp_mem_free(b_tmp);

            b_tmp = NULL;

#ifdef _OPENMP

        }

#endif

    } else {

        fasp_chkerr(ERROR_NUM_BLOCKS, __FUNCTION__);

    }

}


void fasp_smoother_dbsr_sor_order(

    dBSRmat* A, dvector* b, dvector* u, REAL* diaginv, INT* mark, REAL weight)

{

    // members of A

    const INT  ROW              = A->ROW;

    const INT  nb               = A->nb;

    const INT  nb2              = nb * nb;

    const INT* IA               = A->IA;

    const INT* JA               = A->JA;

    REAL*      val              = A->val;

    const REAL one_minus_weight = 1.0 - weight;


    // values of dvector b and u

    REAL* b_val = b->val;

    REAL* u_val = u->val;


    // local variables

    INT  i, j, k;

    INT  I, pb;

    REAL rhs = 0.0;


#ifdef _OPENMP

    // variables for OpenMP

    INT myid, mybegin, myend;

    INT nthreads = fasp_get_num_threads();

#endif


    if (nb == 1) {

#ifdef _OPENMP

        if (ROW > OPENMP_HOLDS) {

#pragma omp parallel for private(myid, mybegin, myend, I, i, rhs, k, j)

            for (myid = 0; myid < nthreads; myid++) {

                fasp_get_start_end(myid, nthreads, ROW, &mybegin, &myend);

                for (I = mybegin; I < myend; ++I) {

                    i   = mark[I];

                    rhs = b_val[i];

                    for (k = IA[i]; k < IA[i + 1]; ++k) {

                        j = JA[k];

                        if (j != i) rhs -= val[k] * u_val[j];

                    }

                    u_val[i] =

                        one_minus_weight * u_val[i] + weight * (rhs * diaginv[i]);

                }

            }

        } else {

#endif

            for (I = 0; I < ROW; ++I) {

                i   = mark[I];

                rhs = b_val[i];

                for (k = IA[i]; k < IA[i + 1]; ++k) {

                    j = JA[k];

                    if (j != i) rhs -= val[k] * u_val[j];

                }

                u_val[i] = one_minus_weight * u_val[i] + weight * (rhs * diaginv[i]);

            }

#ifdef _OPENMP

        }

#endif

    } else if (nb > 1) {

#ifdef _OPENMP

        if (ROW > OPENMP_HOLDS) {

            REAL* b_tmp = (REAL*)fasp_mem_calloc(nb * nthreads, sizeof(REAL));

#pragma omp parallel for private(myid, mybegin, myend, I, i, pb, k, j)

            for (myid = 0; myid < nthreads; myid++) {

                fasp_get_start_end(myid, nthreads, ROW, &mybegin, &myend);

                for (I = mybegin; I < myend; ++I) {

                    i  = mark[I];

                    pb = i * nb;

                    memcpy(b_tmp + myid * nb, b_val + pb, nb * sizeof(REAL));

                    for (k = IA[i]; k < IA[i + 1]; ++k) {

                        j = JA[k];

                        if (j != i)

                            fasp_blas_smat_ymAx(val + k * nb2, u_val + j * nb,

                                                b_tmp + myid * nb, nb);

                    }

                    fasp_blas_smat_aAxpby(weight, diaginv + nb2 * i, b_tmp + myid * nb,

                                          one_minus_weight, u_val + pb, nb);

                }

            }

            fasp_mem_free(b_tmp);

            b_tmp = NULL;

        } else {

#endif

            REAL* b_tmp = (REAL*)fasp_mem_calloc(nb, sizeof(REAL));

            for (I = 0; I < ROW; ++I) {

                i  = mark[I];

                pb = i * nb;

                memcpy(b_tmp, b_val + pb, nb * sizeof(REAL));

                for (k = IA[i]; k < IA[i + 1]; ++k) {

                    j = JA[k];

                    if (j != i)

                        fasp_blas_smat_ymAx(val + k * nb2, u_val + j * nb, b_tmp, nb);

                }

                fasp_blas_smat_aAxpby(weight, diaginv + nb2 * i, b_tmp,

                                      one_minus_weight, u_val + pb, nb);

            }

            fasp_mem_free(b_tmp);

            b_tmp = NULL;

#ifdef _OPENMP

        }

#endif

    } else {

        fasp_chkerr(ERROR_NUM_BLOCKS, __FUNCTION__);

    }

}


void fasp_smoother_dbsr_ilu(dBSRmat* A, dvector* b, dvector* x, void* data)

{

    ILU_data* iludata = (ILU_data*)data;

    const INT nb = iludata->nb, m = A->ROW * nb, memneed = 5 * m;


    REAL *xval = x->val, *bval = b->val;

    REAL* zr = iludata->work + 3 * m;

    REAL* z  = zr + m;


    double start, end;


    if (iludata->nwork < memneed) goto MEMERR;


    fasp_darray_cp(m, bval, zr);

    fasp_blas_dbsr_aAxpy(-1.0, A, xval, zr);


#ifdef _OPENMP


#if ILU_MC_OMP

    REAL* tz  = (REAL*)fasp_mem_calloc(A->ROW * A->nb, sizeof(REAL));

    REAL* tzr = (REAL*)fasp_mem_calloc(A->ROW * A->nb, sizeof(REAL));

    perm(A->ROW, A->nb, zr, iludata->jlevL, tzr);


    fasp_gettime(&start);

    fasp_precond_dbsr_ilu_mc_omp(tzr, tz, iludata);

    fasp_gettime(&end);


    invperm(A->ROW, A->nb, tz, iludata->jlevL, z);

    fasp_mem_free(tzr);

    tzr = NULL;

    fasp_mem_free(tz);

    tz = NULL;

#else

    fasp_gettime(&start);

    fasp_precond_dbsr_ilu_ls_omp(zr, z, iludata);

    fasp_gettime(&end);

#endif


    ilu_solve_time += end - start;


#else


    fasp_gettime(&start);

    fasp_precond_dbsr_ilu(zr, z, iludata);

    fasp_gettime(&end);

    ilu_solve_time += end - start;


#endif


    fasp_blas_darray_axpy(m, 1, z, xval);


    return;


MEMERR:

    printf("### ERROR: ILU needs %d memory, only %d available! [%s:%d]\n", memneed,

           iludata->nwork, __FILE__, __LINE__);

    fasp_chkerr(ERROR_ALLOC_MEM, __FUNCTION__);

}


/*---------------------------------*/

/*--      Private Functions      --*/

/*---------------------------------*/


#ifdef _OPENMP


#if ILU_MC_OMP


static inline void perm(const INT n, const INT nb, const REAL* x, const INT* p, REAL* y)

{

    INT i, j, indx, indy;


#ifdef _OPENMP

#pragma omp parallel for private(i, j, indx, indy)

#endif

    for (i = 0; i < n; ++i) {

        indx = p[i] * nb;

        indy = i * nb;

        for (j = 0; j < nb; ++j) {

            y[indy + j] = x[indx + j];

        }

    }

}


static inline void

invperm(const INT n, const INT nb, const REAL* x, const INT* p, REAL* y)

{

    INT i, j, indx, indy;


#ifdef _OPENMP

#pragma omp parallel for private(i, j, indx, indy)

#endif

    for (i = 0; i < n; ++i) {

        indx = i * nb;

        indy = p[i] * nb;

        for (j = 0; j < nb; ++j) {

            y[indy + j] = x[indx + j];

        }

    }

}


#endif // end of ILU_MC_OMP


#endif // end of _OPENMP


/*---------------------------------*/

/*--        End of File          --*/

/*---------------------------------*/

fasp_darray_cp
void fasp_darray_cp(const INT n, const REAL *x, REAL *y)
Copy an array to the other y=x.
Definition: AuxArray.c:210

fasp_mem_free
void fasp_mem_free(void *mem)
Free up previous allocated memory body and set pointer to NULL.
Definition: AuxMemory.c:152

fasp_mem_calloc
void * fasp_mem_calloc(const unsigned int size, const unsigned int type)
Allocate, initiate, and check memory.
Definition: AuxMemory.c:65

fasp_chkerr
void fasp_chkerr(const SHORT status, const char *fctname)
Check error status and print out error messages before quit.
Definition: AuxMessage.c:213

fasp_get_start_end
void fasp_get_start_end(const INT procid, const INT nprocs, const INT n, INT *start, INT *end)
Assign Load to each thread.
Definition: AuxThreads.c:93

fasp_gettime
void fasp_gettime(REAL *time)
Get system time.
Definition: AuxTiming.c:37

fasp_blas_darray_axpy
void fasp_blas_darray_axpy(const INT n, const REAL a, const REAL *x, REAL *y)
y = a*x + y
Definition: BlaArray.c:90

fasp_smat_inv
SHORT fasp_smat_inv(REAL *a, const INT n)
Compute the inverse matrix of a small full matrix a.
Definition: BlaSmallMatInv.c:603

fasp_blas_smat_aAxpby
void fasp_blas_smat_aAxpby(const REAL alpha, const REAL *A, const REAL *x, const REAL beta, REAL *y, const INT n)
Compute y:=alpha*A*x + beta*y.
Definition: BlaSmallMat.c:1140

fasp_blas_smat_mxv
void fasp_blas_smat_mxv(const REAL *a, const REAL *b, REAL *c, const INT n)
Compute the product of a small full matrix a and a array b, stored in c.
Definition: BlaSmallMat.c:238

fasp_blas_smat_ymAx
void fasp_blas_smat_ymAx(const REAL *A, const REAL *x, REAL *y, const INT n)
Compute y := y - Ax, where 'A' is a n*n dense matrix.
Definition: BlaSmallMat.c:1028

fasp_blas_dbsr_aAxpy
void fasp_blas_dbsr_aAxpy(const REAL alpha, const dBSRmat *A, const REAL *x, REAL *y)
Compute y := alpha*A*x + y.
Definition: BlaSpmvBSR.c:514

fasp_smoother_dbsr_gs_descend
void fasp_smoother_dbsr_gs_descend(dBSRmat *A, dvector *b, dvector *u, REAL *diaginv)
Gauss-Seidel relaxation in the descending order.
Definition: ItrSmootherBSR.c:683

fasp_smoother_dbsr_gs1
void fasp_smoother_dbsr_gs1(dBSRmat *A, dvector *b, dvector *u, INT order, INT *mark, REAL *diaginv)
Gauss-Seidel relaxation.
Definition: ItrSmootherBSR.c:520

fasp_smoother_dbsr_gs_order2
void fasp_smoother_dbsr_gs_order2(dBSRmat *A, dvector *b, dvector *u, INT *mark, REAL *work)
Gauss-Seidel relaxation in the user-defined order.
Definition: ItrSmootherBSR.c:888

fasp_smoother_dbsr_gs_descend1
void fasp_smoother_dbsr_gs_descend1(dBSRmat *A, dvector *b, dvector *u)
Gauss-Seidel relaxation in the descending order.
Definition: ItrSmootherBSR.c:751

fasp_smoother_dbsr_jacobi1
void fasp_smoother_dbsr_jacobi1(dBSRmat *A, dvector *b, dvector *u, REAL *diaginv)
Jacobi relaxation.
Definition: ItrSmootherBSR.c:263

fasp_smoother_dbsr_gs_ascend
void fasp_smoother_dbsr_gs_ascend(dBSRmat *A, dvector *b, dvector *u, REAL *diaginv)
Gauss-Seidel relaxation in the ascending order.
Definition: ItrSmootherBSR.c:552

fasp_smoother_dbsr_gs_ascend1
void fasp_smoother_dbsr_gs_ascend1(dBSRmat *A, dvector *b, dvector *u)
Gauss-Seidel relaxation in the ascending order.
Definition: ItrSmootherBSR.c:619

fasp_smoother_dbsr_sor_ascend
void fasp_smoother_dbsr_sor_ascend(dBSRmat *A, dvector *b, dvector *u, REAL *diaginv, REAL weight)
SOR relaxation in the ascending order.
Definition: ItrSmootherBSR.c:1115

fasp_smoother_dbsr_ilu
void fasp_smoother_dbsr_ilu(dBSRmat *A, dvector *b, dvector *x, void *data)
ILU method as the smoother in solving Au=b with multigrid method.
Definition: ItrSmootherBSR.c:1479

fasp_smoother_dbsr_jacobi
void fasp_smoother_dbsr_jacobi(dBSRmat *A, dvector *b, dvector *u)
Jacobi relaxation.
Definition: ItrSmootherBSR.c:59

fasp_smoother_dbsr_gs
void fasp_smoother_dbsr_gs(dBSRmat *A, dvector *b, dvector *u, INT order, INT *mark)
Gauss-Seidel relaxation.
Definition: ItrSmootherBSR.c:410

fasp_smoother_dbsr_sor1
void fasp_smoother_dbsr_sor1(dBSRmat *A, dvector *b, dvector *u, INT order, INT *mark, REAL *diaginv, REAL weight)
SOR relaxation.
Definition: ItrSmootherBSR.c:1075

ilu_solve_time
REAL ilu_solve_time
Definition: ItrSmootherBSR.c:39

fasp_smoother_dbsr_sor_order
void fasp_smoother_dbsr_sor_order(dBSRmat *A, dvector *b, dvector *u, REAL *diaginv, INT *mark, REAL weight)
SOR relaxation in the user-defined order.
Definition: ItrSmootherBSR.c:1358

fasp_smoother_dbsr_sor_descend
void fasp_smoother_dbsr_sor_descend(dBSRmat *A, dvector *b, dvector *u, REAL *diaginv, REAL weight)
SOR relaxation in the descending order.
Definition: ItrSmootherBSR.c:1234

fasp_smoother_dbsr_jacobi_setup
void fasp_smoother_dbsr_jacobi_setup(dBSRmat *A, REAL *diaginv)
Setup for jacobi relaxation, fetch the diagonal sub-block matrixes and make them inverse first.
Definition: ItrSmootherBSR.c:163

fasp_smoother_dbsr_gs_order1
void fasp_smoother_dbsr_gs_order1(dBSRmat *A, dvector *b, dvector *u, REAL *diaginv, INT *mark)
Gauss-Seidel relaxation in the user-defined order.
Definition: ItrSmootherBSR.c:816

fasp_smoother_dbsr_sor
void fasp_smoother_dbsr_sor(dBSRmat *A, dvector *b, dvector *u, INT order, INT *mark, REAL weight)
SOR relaxation.
Definition: ItrSmootherBSR.c:959

fasp_precond_dbsr_ilu_mc_omp
void fasp_precond_dbsr_ilu_mc_omp(REAL *r, REAL *z, void *data)
Multi-thread Parallel ILU preconditioner based on graph coloring.
Definition: PreBSR.c:618

fasp_precond_dbsr_ilu_ls_omp
void fasp_precond_dbsr_ilu_ls_omp(REAL *r, REAL *z, void *data)
Multi-thread Parallel ILU preconditioner based on level schedule strategy.
Definition: PreBSR.c:844

fasp_precond_dbsr_ilu
void fasp_precond_dbsr_ilu(REAL *r, REAL *z, void *data)
ILU preconditioner.
Definition: PreBSR.c:347

fasp.h
Main header file for the FASP project.

REAL
#define REAL
Definition: fasp.h:75

SHORT
#define SHORT
FASP integer and floating point numbers.
Definition: fasp.h:71

INT
#define INT
Definition: fasp.h:72

ERROR_NUM_BLOCKS
#define ERROR_NUM_BLOCKS
Definition: fasp_const.h:27

ASCEND
#define ASCEND
Definition: fasp_const.h:249

OPENMP_HOLDS
#define OPENMP_HOLDS
Definition: fasp_const.h:269

TRUE
#define TRUE
Definition of logic type.
Definition: fasp_const.h:61

FALSE
#define FALSE
Definition: fasp_const.h:62

DESCEND
#define DESCEND
Definition: fasp_const.h:250

ERROR_ALLOC_MEM
#define ERROR_ALLOC_MEM
Definition: fasp_const.h:30

ILU_data
Data for ILU setup.
Definition: fasp.h:651

ILU_data::nwork
INT nwork
work space size
Definition: fasp.h:678

ILU_data::nb
INT nb
block size for BSR type only
Definition: fasp.h:675

ILU_data::jlevL
INT * jlevL
mapping from row to color for lower triangle
Definition: fasp.h:713

ILU_data::work
REAL * work
work space
Definition: fasp.h:681

dBSRmat
Block sparse row storage matrix of REAL type.
Definition: fasp_block.h:34

dBSRmat::val
REAL * val
Definition: fasp_block.h:57

dBSRmat::nb
INT nb
dimension of each sub-block
Definition: fasp_block.h:46

dBSRmat::IA
INT * IA
integer array of row pointers, the size is ROW+1
Definition: fasp_block.h:60

dBSRmat::ROW
INT ROW
number of rows of sub-blocks in matrix A, M
Definition: fasp_block.h:37

dBSRmat::JA
INT * JA
Definition: fasp_block.h:64

dvector
Vector with n entries of REAL type.
Definition: fasp.h:354

dvector::val
REAL * val
actual vector entries
Definition: fasp.h:360