fasp/PreBSR_8c_source.html

#ifdef _OPENMP

#include <omp.h>

#endif


#include "fasp.h"

#include "fasp_functs.h"


/*---------------------------------*/

/*--  Declare Private Functions  --*/

/*---------------------------------*/


#include "PreMGUtil.inl"


/*---------------------------------*/

/*--      Public Functions       --*/

/*---------------------------------*/


void fasp_precond_dbsr_diag(REAL* r, REAL* z, void* data)

{

    precond_diag_bsr* diag = (precond_diag_bsr*)data;

    const INT         nb   = diag->nb;


    switch (nb) {


        case 2:

            fasp_precond_dbsr_diag_nc2(r, z, diag);

            break;

        case 3:

            fasp_precond_dbsr_diag_nc3(r, z, diag);

            break;


        case 4:

            fasp_precond_dbsr_diag_nc4(r, z, diag);

            break;


        case 5:

            fasp_precond_dbsr_diag_nc5(r, z, diag);

            break;


        case 7:

            fasp_precond_dbsr_diag_nc7(r, z, diag);

            break;


        default:

            {

                REAL*     diagptr = diag->diag.val;

                const INT nb2     = nb * nb;

                const INT m       = diag->diag.row / nb2;

                INT       i;


#ifdef _OPENMP

                if (m > OPENMP_HOLDS) {

                    INT myid, mybegin, myend;

                    INT nthreads = fasp_get_num_threads();

#pragma omp parallel for private(myid, mybegin, myend, i)

                    for (myid = 0; myid < nthreads; myid++) {

                        fasp_get_start_end(myid, nthreads, m, &mybegin, &myend);

                        for (i = mybegin; i < myend; ++i) {

                            fasp_blas_smat_mxv(&(diagptr[i * nb2]), &(r[i * nb]),

                                               &(z[i * nb]), nb);

                        }

                    }

                } else {

#endif

                    for (i = 0; i < m; ++i) {

                        fasp_blas_smat_mxv(&(diagptr[i * nb2]), &(r[i * nb]),

                                           &(z[i * nb]), nb);

                    }

#ifdef _OPENMP

                }

#endif

                break;

            }

    }

}


void fasp_precond_dbsr_diag_nc2(REAL* r, REAL* z, void* data)

{

    precond_diag_bsr* diag    = (precond_diag_bsr*)data;

    REAL*             diagptr = diag->diag.val;


    INT       i;

    const INT m = diag->diag.row / 4;


#ifdef _OPENMP

    if (m > OPENMP_HOLDS) {

        INT myid, mybegin, myend;

        INT nthreads = fasp_get_num_threads();

#pragma omp parallel for private(myid, mybegin, myend, i)

        for (myid = 0; myid < nthreads; myid++) {

            fasp_get_start_end(myid, nthreads, m, &mybegin, &myend);

            for (i = mybegin; i < myend; ++i) {

                fasp_blas_smat_mxv_nc2(&(diagptr[i * 4]), &(r[i * 2]), &(z[i * 2]));

            }

        }

    } else {

#endif

        for (i = 0; i < m; ++i) {

            fasp_blas_smat_mxv_nc2(&(diagptr[i * 4]), &(r[i * 2]), &(z[i * 2]));

        }

#ifdef _OPENMP

    }

#endif

}


void fasp_precond_dbsr_diag_nc3(REAL* r, REAL* z, void* data)

{

    precond_diag_bsr* diag    = (precond_diag_bsr*)data;

    REAL*             diagptr = diag->diag.val;


    const INT m = diag->diag.row / 9;

    INT       i;


#ifdef _OPENMP

    if (m > OPENMP_HOLDS) {

        INT myid, mybegin, myend;

        INT nthreads = fasp_get_num_threads();

#pragma omp parallel for private(myid, mybegin, myend, i)

        for (myid = 0; myid < nthreads; myid++) {

            fasp_get_start_end(myid, nthreads, m, &mybegin, &myend);

            for (i = mybegin; i < myend; ++i) {

                fasp_blas_smat_mxv_nc3(&(diagptr[i * 9]), &(r[i * 3]), &(z[i * 3]));

            }

        }

    } else {

#endif

        for (i = 0; i < m; ++i) {

            fasp_blas_smat_mxv_nc3(&(diagptr[i * 9]), &(r[i * 3]), &(z[i * 3]));

        }

#ifdef _OPENMP

    }

#endif

}


void fasp_precond_dbsr_diag_nc4(REAL* r, REAL* z, void* data)

{

    precond_diag_bsr* diag    = (precond_diag_bsr*)data;

    REAL*             diagptr = diag->diag.val;


    const INT m = diag->diag.row / 16;

    INT       i;


#ifdef _OPENMP

    if (m > OPENMP_HOLDS) {

        INT myid, mybegin, myend;

        INT nthreads = fasp_get_num_threads();

#pragma omp parallel for private(myid, mybegin, myend, i)

        for (myid = 0; myid < nthreads; myid++) {

            fasp_get_start_end(myid, nthreads, m, &mybegin, &myend);

            for (i = mybegin; i < myend; ++i) {

                fasp_blas_smat_mxv_nc4(&(diagptr[i * 16]), &(r[i * 4]), &(z[i * 4]));

            }

        }

    } else {

#endif

        for (i = 0; i < m; ++i) {

            fasp_blas_smat_mxv_nc4(&(diagptr[i * 16]), &(r[i * 4]), &(z[i * 4]));

        }

#ifdef _OPENMP

    }

#endif

}


void fasp_precond_dbsr_diag_nc5(REAL* r, REAL* z, void* data)

{

    precond_diag_bsr* diag    = (precond_diag_bsr*)data;

    REAL*             diagptr = diag->diag.val;


    const INT m = diag->diag.row / 25;

    INT       i;


#ifdef _OPENMP

    if (m > OPENMP_HOLDS) {

        INT myid, mybegin, myend;

        INT nthreads = fasp_get_num_threads();

#pragma omp parallel for private(myid, mybegin, myend, i)

        for (myid = 0; myid < nthreads; myid++) {

            fasp_get_start_end(myid, nthreads, m, &mybegin, &myend);

            for (i = mybegin; i < myend; ++i) {

                fasp_blas_smat_mxv_nc5(&(diagptr[i * 25]), &(r[i * 5]), &(z[i * 5]));

            }

        }

    } else {

#endif

        for (i = 0; i < m; ++i) {

            fasp_blas_smat_mxv_nc5(&(diagptr[i * 25]), &(r[i * 5]), &(z[i * 5]));

        }

#ifdef _OPENMP

    }

#endif

}


void fasp_precond_dbsr_diag_nc7(REAL* r, REAL* z, void* data)

{

    precond_diag_bsr* diag    = (precond_diag_bsr*)data;

    REAL*             diagptr = diag->diag.val;


    const INT m = diag->diag.row / 49;

    INT       i;


#ifdef _OPENMP

    if (m > OPENMP_HOLDS) {

        INT myid, mybegin, myend;

        INT nthreads = fasp_get_num_threads();

#pragma omp parallel for private(myid, mybegin, myend, i)

        for (myid = 0; myid < nthreads; myid++) {

            fasp_get_start_end(myid, nthreads, m, &mybegin, &myend);

            for (i = mybegin; i < myend; ++i) {

                fasp_blas_smat_mxv_nc7(&(diagptr[i * 49]), &(r[i * 7]), &(z[i * 7]));

            }

        }

    } else {

#endif

        for (i = 0; i < m; ++i) {

            fasp_blas_smat_mxv_nc7(&(diagptr[i * 49]), &(r[i * 7]), &(z[i * 7]));

        }

#ifdef _OPENMP

    }

#endif

}


void fasp_precond_dbsr_ilu(REAL* r, REAL* z, void* data)

{

    const ILU_data* iludata = (ILU_data*)data;

    const INT       m = iludata->row, mm1 = m - 1, mm2 = m - 2, memneed = 2 * m;

    const INT       nb = iludata->nb, nb2 = nb * nb, size = m * nb;


    INT*  ijlu = iludata->ijlu;

    REAL* lu   = iludata->luval;


    INT   ib, ibstart, ibstart1;

    INT   i, j, jj, begin_row, end_row;

    REAL *zz, *zr, *mult;


    if (iludata->nwork < memneed) {

        printf("### ERROR: Need %d memory, only %d available!\n", memneed,

               iludata->nwork);

        fasp_chkerr(ERROR_ALLOC_MEM, __FUNCTION__);

    }


    zz   = iludata->work;

    zr   = zz + size;

    mult = zr + size;


    memcpy(zr, r, size * sizeof(REAL));


    switch (nb) {


        case 1:


            // forward sweep: solve unit lower matrix equation L*zz=zr

            zz[0] = zr[0];

            for (i = 1; i <= mm1; ++i) {

                begin_row = ijlu[i];

                end_row   = ijlu[i + 1] - 1;

                for (j = begin_row; j <= end_row; ++j) {

                    jj = ijlu[j];

                    if (jj < i)

                        zr[i] -= lu[j] * zz[jj];

                    else

                        break;

                }

                zz[i] = zr[i];

            }


            // backward sweep: solve upper matrix equation U*z=zz

            z[mm1] = zz[mm1] * lu[mm1];

            for (i = mm2; i >= 0; i--) {

                begin_row = ijlu[i];

                end_row   = ijlu[i + 1] - 1;

                for (j = end_row; j >= begin_row; j--) {

                    jj = ijlu[j];

                    if (jj > i)

                        zz[i] -= lu[j] * z[jj];

                    else

                        break;

                }

                z[i] = zz[i] * lu[i];

            }


            break; // end (if nb==1)


        case 3:


            // forward sweep: solve unit lower matrix equation L*zz=zr

            zz[0] = zr[0];

            zz[1] = zr[1];

            zz[2] = zr[2];


            for (i = 1; i <= mm1; ++i) {

                begin_row = ijlu[i];

                end_row   = ijlu[i + 1] - 1;

                ibstart   = i * nb;

                for (j = begin_row; j <= end_row; ++j) {

                    jj = ijlu[j];

                    if (jj < i) {

                        fasp_blas_smat_mxv_nc3(&(lu[j * nb2]), &(zz[jj * nb]), mult);

                        for (ib = 0; ib < nb; ++ib) zr[ibstart + ib] -= mult[ib];

                    } else

                        break;

                }


                zz[ibstart]     = zr[ibstart];

                zz[ibstart + 1] = zr[ibstart + 1];

                zz[ibstart + 2] = zr[ibstart + 2];

            }


            // backward sweep: solve upper matrix equation U*z=zz

            ibstart  = mm1 * nb2;

            ibstart1 = mm1 * nb;

            fasp_blas_smat_mxv_nc3(&(lu[ibstart]), &(zz[ibstart1]), &(z[ibstart1]));


            for (i = mm2; i >= 0; i--) {

                begin_row = ijlu[i];

                end_row   = ijlu[i + 1] - 1;

                ibstart   = i * nb2;

                ibstart1  = i * nb;

                for (j = end_row; j >= begin_row; j--) {

                    jj = ijlu[j];

                    if (jj > i) {

                        fasp_blas_smat_mxv_nc3(&(lu[j * nb2]), &(z[jj * nb]), mult);

                        for (ib = 0; ib < nb; ++ib) zz[ibstart1 + ib] -= mult[ib];

                    }


                    else

                        break;

                }


                fasp_blas_smat_mxv_nc3(&(lu[ibstart]), &(zz[ibstart1]), &(z[ibstart1]));

            }


            break; // end (if nb=3)


        case 5:


            // forward sweep: solve unit lower matrix equation L*zz=zr

            fasp_darray_cp(nb, &(zr[0]), &(zz[0]));


            for (i = 1; i <= mm1; ++i) {

                begin_row = ijlu[i];

                end_row   = ijlu[i + 1] - 1;

                ibstart   = i * nb;

                for (j = begin_row; j <= end_row; ++j) {

                    jj = ijlu[j];

                    if (jj < i) {

                        fasp_blas_smat_mxv_nc5(&(lu[j * nb2]), &(zz[jj * nb]), mult);

                        for (ib = 0; ib < nb; ++ib) zr[ibstart + ib] -= mult[ib];

                    } else

                        break;

                }


                fasp_darray_cp(nb, &(zr[ibstart]), &(zz[ibstart]));

            }


            // backward sweep: solve upper matrix equation U*z=zz

            ibstart  = mm1 * nb2;

            ibstart1 = mm1 * nb;

            fasp_blas_smat_mxv_nc5(&(lu[ibstart]), &(zz[ibstart1]), &(z[ibstart1]));


            for (i = mm2; i >= 0; i--) {

                begin_row = ijlu[i];

                end_row   = ijlu[i + 1] - 1;

                ibstart   = i * nb2;

                ibstart1  = i * nb;

                for (j = end_row; j >= begin_row; j--) {

                    jj = ijlu[j];

                    if (jj > i) {

                        fasp_blas_smat_mxv_nc5(&(lu[j * nb2]), &(z[jj * nb]), mult);

                        for (ib = 0; ib < nb; ++ib) zz[ibstart1 + ib] -= mult[ib];

                    }


                    else

                        break;

                }


                fasp_blas_smat_mxv_nc5(&(lu[ibstart]), &(zz[ibstart1]), &(z[ibstart1]));

            }


            break; // end (if nb==5)


        case 7:


            // forward sweep: solve unit lower matrix equation L*zz=zr

            fasp_darray_cp(nb, &(zr[0]), &(zz[0]));


            for (i = 1; i <= mm1; ++i) {

                begin_row = ijlu[i];

                end_row   = ijlu[i + 1] - 1;

                ibstart   = i * nb;

                for (j = begin_row; j <= end_row; ++j) {

                    jj = ijlu[j];

                    if (jj < i) {

                        fasp_blas_smat_mxv_nc7(&(lu[j * nb2]), &(zz[jj * nb]), mult);

                        for (ib = 0; ib < nb; ++ib) zr[ibstart + ib] -= mult[ib];

                    } else

                        break;

                }


                fasp_darray_cp(nb, &(zr[ibstart]), &(zz[ibstart]));

            }


            // backward sweep: solve upper matrix equation U*z=zz

            ibstart  = mm1 * nb2;

            ibstart1 = mm1 * nb;

            fasp_blas_smat_mxv_nc7(&(lu[ibstart]), &(zz[ibstart1]), &(z[ibstart1]));


            for (i = mm2; i >= 0; i--) {

                begin_row = ijlu[i];

                end_row   = ijlu[i + 1] - 1;

                ibstart   = i * nb2;

                ibstart1  = i * nb;

                for (j = end_row; j >= begin_row; j--) {

                    jj = ijlu[j];

                    if (jj > i) {

                        fasp_blas_smat_mxv_nc7(&(lu[j * nb2]), &(z[jj * nb]), mult);

                        for (ib = 0; ib < nb; ++ib) zz[ibstart1 + ib] -= mult[ib];

                    }


                    else

                        break;

                }


                fasp_blas_smat_mxv_nc7(&(lu[ibstart]), &(zz[ibstart1]), &(z[ibstart1]));

            }


            break; // end (if nb==7)


        default:


            // forward sweep: solve unit lower matrix equation L*zz=zr

            fasp_darray_cp(nb, &(zr[0]), &(zz[0]));


            for (i = 1; i <= mm1; ++i) {

                begin_row = ijlu[i];

                end_row   = ijlu[i + 1] - 1;

                ibstart   = i * nb;

                for (j = begin_row; j <= end_row; ++j) {

                    jj = ijlu[j];

                    if (jj < i) {

                        fasp_blas_smat_mxv(&(lu[j * nb2]), &(zz[jj * nb]), mult, nb);

                        for (ib = 0; ib < nb; ++ib) zr[ibstart + ib] -= mult[ib];

                    } else

                        break;

                }


                fasp_darray_cp(nb, &(zr[ibstart]), &(zz[ibstart]));

            }


            // backward sweep: solve upper matrix equation U*z=zz

            ibstart  = mm1 * nb2;

            ibstart1 = mm1 * nb;

            fasp_blas_smat_mxv(&(lu[ibstart]), &(zz[ibstart1]), &(z[ibstart1]), nb);


            for (i = mm2; i >= 0; i--) {

                begin_row = ijlu[i];

                end_row   = ijlu[i + 1] - 1;

                ibstart   = i * nb2;

                ibstart1  = i * nb;

                for (j = end_row; j >= begin_row; j--) {

                    jj = ijlu[j];

                    if (jj > i) {

                        fasp_blas_smat_mxv(&(lu[j * nb2]), &(z[jj * nb]), mult, nb);

                        for (ib = 0; ib < nb; ++ib) zz[ibstart1 + ib] -= mult[ib];

                    }


                    else

                        break;

                }


                fasp_blas_smat_mxv(&(lu[ibstart]), &(zz[ibstart1]), &(z[ibstart1]), nb);

            }


            break; // end everything else

    }


    return;

}


void fasp_precond_dbsr_ilu_mc_omp(REAL* r, REAL* z, void* data)

{

#ifdef _OPENMP

    const ILU_data* iludata = (ILU_data*)data;

    const INT       m = iludata->row, memneed = 2 * m;

    const INT       nb = iludata->nb, nb2 = nb * nb, size = m * nb;


    INT*  ijlu    = iludata->ijlu;

    REAL* lu      = iludata->luval;

    INT   ncolors = iludata->nlevL;

    INT*  ic      = iludata->ilevL;


    INT   ib, ibstart, ibstart1;

    INT   i, j, jj, k, begin_row, end_row;

    REAL *zz, *zr, *mult;


    if (iludata->nwork < memneed) {

        printf("### ERROR: Need %d memory, only %d available!\n", memneed,

               iludata->nwork);

        fasp_chkerr(ERROR_ALLOC_MEM, __FUNCTION__);

    }


    zz = iludata->work;

    zr = zz + size;


    memcpy(zr, r, size * sizeof(REAL));


    switch (nb) {


        case 1:

            // forward sweep: solve unit lower matrix equation L*zz=zr

            for (k = 0; k < ncolors; ++k) {

#pragma omp parallel for private(i, begin_row, end_row, j, jj)

                for (i = ic[k]; i < ic[k + 1]; ++i) {

                    begin_row = ijlu[i];

                    end_row   = ijlu[i + 1] - 1;

                    for (j = begin_row; j <= end_row; ++j) {

                        jj = ijlu[j];

                        if (jj < i)

                            zr[i] -= lu[j] * zz[jj];

                        else

                            break;

                    }

                    zz[i] = zr[i];

                }

            }

            // backward sweep: solve upper matrix equation U*z=zz

            for (k = ncolors - 1; k >= 0; k--) {

#pragma omp parallel for private(i, begin_row, end_row, j, jj)

                for (i = ic[k + 1] - 1; i >= ic[k]; i--) {

                    begin_row = ijlu[i];

                    end_row   = ijlu[i + 1] - 1;

                    for (j = end_row; j >= begin_row; j--) {

                        jj = ijlu[j];

                        if (jj > i)

                            zz[i] -= lu[j] * z[jj];

                        else

                            break;

                    }

                    z[i] = zz[i] * lu[i];

                }

            }


            break; // end (if nb==1)


        case 2:


            for (k = 0; k < ncolors; ++k) {

#pragma omp parallel private(i, begin_row, end_row, ibstart, j, jj, ib, mult)

                {

                    mult = (REAL*)fasp_mem_calloc(nb, sizeof(REAL));

#pragma omp for

                    for (i = ic[k]; i < ic[k + 1]; ++i) {

                        begin_row = ijlu[i];

                        end_row   = ijlu[i + 1] - 1;

                        ibstart   = i * nb;

                        for (j = begin_row; j <= end_row; ++j) {

                            jj = ijlu[j];

                            if (jj < i) {

                                fasp_blas_smat_mxv_nc2(&(lu[j * nb2]), &(zz[jj * nb]),

                                                       mult);

                                for (ib = 0; ib < nb; ++ib)

                                    zr[ibstart + ib] -= mult[ib];

                            } else

                                break;

                        }


                        zz[ibstart]     = zr[ibstart];

                        zz[ibstart + 1] = zr[ibstart + 1];

                    }


                    fasp_mem_free(mult);

                    mult = NULL;

                }

            }


            for (k = ncolors - 1; k >= 0; k--) {

#pragma omp parallel private(i, begin_row, end_row, ibstart, ibstart1, j, jj, ib, mult)

                {

                    mult = (REAL*)fasp_mem_calloc(nb, sizeof(REAL));

#pragma omp for

                    for (i = ic[k + 1] - 1; i >= ic[k]; i--) {

                        begin_row = ijlu[i];

                        end_row   = ijlu[i + 1] - 1;

                        ibstart   = i * nb2;

                        ibstart1  = i * nb;

                        for (j = end_row; j >= begin_row; j--) {

                            jj = ijlu[j];

                            if (jj > i) {

                                fasp_blas_smat_mxv_nc2(&(lu[j * nb2]), &(z[jj * nb]),

                                                       mult);

                                for (ib = 0; ib < nb; ++ib)

                                    zz[ibstart1 + ib] -= mult[ib];

                            }


                            else

                                break;

                        }


                        fasp_blas_smat_mxv_nc2(&(lu[ibstart]), &(zz[ibstart1]),

                                               &(z[ibstart1]));

                    }


                    fasp_mem_free(mult);

                    mult = NULL;

                }

            }


            break; // end (if nb=2)

        case 3:


            for (k = 0; k < ncolors; ++k) {

#pragma omp parallel private(i, begin_row, end_row, ibstart, j, jj, ib, mult)

                {

                    mult = (REAL*)fasp_mem_calloc(nb, sizeof(REAL));

#pragma omp for

                    for (i = ic[k]; i < ic[k + 1]; ++i) {

                        begin_row = ijlu[i];

                        end_row   = ijlu[i + 1] - 1;

                        ibstart   = i * nb;

                        for (j = begin_row; j <= end_row; ++j) {

                            jj = ijlu[j];

                            if (jj < i) {

                                fasp_blas_smat_mxv_nc3(&(lu[j * nb2]), &(zz[jj * nb]),

                                                       mult);

                                for (ib = 0; ib < nb; ++ib)

                                    zr[ibstart + ib] -= mult[ib];

                            } else

                                break;

                        }


                        zz[ibstart]     = zr[ibstart];

                        zz[ibstart + 1] = zr[ibstart + 1];

                        zz[ibstart + 2] = zr[ibstart + 2];

                    }


                    fasp_mem_free(mult);

                    mult = NULL;

                }

            }


            for (k = ncolors - 1; k >= 0; k--) {

#pragma omp parallel private(i, begin_row, end_row, ibstart, ibstart1, j, jj, ib, mult)

                {

                    mult = (REAL*)fasp_mem_calloc(nb, sizeof(REAL));

#pragma omp for

                    for (i = ic[k + 1] - 1; i >= ic[k]; i--) {

                        begin_row = ijlu[i];

                        end_row   = ijlu[i + 1] - 1;

                        ibstart   = i * nb2;

                        ibstart1  = i * nb;

                        for (j = end_row; j >= begin_row; j--) {

                            jj = ijlu[j];

                            if (jj > i) {

                                fasp_blas_smat_mxv_nc3(&(lu[j * nb2]), &(z[jj * nb]),

                                                       mult);

                                for (ib = 0; ib < nb; ++ib)

                                    zz[ibstart1 + ib] -= mult[ib];

                            }


                            else

                                break;

                        }


                        fasp_blas_smat_mxv_nc3(&(lu[ibstart]), &(zz[ibstart1]),

                                               &(z[ibstart1]));

                    }


                    fasp_mem_free(mult);

                    mult = NULL;

                }

            }


            break; // end (if nb=3)


        default:

            {

                if (nb > 3) {

                    printf("### ERROR: Multi-thread Parallel ILU for %d components \

                       has not yet been implemented!!!",

                           nb);

                    fasp_chkerr(ERROR_UNKNOWN, __FUNCTION__);

                }

                break;

            }

    }


    return;

#endif

}


void fasp_precond_dbsr_ilu_ls_omp(REAL* r, REAL* z, void* data)

{

#ifdef _OPENMP

    const ILU_data* iludata = (ILU_data*)data;

    const INT       m = iludata->row, memneed = 2 * m;

    const INT       nb = iludata->nb, nb2 = nb * nb, size = m * nb;


    INT*  ijlu  = iludata->ijlu;

    REAL* lu    = iludata->luval;

    INT   nlevL = iludata->nlevL;

    INT*  ilevL = iludata->ilevL;

    INT*  jlevL = iludata->jlevL;

    INT   nlevU = iludata->nlevU;

    INT*  ilevU = iludata->ilevU;

    INT*  jlevU = iludata->jlevU;


    INT   ib, ibstart, ibstart1;

    INT   i, ii, j, jj, k, begin_row, end_row;

    REAL *zz, *zr, *mult;


    if (iludata->nwork < memneed) {

        printf("### ERROR: Need %d memory, only %d available!\n", memneed,

               iludata->nwork);

        fasp_chkerr(ERROR_ALLOC_MEM, __FUNCTION__);

    }


    zz = iludata->work;

    zr = zz + size;

    // mult = zr + size;


    memcpy(zr, r, size * sizeof(REAL));


    switch (nb) {


        case 1:

            // forward sweep: solve unit lower matrix equation L*zz=zr

            for (k = 0; k < nlevL; ++k) {

#pragma omp parallel for private(i, ii, begin_row, end_row, j, jj)

                for (ii = ilevL[k]; ii < ilevL[k + 1]; ++ii) {

                    i         = jlevL[ii];

                    begin_row = ijlu[i];

                    end_row   = ijlu[i + 1] - 1;

                    for (j = begin_row; j <= end_row; ++j) {

                        jj = ijlu[j];

                        if (jj < i)

                            zr[i] -= lu[j] * zz[jj];

                        else

                            break;

                    }

                    zz[i] = zr[i];

                }

            }

            // backward sweep: solve upper matrix equation U*z=zz

            for (k = 0; k < nlevU; k++) {

#pragma omp parallel for private(i, ii, begin_row, end_row, j, jj)

                for (ii = ilevU[k + 1] - 1; ii >= ilevU[k]; ii--) {

                    i         = jlevU[ii];

                    begin_row = ijlu[i];

                    end_row   = ijlu[i + 1] - 1;

                    for (j = end_row; j >= begin_row; j--) {

                        jj = ijlu[j];

                        if (jj > i)

                            zz[i] -= lu[j] * z[jj];

                        else

                            break;

                    }

                    z[i] = zz[i] * lu[i];

                }

            }


            break; // end (if nb==1)


        case 2:


            for (k = 0; k < nlevL; ++k) {

#pragma omp parallel private(i, ii, begin_row, end_row, ibstart, j, jj, ib, mult)

                {

                    mult = (REAL*)fasp_mem_calloc(nb, sizeof(REAL));

#pragma omp for

                    for (ii = ilevL[k]; ii < ilevL[k + 1]; ++ii) {

                        i         = jlevL[ii];

                        begin_row = ijlu[i];

                        end_row   = ijlu[i + 1] - 1;

                        ibstart   = i * nb;

                        for (j = begin_row; j <= end_row; ++j) {

                            jj = ijlu[j];

                            if (jj < i) {

                                fasp_blas_smat_mxv_nc2(&(lu[j * nb2]), &(zz[jj * nb]),

                                                       mult);

                                for (ib = 0; ib < nb; ++ib)

                                    zr[ibstart + ib] -= mult[ib];

                            } else

                                break;

                        }


                        zz[ibstart]     = zr[ibstart];

                        zz[ibstart + 1] = zr[ibstart + 1];

                    }


                    fasp_mem_free(mult);

                    mult = NULL;

                }

            }


            for (k = 0; k < nlevU; k++) {

#pragma omp parallel private(i, ii, begin_row, end_row, ibstart, ibstart1, j, jj, ib,  \

                                 mult)

                {

                    mult = (REAL*)fasp_mem_calloc(nb, sizeof(REAL));

#pragma omp for

                    for (ii = ilevU[k + 1] - 1; ii >= ilevU[k]; ii--) {

                        i         = jlevU[ii];

                        begin_row = ijlu[i];

                        end_row   = ijlu[i + 1] - 1;

                        ibstart   = i * nb2;

                        ibstart1  = i * nb;

                        for (j = end_row; j >= begin_row; j--) {

                            jj = ijlu[j];

                            if (jj > i) {

                                fasp_blas_smat_mxv_nc2(&(lu[j * nb2]), &(z[jj * nb]),

                                                       mult);

                                for (ib = 0; ib < nb; ++ib)

                                    zz[ibstart1 + ib] -= mult[ib];

                            }


                            else

                                break;

                        }


                        fasp_blas_smat_mxv_nc2(&(lu[ibstart]), &(zz[ibstart1]),

                                               &(z[ibstart1]));

                    }


                    fasp_mem_free(mult);

                    mult = NULL;

                }

            }


            break; // end (if nb=2)

        case 3:


            for (k = 0; k < nlevL; ++k) {

#pragma omp parallel private(i, ii, begin_row, end_row, ibstart, j, jj, ib, mult)

                {

                    mult = (REAL*)fasp_mem_calloc(nb, sizeof(REAL));

#pragma omp for

                    for (ii = ilevL[k]; ii < ilevL[k + 1]; ++ii) {

                        i         = jlevL[ii];

                        begin_row = ijlu[i];

                        end_row   = ijlu[i + 1] - 1;

                        ibstart   = i * nb;

                        for (j = begin_row; j <= end_row; ++j) {

                            jj = ijlu[j];

                            if (jj < i) {

                                fasp_blas_smat_mxv_nc3(&(lu[j * nb2]), &(zz[jj * nb]),

                                                       mult);

                                for (ib = 0; ib < nb; ++ib)

                                    zr[ibstart + ib] -= mult[ib];

                            } else

                                break;

                        }


                        zz[ibstart]     = zr[ibstart];

                        zz[ibstart + 1] = zr[ibstart + 1];

                        zz[ibstart + 2] = zr[ibstart + 2];

                    }


                    fasp_mem_free(mult);

                    mult = NULL;

                }

            }


            for (k = 0; k < nlevU; k++) {

#pragma omp parallel private(i, ii, begin_row, end_row, ibstart, ibstart1, j, jj, ib,  \

                                 mult)

                {

                    mult = (REAL*)fasp_mem_calloc(nb, sizeof(REAL));

#pragma omp for

                    for (ii = ilevU[k + 1] - 1; ii >= ilevU[k]; ii--) {

                        i         = jlevU[ii];

                        begin_row = ijlu[i];

                        end_row   = ijlu[i + 1] - 1;

                        ibstart   = i * nb2;

                        ibstart1  = i * nb;

                        for (j = end_row; j >= begin_row; j--) {

                            jj = ijlu[j];

                            if (jj > i) {

                                fasp_blas_smat_mxv_nc3(&(lu[j * nb2]), &(z[jj * nb]),

                                                       mult);

                                for (ib = 0; ib < nb; ++ib)

                                    zz[ibstart1 + ib] -= mult[ib];

                            }


                            else

                                break;

                        }


                        fasp_blas_smat_mxv_nc3(&(lu[ibstart]), &(zz[ibstart1]),

                                               &(z[ibstart1]));

                    }


                    fasp_mem_free(mult);

                    mult = NULL;

                }

            }


            break; // end (if nb=3)


        default:

            {


                for (k = 0; k < nlevL; ++k) {

#pragma omp parallel private(i, ii, begin_row, end_row, ibstart, j, jj, ib, mult)

                    {

                        mult = (REAL*)fasp_mem_calloc(nb, sizeof(REAL));

#pragma omp for

                        for (ii = ilevL[k]; ii < ilevL[k + 1]; ++ii) {

                            i         = jlevL[ii];

                            begin_row = ijlu[i];

                            end_row   = ijlu[i + 1] - 1;

                            ibstart   = i * nb;

                            for (j = begin_row; j <= end_row; ++j) {

                                jj = ijlu[j];

                                if (jj < i) {

                                    fasp_blas_smat_mxv(&(lu[j * nb2]), &(zz[jj * nb]),

                                                       mult, nb);

                                    for (ib = 0; ib < nb; ++ib)

                                        zr[ibstart + ib] -= mult[ib];

                                } else

                                    break;

                            }


                            for (j = 0; j < nb; j++)

                                zz[ibstart + j] =

                                    zr[ibstart + j]; // Li Zhao, 09/19/2022

                        }


                        fasp_mem_free(mult);

                        mult = NULL;

                    }

                }


                for (k = 0; k < nlevU; k++) {

#pragma omp parallel private(i, ii, begin_row, end_row, ibstart, ibstart1, j, jj, ib,  \

                                 mult)

                    {

                        mult = (REAL*)fasp_mem_calloc(nb, sizeof(REAL));

#pragma omp for

                        for (ii = ilevU[k + 1] - 1; ii >= ilevU[k]; ii--) {

                            i         = jlevU[ii];

                            begin_row = ijlu[i];

                            end_row   = ijlu[i + 1] - 1;

                            ibstart   = i * nb2;

                            ibstart1  = i * nb;

                            for (j = end_row; j >= begin_row; j--) {

                                jj = ijlu[j];

                                if (jj > i) {

                                    fasp_blas_smat_mxv(&(lu[j * nb2]), &(z[jj * nb]),

                                                       mult, nb);

                                    for (ib = 0; ib < nb; ++ib)

                                        zz[ibstart1 + ib] -= mult[ib];

                                }


                                else

                                    break;

                            }


                            fasp_blas_smat_mxv(&(lu[ibstart]), &(zz[ibstart1]),

                                               &(z[ibstart1]), nb);

                        }


                        fasp_mem_free(mult);

                        mult = NULL;

                    }

                }


                break;


                /*

                if (nb > 3) {

                    printf("### ERROR: Multi-thread Parallel ILU for %d components \

                           has not yet been implemented!!!", nb);

                    fasp_chkerr(ERROR_UNKNOWN, __FUNCTION__);

                }

                break;

                */

            }

    }


    return;

#endif

}


void fasp_precond_dbsr_amg(REAL* r, REAL* z, void* data)

{

    precond_data_bsr* predata = (precond_data_bsr*)data;

    const INT         row     = predata->mgl_data[0].A.ROW;

    const INT         nb      = predata->mgl_data[0].A.nb;

    const INT         maxit   = predata->maxit;

    const INT         m       = row * nb;


    INT i;


    AMG_param amgparam;

    fasp_param_amg_init(&amgparam);

    amgparam.cycle_type       = predata->cycle_type;

    amgparam.smoother         = predata->smoother;

    amgparam.smooth_order     = predata->smooth_order;

    amgparam.presmooth_iter   = predata->presmooth_iter;

    amgparam.postsmooth_iter  = predata->postsmooth_iter;

    amgparam.relaxation       = predata->relaxation;

    amgparam.coarse_scaling   = predata->coarse_scaling;

    amgparam.tentative_smooth = predata->tentative_smooth;

    amgparam.ILU_levels       = predata->mgl_data->ILU_levels;


    AMG_data_bsr* mgl = predata->mgl_data;

    mgl->b.row        = m;

    fasp_darray_cp(m, r, mgl->b.val); // residual is an input

    mgl->x.row = m;

    fasp_dvec_set(m, &mgl->x, 0.0);


    for (i = maxit; i--;) fasp_solver_mgcycle_bsr(mgl, &amgparam);


    fasp_darray_cp(m, mgl->x.val, z);

}


void fasp_precond_dbsr_amg_nk(REAL* r, REAL* z, void* data)

{

    precond_data_bsr* predata = (precond_data_bsr*)data;

    const INT         row     = predata->mgl_data[0].A.ROW;

    const INT         nb      = predata->mgl_data[0].A.nb;

    const INT         maxit   = predata->maxit;

    const INT         m       = row * nb;


    INT i;


    dCSRmat* A_nk = predata->A_nk;

    dCSRmat* P_nk = predata->P_nk;

    dCSRmat* R_nk = predata->R_nk;


    fasp_darray_set(m, z, 0.0);


    // local variables

    dvector r_nk, z_nk;

    fasp_dvec_alloc(A_nk->row, &r_nk);

    fasp_dvec_alloc(A_nk->row, &z_nk);


    //----------------------

    // extra kernel solve

    //----------------------

    // r_nk = R_nk*r

    fasp_blas_dcsr_mxv(R_nk, r, r_nk.val);


    // z_nk = A_nk^{-1}*r_nk

#if WITH_UMFPACK // use UMFPACK directly

    fasp_solver_umfpack(A_nk, &r_nk, &z_nk, 0);

#else

    fasp_coarse_itsolver(A_nk, &r_nk, &z_nk, 1e-12, 0);

#endif


    // z = z + P_nk*z_nk;

    fasp_blas_dcsr_aAxpy(1.0, P_nk, z_nk.val, z);


    //----------------------

    // AMG solve

    //----------------------

    AMG_param amgparam;

    fasp_param_amg_init(&amgparam);

    amgparam.cycle_type       = predata->cycle_type;

    amgparam.smoother         = predata->smoother;

    amgparam.smooth_order     = predata->smooth_order;

    amgparam.presmooth_iter   = predata->presmooth_iter;

    amgparam.postsmooth_iter  = predata->postsmooth_iter;

    amgparam.relaxation       = predata->relaxation;

    amgparam.coarse_scaling   = predata->coarse_scaling;

    amgparam.tentative_smooth = predata->tentative_smooth;

    amgparam.ILU_levels       = predata->mgl_data->ILU_levels;


    AMG_data_bsr* mgl = predata->mgl_data;

    mgl->b.row        = m;

    fasp_darray_cp(m, r, mgl->b.val); // residual is an input

    mgl->x.row = m;                   // fasp_dvec_set(m,&mgl->x,0.0);

    fasp_darray_cp(m, z, mgl->x.val);


    for (i = maxit; i--;) fasp_solver_mgcycle_bsr(mgl, &amgparam);


    fasp_darray_cp(m, mgl->x.val, z);


    //----------------------

    // extra kernel solve

    //----------------------

    // r = r - A*z

    fasp_blas_dbsr_aAxpy(-1.0, &(predata->mgl_data[0].A), z, mgl->b.val);


    // r_nk = R_nk*r

    fasp_blas_dcsr_mxv(R_nk, mgl->b.val, r_nk.val);


    // z_nk = A_nk^{-1}*r_nk

#if WITH_UMFPACK // use UMFPACK directly

    fasp_solver_umfpack(A_nk, &r_nk, &z_nk, 0);

#else

    fasp_coarse_itsolver(A_nk, &r_nk, &z_nk, 1e-12, 0);

#endif


    // z = z + P_nk*z_nk;

    fasp_blas_dcsr_aAxpy(1.0, P_nk, z_nk.val, z);

}


double PreSmoother_time_zl  = 0.0;

double PostSmoother_time_zl = 0.0;

double Krylov_time_zl       = 0.0;

double Coarsen_time_zl      = 0.0;

double AMLI_cycle_time_zl   = 0.0;


void fasp_precond_dbsr_namli(REAL* r, REAL* z, void* data)

{

    precond_data_bsr* pcdata     = (precond_data_bsr*)data;

    const INT         row        = pcdata->mgl_data[0].A.ROW;

    const INT         nb         = pcdata->mgl_data[0].A.nb;

    const INT         maxit      = pcdata->maxit;

    const SHORT       num_levels = pcdata->max_levels;

    const INT         m          = row * nb;


    INT i;


    AMG_param amgparam;

    fasp_param_amg_init(&amgparam);

    fasp_param_precbsr_to_amg(&amgparam, pcdata);


    AMG_data_bsr* mgl = pcdata->mgl_data;

    mgl->b.row        = m;

    fasp_darray_cp(m, r, mgl->b.val); // residual is an input

    mgl->x.row = m;

    fasp_dvec_set(m, &mgl->x, 0.0);


    // REAL start_time, end_time; //! zhaoli

    // fasp_gettime(&start_time); //! zhaoli


    for (i = maxit; i--;) fasp_solver_namli_bsr(mgl, &amgparam, 0, num_levels);


    // fasp_gettime(&end_time);                                         //! zhaoli

    // AMLI_cycle_time_zl += end_time - start_time;

    // printf("nonlinear AMLI-cycle time: %.4f\n", AMLI_cycle_time_zl); //! zhaoli

    // printf("PreSmoother_time_zl: %.4f\n", PreSmoother_time_zl);      //! zhaoli

    // printf("PostSmoother_time_zl: %.4f\n", PostSmoother_time_zl);    //! zhaoli

    // printf("Krylov_time_zl: %.4f\n", Krylov_time_zl);                //! zhaoli

    // printf("Coarsen_time_zl: %.4f\n", Coarsen_time_zl);              //! zhaoli


    fasp_darray_cp(m, mgl->x.val, z);

}


/*---------------------------------*/

/*--        End of File          --*/

/*---------------------------------*/

fasp_darray_set
void fasp_darray_set(const INT n, REAL *x, const REAL val)
Set initial value for an array to be x=val.
Definition: AuxArray.c:41

fasp_darray_cp
void fasp_darray_cp(const INT n, const REAL *x, REAL *y)
Copy an array to the other y=x.
Definition: AuxArray.c:210

fasp_mem_free
void fasp_mem_free(void *mem)
Free up previous allocated memory body and set pointer to NULL.
Definition: AuxMemory.c:152

fasp_mem_calloc
void * fasp_mem_calloc(const unsigned int size, const unsigned int type)
Allocate, initiate, and check memory.
Definition: AuxMemory.c:65

fasp_chkerr
void fasp_chkerr(const SHORT status, const char *fctname)
Check error status and print out error messages before quit.
Definition: AuxMessage.c:213

fasp_param_precbsr_to_amg
void fasp_param_precbsr_to_amg(AMG_param *amgparam, const precond_data_bsr *pcdata)
Set AMG_param with precond_data.
Definition: AuxParam.c:882

fasp_param_amg_init
void fasp_param_amg_init(AMG_param *amgparam)
Initialize AMG parameters.
Definition: AuxParam.c:431

fasp_get_start_end
void fasp_get_start_end(const INT procid, const INT nprocs, const INT n, INT *start, INT *end)
Assign Load to each thread.
Definition: AuxThreads.c:93

fasp_dvec_set
void fasp_dvec_set(INT n, dvector *x, const REAL val)
Initialize dvector x[i]=val for i=0:n-1.
Definition: AuxVector.c:222

fasp_dvec_alloc
void fasp_dvec_alloc(const INT m, dvector *u)
Create dvector data space of REAL type.
Definition: AuxVector.c:105

fasp_blas_smat_mxv_nc7
void fasp_blas_smat_mxv_nc7(const REAL *a, const REAL *b, REAL *c)
Compute the product of a 7*7 matrix a and a array b, stored in c.
Definition: BlaSmallMat.c:200

fasp_blas_smat_mxv_nc5
void fasp_blas_smat_mxv_nc5(const REAL *a, const REAL *b, REAL *c)
Compute the product of a 5*5 matrix a and a array b, stored in c.
Definition: BlaSmallMat.c:176

fasp_blas_smat_mxv_nc4
void fasp_blas_smat_mxv_nc4(const REAL *a, const REAL *b, REAL *c)
Compute the product of a 4*4 matrix a and a array b, stored in c.
Definition: BlaSmallMat.c:154

fasp_blas_smat_mxv
void fasp_blas_smat_mxv(const REAL *a, const REAL *b, REAL *c, const INT n)
Compute the product of a small full matrix a and a array b, stored in c.
Definition: BlaSmallMat.c:238

fasp_blas_smat_mxv_nc3
void fasp_blas_smat_mxv_nc3(const REAL *a, const REAL *b, REAL *c)
Compute the product of a 3*3 matrix a and a array b, stored in c.
Definition: BlaSmallMat.c:133

fasp_blas_smat_mxv_nc2
void fasp_blas_smat_mxv_nc2(const REAL *a, const REAL *b, REAL *c)
Compute the product of a 2*2 matrix a and a array b, stored in c.
Definition: BlaSmallMat.c:113

fasp_blas_dbsr_aAxpy
void fasp_blas_dbsr_aAxpy(const REAL alpha, const dBSRmat *A, const REAL *x, REAL *y)
Compute y := alpha*A*x + y.
Definition: BlaSpmvBSR.c:514

fasp_blas_dcsr_mxv
void fasp_blas_dcsr_mxv(const dCSRmat *A, const REAL *x, REAL *y)
Matrix-vector multiplication y = A*x.
Definition: BlaSpmvCSR.c:242

fasp_blas_dcsr_aAxpy
void fasp_blas_dcsr_aAxpy(const REAL alpha, const dCSRmat *A, const REAL *x, REAL *y)
Matrix-vector multiplication y = alpha*A*x + y.
Definition: BlaSpmvCSR.c:494

fasp_precond_dbsr_diag_nc7
void fasp_precond_dbsr_diag_nc7(REAL *r, REAL *z, void *data)
Diagonal preconditioner z=inv(D)*r.
Definition: PreBSR.c:304

fasp_precond_dbsr_amg
void fasp_precond_dbsr_amg(REAL *r, REAL *z, void *data)
AMG preconditioner.
Definition: PreBSR.c:1149

fasp_precond_dbsr_ilu_mc_omp
void fasp_precond_dbsr_ilu_mc_omp(REAL *r, REAL *z, void *data)
Multi-thread Parallel ILU preconditioner based on graph coloring.
Definition: PreBSR.c:618

fasp_precond_dbsr_diag_nc5
void fasp_precond_dbsr_diag_nc5(REAL *r, REAL *z, void *data)
Diagonal preconditioner z=inv(D)*r.
Definition: PreBSR.c:259

fasp_precond_dbsr_diag_nc4
void fasp_precond_dbsr_diag_nc4(REAL *r, REAL *z, void *data)
Diagonal preconditioner z=inv(D)*r.
Definition: PreBSR.c:214

fasp_precond_dbsr_ilu_ls_omp
void fasp_precond_dbsr_ilu_ls_omp(REAL *r, REAL *z, void *data)
Multi-thread Parallel ILU preconditioner based on level schedule strategy.
Definition: PreBSR.c:844

fasp_precond_dbsr_amg_nk
void fasp_precond_dbsr_amg_nk(REAL *r, REAL *z, void *data)
AMG with extra near kernel solve preconditioner.
Definition: PreBSR.c:1194

fasp_precond_dbsr_diag
void fasp_precond_dbsr_diag(REAL *r, REAL *z, void *data)
Diagonal preconditioner z=inv(D)*r.
Definition: PreBSR.c:49

fasp_precond_dbsr_ilu
void fasp_precond_dbsr_ilu(REAL *r, REAL *z, void *data)
ILU preconditioner.
Definition: PreBSR.c:347

fasp_precond_dbsr_diag_nc2
void fasp_precond_dbsr_diag_nc2(REAL *r, REAL *z, void *data)
Diagonal preconditioner z=inv(D)*r.
Definition: PreBSR.c:124

fasp_precond_dbsr_diag_nc3
void fasp_precond_dbsr_diag_nc3(REAL *r, REAL *z, void *data)
Diagonal preconditioner z=inv(D)*r.
Definition: PreBSR.c:169

fasp_precond_dbsr_namli
void fasp_precond_dbsr_namli(REAL *r, REAL *z, void *data)
Nonlinear AMLI-cycle AMG preconditioner.
Definition: PreBSR.c:1294

fasp_solver_mgcycle_bsr
void fasp_solver_mgcycle_bsr(AMG_data_bsr *mgl, AMG_param *param)
Solve Ax=b with non-recursive multigrid cycle.
Definition: PreMGCycle.c:287

fasp_solver_namli_bsr
void fasp_solver_namli_bsr(AMG_data_bsr *mgl, AMG_param *param, INT l, INT num_levels)
Solve Ax=b with recursive nonlinear AMLI-cycle.
Definition: PreMGRecurAMLI.c:528

fasp_solver_umfpack
INT fasp_solver_umfpack(dCSRmat *ptrA, dvector *b, dvector *u, const SHORT prtlvl)
Solve Au=b by UMFpack.
Definition: XtrUmfpack.c:44

fasp.h
Main header file for the FASP project.

REAL
#define REAL
Definition: fasp.h:75

SHORT
#define SHORT
FASP integer and floating point numbers.
Definition: fasp.h:71

INT
#define INT
Definition: fasp.h:72

OPENMP_HOLDS
#define OPENMP_HOLDS
Definition: fasp_const.h:269

ERROR_ALLOC_MEM
#define ERROR_ALLOC_MEM
Definition: fasp_const.h:30

ERROR_UNKNOWN
#define ERROR_UNKNOWN
Definition: fasp_const.h:56

AMG_data_bsr
Data for multigrid levels in dBSRmat format.
Definition: fasp_block.h:146

AMG_data_bsr::A
dBSRmat A
pointer to the matrix at level level_num
Definition: fasp_block.h:155

AMG_data_bsr::b
dvector b
pointer to the right-hand side at level level_num
Definition: fasp_block.h:164

AMG_data_bsr::ILU_levels
INT ILU_levels
number of levels use ILU smoother
Definition: fasp_block.h:217

AMG_data_bsr::x
dvector x
pointer to the iterative solution at level level_num
Definition: fasp_block.h:167

AMG_param
Parameters for AMG methods.
Definition: fasp.h:455

AMG_param::coarse_scaling
SHORT coarse_scaling
switch of scaling of the coarse grid correction
Definition: fasp.h:503

AMG_param::ILU_levels
SHORT ILU_levels
number of levels use ILU smoother
Definition: fasp.h:560

AMG_param::relaxation
REAL relaxation
relaxation parameter for Jacobi and SOR smoother
Definition: fasp.h:494

AMG_param::smoother
SHORT smoother
smoother type
Definition: fasp.h:482

AMG_param::cycle_type
SHORT cycle_type
type of AMG cycle
Definition: fasp.h:476

AMG_param::tentative_smooth
REAL tentative_smooth
relaxation parameter for smoothing the tentative prolongation
Definition: fasp.h:551

AMG_param::postsmooth_iter
SHORT postsmooth_iter
number of postsmoothers
Definition: fasp.h:491

AMG_param::presmooth_iter
SHORT presmooth_iter
number of presmoothers
Definition: fasp.h:488

AMG_param::smooth_order
SHORT smooth_order
smoother order
Definition: fasp.h:485

ILU_data
Data for ILU setup.
Definition: fasp.h:651

ILU_data::ijlu
INT * ijlu
integer array of row pointers and column indexes, the size is nzlu
Definition: fasp.h:669

ILU_data::luval
REAL * luval
nonzero entries of LU
Definition: fasp.h:672

ILU_data::jlevU
INT * jlevU
mapping from row to color for upper triangle
Definition: fasp.h:716

ILU_data::nlevU
INT nlevU
number of colors for upper triangle
Definition: fasp.h:704

ILU_data::nwork
INT nwork
work space size
Definition: fasp.h:678

ILU_data::nb
INT nb
block size for BSR type only
Definition: fasp.h:675

ILU_data::row
INT row
row number of matrix LU, m
Definition: fasp.h:660

ILU_data::nlevL
INT nlevL
number of colors for lower triangle
Definition: fasp.h:701

ILU_data::jlevL
INT * jlevL
mapping from row to color for lower triangle
Definition: fasp.h:713

ILU_data::work
REAL * work
work space
Definition: fasp.h:681

ILU_data::ilevL
INT * ilevL
number of vertices in each color for lower triangle
Definition: fasp.h:707

ILU_data::ilevU
INT * ilevU
number of vertices in each color for upper triangle
Definition: fasp.h:710

dBSRmat::nb
INT nb
dimension of each sub-block
Definition: fasp_block.h:46

dBSRmat::ROW
INT ROW
number of rows of sub-blocks in matrix A, M
Definition: fasp_block.h:37

dCSRmat
Sparse matrix of REAL type in CSR format.
Definition: fasp.h:151

dCSRmat::row
INT row
row number of matrix A, m
Definition: fasp.h:154

dvector
Vector with n entries of REAL type.
Definition: fasp.h:354

dvector::val
REAL * val
actual vector entries
Definition: fasp.h:360

dvector::row
INT row
number of rows
Definition: fasp.h:357

precond_data_bsr
Data for preconditioners in dBSRmat format.
Definition: fasp_block.h:271

precond_data_bsr::coarse_scaling
SHORT coarse_scaling
switch of scaling of the coarse grid correction
Definition: fasp_block.h:313

precond_data_bsr::A_nk
dCSRmat * A_nk
Matrix data for near kernal.
Definition: fasp_block.h:342

precond_data_bsr::relaxation
REAL relaxation
relaxation parameter for SOR smoother
Definition: fasp_block.h:307

precond_data_bsr::smoother
SHORT smoother
AMG smoother type.
Definition: fasp_block.h:292

precond_data_bsr::cycle_type
SHORT cycle_type
AMG cycle type.
Definition: fasp_block.h:289

precond_data_bsr::tentative_smooth
REAL tentative_smooth
smooth factor for smoothing the tentative prolongation
Definition: fasp_block.h:322

precond_data_bsr::postsmooth_iter
SHORT postsmooth_iter
number of postsmoothing
Definition: fasp_block.h:301

precond_data_bsr::R_nk
dCSRmat * R_nk
Resriction for near kernal.
Definition: fasp_block.h:348

precond_data_bsr::mgl_data
AMG_data_bsr * mgl_data
AMG preconditioner data.
Definition: fasp_block.h:328

precond_data_bsr::max_levels
INT max_levels
max number of AMG levels
Definition: fasp_block.h:283

precond_data_bsr::P_nk
dCSRmat * P_nk
Prolongation for near kernal.
Definition: fasp_block.h:345

precond_data_bsr::presmooth_iter
SHORT presmooth_iter
number of presmoothing
Definition: fasp_block.h:298

precond_data_bsr::maxit
INT maxit
max number of iterations of AMG preconditioner
Definition: fasp_block.h:280

precond_data_bsr::smooth_order
SHORT smooth_order
AMG smoother ordering.
Definition: fasp_block.h:295

precond_diag_bsr
Data for diagnal preconditioners in dBSRmat format.
Definition: fasp_block.h:255

precond_diag_bsr::nb
INT nb
dimension of each sub-block
Definition: fasp_block.h:258

precond_diag_bsr::diag
dvector diag
diagnal elements
Definition: fasp_block.h:261