doc/ilu0_8hpp_source.html

 #ifndef VIENNACL_LINALG_DETAIL_ILU0_HPP_

 #define VIENNACL_LINALG_DETAIL_ILU0_HPP_


 /* =========================================================================

    Copyright (c) 2010-2016, Institute for Microelectronics,

                             Institute for Analysis and Scientific Computing,

                             TU Wien.

    Portions of this software are copyright by UChicago Argonne, LLC.


                             -----------------

                   ViennaCL - The Vienna Computing Library

                             -----------------


    Project Head:    Karl Rupp                   rupp@iue.tuwien.ac.at


    (A list of authors and contributors can be found in the manual)


    License:         MIT (X11), see file LICENSE in the base directory

 ============================================================================= */


 #include <vector>

 #include <cmath>

 #include <iostream>

 #include "viennacl/forwards.h"

 #include "viennacl/tools/tools.hpp"

 #include "viennacl/linalg/detail/ilu/common.hpp"

 #include "viennacl/compressed_matrix.hpp"

 #include "viennacl/backend/memory.hpp"


 #include "viennacl/linalg/host_based/common.hpp"


 #include <map>


 namespace viennacl

 {

 namespace linalg

 {


 class ilu0_tag

 {

 public:

   ilu0_tag(bool with_level_scheduling = false) : use_level_scheduling_(with_level_scheduling) {}


   bool use_level_scheduling() const { return use_level_scheduling_; }

   void use_level_scheduling(bool b) { use_level_scheduling_ = b; }


 private:

   bool use_level_scheduling_;

 };


 template<typename NumericT>

 void precondition(viennacl::compressed_matrix<NumericT> & A, ilu0_tag const & /* tag */)

 {

   assert( (A.handle1().get_active_handle_id() == viennacl::MAIN_MEMORY) && bool("System matrix must reside in main memory for ILU0") );

   assert( (A.handle2().get_active_handle_id() == viennacl::MAIN_MEMORY) && bool("System matrix must reside in main memory for ILU0") );

   assert( (A.handle().get_active_handle_id()  == viennacl::MAIN_MEMORY) && bool("System matrix must reside in main memory for ILU0") );


   NumericT           * elements   = viennacl::linalg::host_based::detail::extract_raw_pointer<NumericT>(A.handle());

   unsigned int const * row_buffer = viennacl::linalg::host_based::detail::extract_raw_pointer<unsigned int>(A.handle1());

   unsigned int const * col_buffer = viennacl::linalg::host_based::detail::extract_raw_pointer<unsigned int>(A.handle2());


   // Note: Line numbers in the following refer to the algorithm in Saad's book


   for (vcl_size_t i=1; i<A.size1(); ++i)  // Line 1

   {

     unsigned int row_i_begin = row_buffer[i];

     unsigned int row_i_end   = row_buffer[i+1];

     for (unsigned int buf_index_k = row_i_begin; buf_index_k < row_i_end; ++buf_index_k) //Note: We do not assume that the column indices within a row are sorted

     {

       unsigned int k = col_buffer[buf_index_k];

       if (k >= i)

         continue; //Note: We do not assume that the column indices within a row are sorted


       unsigned int row_k_begin = row_buffer[k];

       unsigned int row_k_end   = row_buffer[k+1];


       // get a_kk:

       NumericT a_kk = 0;

       for (unsigned int buf_index_akk = row_k_begin; buf_index_akk < row_k_end; ++buf_index_akk)

       {

         if (col_buffer[buf_index_akk] == k)

         {

           a_kk = elements[buf_index_akk];

           break;

         }

       }


       NumericT & a_ik = elements[buf_index_k];

       a_ik /= a_kk;                                 //Line 3


       for (unsigned int buf_index_j = row_i_begin; buf_index_j < row_i_end; ++buf_index_j) //Note: We do not assume that the column indices within a row are sorted

       {

         unsigned int j = col_buffer[buf_index_j];

         if (j <= k)

           continue;


         // determine a_kj:

         NumericT a_kj = 0;

         for (unsigned int buf_index_akj = row_k_begin; buf_index_akj < row_k_end; ++buf_index_akj)

         {

           if (col_buffer[buf_index_akj] == j)

           {

             a_kj = elements[buf_index_akj];

             break;

           }

         }


         //a_ij -= a_ik * a_kj

         elements[buf_index_j] -= a_ik * a_kj;  //Line 5

       }

     }

   }


 }


 template<typename MatrixT>

 class ilu0_precond

 {

   typedef typename MatrixT::value_type      NumericType;


 public:

   ilu0_precond(MatrixT const & mat, ilu0_tag const & tag) : tag_(tag), LU_()

   {

     //initialize preconditioner:

     //std::cout << "Start CPU precond" << std::endl;

     init(mat);

     //std::cout << "End CPU precond" << std::endl;

   }


   template<typename VectorT>

   void apply(VectorT & vec) const

   {

     unsigned int const * row_buffer = viennacl::linalg::host_based::detail::extract_raw_pointer<unsigned int>(LU_.handle1());

     unsigned int const * col_buffer = viennacl::linalg::host_based::detail::extract_raw_pointer<unsigned int>(LU_.handle2());

     NumericType  const * elements   = viennacl::linalg::host_based::detail::extract_raw_pointer<NumericType>(LU_.handle());


     viennacl::linalg::host_based::detail::csr_inplace_solve<NumericType>(row_buffer, col_buffer, elements, vec, LU_.size2(), unit_lower_tag());

     viennacl::linalg::host_based::detail::csr_inplace_solve<NumericType>(row_buffer, col_buffer, elements, vec, LU_.size2(), upper_tag());

   }


 private:

   void init(MatrixT const & mat)

   {

     viennacl::context host_context(viennacl::MAIN_MEMORY);

     viennacl::switch_memory_context(LU_, host_context);


     viennacl::copy(mat, LU_);

     viennacl::linalg::precondition(LU_, tag_);

   }


   ilu0_tag                                   tag_;

   viennacl::compressed_matrix<NumericType>   LU_;

 };


 template<typename NumericT, unsigned int AlignmentV>

 class ilu0_precond< viennacl::compressed_matrix<NumericT, AlignmentV> >

 {

   typedef viennacl::compressed_matrix<NumericT, AlignmentV>   MatrixType;


 public:

   ilu0_precond(MatrixType const & mat, ilu0_tag const & tag)

     : tag_(tag),

       LU_(mat.size1(), mat.size2(), viennacl::traits::context(mat))

   {

     //initialize preconditioner:

     //std::cout << "Start GPU precond" << std::endl;

     init(mat);

     //std::cout << "End GPU precond" << std::endl;

   }


   void apply(viennacl::vector<NumericT> & vec) const

   {

     viennacl::context host_context(viennacl::MAIN_MEMORY);

     if (vec.handle().get_active_handle_id() != viennacl::MAIN_MEMORY)

     {

       if (tag_.use_level_scheduling())

       {

         //std::cout << "Using multifrontal on GPU..." << std::endl;

         detail::level_scheduling_substitute(vec,

                                             multifrontal_L_row_index_arrays_,

                                             multifrontal_L_row_buffers_,

                                             multifrontal_L_col_buffers_,

                                             multifrontal_L_element_buffers_,

                                             multifrontal_L_row_elimination_num_list_);


         vec = viennacl::linalg::element_div(vec, multifrontal_U_diagonal_);


         detail::level_scheduling_substitute(vec,

                                             multifrontal_U_row_index_arrays_,

                                             multifrontal_U_row_buffers_,

                                             multifrontal_U_col_buffers_,

                                             multifrontal_U_element_buffers_,

                                             multifrontal_U_row_elimination_num_list_);

       }

       else

       {

         viennacl::context old_context = viennacl::traits::context(vec);

         viennacl::switch_memory_context(vec, host_context);

         viennacl::linalg::inplace_solve(LU_, vec, unit_lower_tag());

         viennacl::linalg::inplace_solve(LU_, vec, upper_tag());

         viennacl::switch_memory_context(vec, old_context);

       }

     }

     else //apply ILU0 directly on CPU

     {

       if (tag_.use_level_scheduling())

       {

         //std::cout << "Using multifrontal..." << std::endl;

         detail::level_scheduling_substitute(vec,

                                             multifrontal_L_row_index_arrays_,

                                             multifrontal_L_row_buffers_,

                                             multifrontal_L_col_buffers_,

                                             multifrontal_L_element_buffers_,

                                             multifrontal_L_row_elimination_num_list_);


         vec = viennacl::linalg::element_div(vec, multifrontal_U_diagonal_);


         detail::level_scheduling_substitute(vec,

                                             multifrontal_U_row_index_arrays_,

                                             multifrontal_U_row_buffers_,

                                             multifrontal_U_col_buffers_,

                                             multifrontal_U_element_buffers_,

                                             multifrontal_U_row_elimination_num_list_);

       }

       else

       {

         viennacl::linalg::inplace_solve(LU_, vec, unit_lower_tag());

         viennacl::linalg::inplace_solve(LU_, vec, upper_tag());

       }

     }

   }


   vcl_size_t levels() const { return multifrontal_L_row_index_arrays_.size(); }


 private:

   void init(MatrixType const & mat)

   {

     viennacl::context host_context(viennacl::MAIN_MEMORY);

     viennacl::switch_memory_context(LU_, host_context);

     LU_ = mat;

     viennacl::linalg::precondition(LU_, tag_);


     if (!tag_.use_level_scheduling())

       return;


     // multifrontal part:

     viennacl::switch_memory_context(multifrontal_U_diagonal_, host_context);

     multifrontal_U_diagonal_.resize(LU_.size1(), false);

     host_based::detail::row_info(LU_, multifrontal_U_diagonal_, viennacl::linalg::detail::SPARSE_ROW_DIAGONAL);


     detail::level_scheduling_setup_L(LU_,

                                      multifrontal_U_diagonal_, //dummy

                                      multifrontal_L_row_index_arrays_,

                                      multifrontal_L_row_buffers_,

                                      multifrontal_L_col_buffers_,

                                      multifrontal_L_element_buffers_,

                                      multifrontal_L_row_elimination_num_list_);


     detail::level_scheduling_setup_U(LU_,

                                      multifrontal_U_diagonal_,

                                      multifrontal_U_row_index_arrays_,

                                      multifrontal_U_row_buffers_,

                                      multifrontal_U_col_buffers_,

                                      multifrontal_U_element_buffers_,

                                      multifrontal_U_row_elimination_num_list_);


     //

     // Bring to device if necessary:

     //


     // L:

     for (typename std::list< viennacl::backend::mem_handle >::iterator it  = multifrontal_L_row_index_arrays_.begin();

                                                                        it != multifrontal_L_row_index_arrays_.end();

                                                                      ++it)

       viennacl::backend::switch_memory_context<unsigned int>(*it, viennacl::traits::context(mat));


     for (typename std::list< viennacl::backend::mem_handle >::iterator it  = multifrontal_L_row_buffers_.begin();

                                                                        it != multifrontal_L_row_buffers_.end();

                                                                      ++it)

       viennacl::backend::switch_memory_context<unsigned int>(*it, viennacl::traits::context(mat));


     for (typename std::list< viennacl::backend::mem_handle >::iterator it  = multifrontal_L_col_buffers_.begin();

                                                                        it != multifrontal_L_col_buffers_.end();

                                                                      ++it)

       viennacl::backend::switch_memory_context<unsigned int>(*it, viennacl::traits::context(mat));


     for (typename std::list< viennacl::backend::mem_handle >::iterator it  = multifrontal_L_element_buffers_.begin();

                                                                        it != multifrontal_L_element_buffers_.end();

                                                                      ++it)

       viennacl::backend::switch_memory_context<NumericT>(*it, viennacl::traits::context(mat));


     // U:


     viennacl::switch_memory_context(multifrontal_U_diagonal_, viennacl::traits::context(mat));


     for (typename std::list< viennacl::backend::mem_handle >::iterator it  = multifrontal_U_row_index_arrays_.begin();

                                                                        it != multifrontal_U_row_index_arrays_.end();

                                                                      ++it)

       viennacl::backend::switch_memory_context<unsigned int>(*it, viennacl::traits::context(mat));


     for (typename std::list< viennacl::backend::mem_handle >::iterator it  = multifrontal_U_row_buffers_.begin();

                                                                        it != multifrontal_U_row_buffers_.end();

                                                                      ++it)

       viennacl::backend::switch_memory_context<unsigned int>(*it, viennacl::traits::context(mat));


     for (typename std::list< viennacl::backend::mem_handle >::iterator it  = multifrontal_U_col_buffers_.begin();

                                                                        it != multifrontal_U_col_buffers_.end();

                                                                      ++it)

       viennacl::backend::switch_memory_context<unsigned int>(*it, viennacl::traits::context(mat));


     for (typename std::list< viennacl::backend::mem_handle >::iterator it  = multifrontal_U_element_buffers_.begin();

                                                                        it != multifrontal_U_element_buffers_.end();

                                                                      ++it)

       viennacl::backend::switch_memory_context<NumericT>(*it, viennacl::traits::context(mat));


   }


   ilu0_tag tag_;

   viennacl::compressed_matrix<NumericT> LU_;


   std::list<viennacl::backend::mem_handle> multifrontal_L_row_index_arrays_;

   std::list<viennacl::backend::mem_handle> multifrontal_L_row_buffers_;

   std::list<viennacl::backend::mem_handle> multifrontal_L_col_buffers_;

   std::list<viennacl::backend::mem_handle> multifrontal_L_element_buffers_;

   std::list<vcl_size_t>                    multifrontal_L_row_elimination_num_list_;


   viennacl::vector<NumericT> multifrontal_U_diagonal_;

   std::list<viennacl::backend::mem_handle> multifrontal_U_row_index_arrays_;

   std::list<viennacl::backend::mem_handle> multifrontal_U_row_buffers_;

   std::list<viennacl::backend::mem_handle> multifrontal_U_col_buffers_;

   std::list<viennacl::backend::mem_handle> multifrontal_U_element_buffers_;

   std::list<vcl_size_t>                    multifrontal_U_row_elimination_num_list_;


 };


 } // namespace linalg

 } // namespace viennacl


 #endif


viennacl::compressed_matrix::size2
const vcl_size_t & size2() const
Returns the number of columns.
Definition: compressed_matrix.hpp:929

viennacl::linalg::ilu0_precond< viennacl::compressed_matrix< NumericT, AlignmentV > >::ilu0_precond
ilu0_precond(MatrixType const &mat, ilu0_tag const &tag)
Definition: ilu0.hpp:195

viennacl::linalg::element_div
viennacl::vector_expression< const vector_base< T >, const vector_base< T >, op_element_binary< op_div > > element_div(vector_base< T > const &v1, vector_base< T > const &v2)

viennacl::linalg::inplace_solve
void inplace_solve(const matrix_base< NumericT > &A, matrix_base< NumericT > &B, SolverTagT)
Direct inplace solver for triangular systems with multiple right hand sides, i.e. A \ B (MATLAB notat...
Definition: direct_solve.hpp:217

viennacl::linalg::ilu0_precond::ilu0_precond
ilu0_precond(MatrixT const &mat, ilu0_tag const &tag)
Definition: ilu0.hpp:151

viennacl::linalg::ilu0_precond
ILU0 preconditioner class, can be supplied to solve()-routines.
Definition: ilu0.hpp:146

viennacl::compressed_matrix::size1
const vcl_size_t & size1() const
Returns the number of rows.
Definition: compressed_matrix.hpp:927

tools.hpp
Various little tools used here and there in ViennaCL.

viennacl::traits::size1
vcl_size_t size1(MatrixType const &mat)
Generic routine for obtaining the number of rows of a matrix (ViennaCL, uBLAS, etc.)
Definition: size.hpp:163

viennacl::linalg::ilu0_tag
A tag for incomplete LU factorization with static pattern (ILU0)
Definition: ilu0.hpp:58

viennacl::linalg::precondition
void precondition(viennacl::compressed_matrix< NumericT > &A, ilu0_tag const &)
Implementation of a ILU-preconditioner with static pattern. Optimized version for CSR matrices...
Definition: ilu0.hpp:78

forwards.h
This file provides the forward declarations for the main types used within ViennaCL.

viennacl::linalg::detail::level_scheduling_setup_U
void level_scheduling_setup_U(viennacl::compressed_matrix< NumericT, AlignmentV > const &LU, viennacl::vector< NumericT > const &diagonal_LU, std::list< viennacl::backend::mem_handle > &row_index_arrays, std::list< viennacl::backend::mem_handle > &row_buffers, std::list< viennacl::backend::mem_handle > &col_buffers, std::list< viennacl::backend::mem_handle > &element_buffers, std::list< vcl_size_t > &row_elimination_num_list)
Definition: common.hpp:208

viennacl::traits::size2
result_of::size_type< MatrixType >::type size2(MatrixType const &mat)
Generic routine for obtaining the number of columns of a matrix (ViennaCL, uBLAS, etc...
Definition: size.hpp:201

viennacl::linalg::detail::level_scheduling_substitute
void level_scheduling_substitute(viennacl::vector< NumericT > &vec, std::list< viennacl::backend::mem_handle > const &row_index_arrays, std::list< viennacl::backend::mem_handle > const &row_buffers, std::list< viennacl::backend::mem_handle > const &col_buffers, std::list< viennacl::backend::mem_handle > const &element_buffers, std::list< vcl_size_t > const &row_elimination_num_list)
Definition: common.hpp:224

viennacl::compressed_matrix::handle
const handle_type & handle() const
Returns the OpenCL handle to the matrix entry array.
Definition: compressed_matrix.hpp:942

viennacl::compressed_matrix::handle1
const handle_type & handle1() const
Returns the OpenCL handle to the row index array.
Definition: compressed_matrix.hpp:936

NumericT
float NumericT
Definition: bisect.cpp:40

viennacl::context
Represents a generic 'context' similar to an OpenCL context, but is backend-agnostic and thus also su...
Definition: context.hpp:39

viennacl::linalg::upper_tag
A tag class representing an upper triangular matrix.
Definition: forwards.h:854

compressed_matrix.hpp
Implementation of the compressed_matrix class.

viennacl::compressed_matrix::handle2
const handle_type & handle2() const
Returns the OpenCL handle to the column index array.
Definition: compressed_matrix.hpp:938

viennacl::linalg::ilu0_precond< viennacl::compressed_matrix< NumericT, AlignmentV > >::levels
vcl_size_t levels() const
Definition: ilu0.hpp:267

viennacl::vcl_size_t
std::size_t vcl_size_t
Definition: forwards.h:75

common.hpp
Common routines for single-threaded or OpenMP-enabled execution on CPU.

viennacl::linalg::ilu0_precond::apply
void apply(VectorT &vec) const
Definition: ilu0.hpp:160

viennacl::vector< NumericT >

viennacl::linalg::ilu0_tag::use_level_scheduling
void use_level_scheduling(bool b)
Definition: ilu0.hpp:64

viennacl::MAIN_MEMORY
Definition: forwards.h:348

viennacl::traits::context
viennacl::context context(T const &t)
Returns an ID for the currently active memory domain of an object.
Definition: context.hpp:40

viennacl::linalg::ilu0_tag::use_level_scheduling
bool use_level_scheduling() const
Definition: ilu0.hpp:63

viennacl::linalg::detail::SPARSE_ROW_DIAGONAL
Definition: forwards.h:842

viennacl::copy
void copy(std::vector< NumericT > &cpu_vec, circulant_matrix< NumericT, AlignmentV > &gpu_mat)
Copies a circulant matrix from the std::vector to the OpenCL device (either GPU or multi-core CPU) ...
Definition: circulant_matrix.hpp:150

viennacl::linalg::unit_lower_tag
A tag class representing a lower triangular matrix with unit diagonal.
Definition: forwards.h:859

viennacl::linalg::host_based::detail::row_info
void row_info(compressed_matrix< NumericT, AlignmentV > const &mat, vector_base< NumericT > &vec, viennacl::linalg::detail::row_info_types info_selector)
Definition: sparse_matrix_operations.hpp:53

viennacl::linalg::detail::level_scheduling_setup_L
void level_scheduling_setup_L(viennacl::compressed_matrix< NumericT, AlignmentV > const &LU, viennacl::vector< NumericT > const &diagonal_LU, std::list< viennacl::backend::mem_handle > &row_index_arrays, std::list< viennacl::backend::mem_handle > &row_buffers, std::list< viennacl::backend::mem_handle > &col_buffers, std::list< viennacl::backend::mem_handle > &element_buffers, std::list< vcl_size_t > &row_elimination_num_list)
Definition: common.hpp:191

viennacl::compressed_matrix< NumericT >

common.hpp
Common routines used within ILU-type preconditioners.

viennacl::linalg::ilu0_precond< viennacl::compressed_matrix< NumericT, AlignmentV > >::apply
void apply(viennacl::vector< NumericT > &vec) const
Definition: ilu0.hpp:205

viennacl::vector_base::handle
const handle_type & handle() const
Returns the memory handle.
Definition: vector_def.hpp:128

memory.hpp
Main interface routines for memory management.

viennacl::linalg::ilu0_tag::ilu0_tag
ilu0_tag(bool with_level_scheduling=false)
Definition: ilu0.hpp:61

viennacl::backend::mem_handle::get_active_handle_id
memory_types get_active_handle_id() const
Returns an ID for the currently active memory buffer. Other memory buffers might contain old or no da...
Definition: mem_handle.hpp:118

viennacl::switch_memory_context
void switch_memory_context(T &obj, viennacl::context new_ctx)
Generic convenience routine for migrating data of an object to a new memory domain.
Definition: memory.hpp:622