doc/lu_8hpp_source.html

 #ifndef VIENNACL_LINALG_LU_HPP

 #define VIENNACL_LINALG_LU_HPP


 /* =========================================================================

    Copyright (c) 2010-2016, Institute for Microelectronics,

                             Institute for Analysis and Scientific Computing,

                             TU Wien.

    Portions of this software are copyright by UChicago Argonne, LLC.


                             -----------------

                   ViennaCL - The Vienna Computing Library

                             -----------------


    Project Head:    Karl Rupp                   rupp@iue.tuwien.ac.at


    (A list of authors and contributors can be found in the manual)


    License:         MIT (X11), see file LICENSE in the base directory

 ============================================================================= */


 #include <algorithm>    //for std::min


 #include "viennacl/matrix.hpp"

 #include "viennacl/matrix_proxy.hpp"


 #include "viennacl/linalg/prod.hpp"

 #include "viennacl/linalg/direct_solve.hpp"


 namespace viennacl

 {

 namespace linalg

 {

 template<typename NumericT>

 void lu_factorize(matrix<NumericT, viennacl::row_major> & A)

 {

   typedef matrix<NumericT, viennacl::row_major>  MatrixType;


   vcl_size_t max_block_size = 32;

   vcl_size_t num_blocks = (A.size2() - 1) / max_block_size + 1;

   std::vector<NumericT> temp_buffer(A.internal_size2() * max_block_size);


   // Iterate over panels

   for (vcl_size_t panel_id = 0; panel_id < num_blocks; ++panel_id)

   {

     vcl_size_t row_start = panel_id * max_block_size;

     vcl_size_t current_block_size = std::min<vcl_size_t>(A.size1() - row_start, max_block_size);


     viennacl::range     block_range(row_start, row_start + current_block_size);

     viennacl::range remainder_range(row_start + current_block_size, A.size1());


     //

     // Perform LU factorization on panel:

     //


     // Read from matrix to buffer:

     viennacl::backend::memory_read(A.handle(),

                                    sizeof(NumericT) * row_start          * A.internal_size2(),

                                    sizeof(NumericT) * current_block_size * A.internal_size2(),

                                    &(temp_buffer[0]));


     // Factorize (kij-version):

     for (vcl_size_t k=0; k < current_block_size - 1; ++k)

     {

       for (vcl_size_t i=k+1; i < current_block_size; ++i)

       {

         temp_buffer[row_start + i * A.internal_size2() + k] /= temp_buffer[row_start + k * A.internal_size2() + k];  // write l_ik


         NumericT l_ik = temp_buffer[row_start + i * A.internal_size2() + k];


         for (vcl_size_t j = row_start + k + 1; j < A.size1(); ++j)

           temp_buffer[i * A.internal_size2() + j] -= l_ik * temp_buffer[k * A.internal_size2() + j];  // l_ik * a_kj

       }

     }


     // Write back:

     viennacl::backend::memory_write(A.handle(),

                                     sizeof(NumericT) * row_start          * A.internal_size2(),

                                     sizeof(NumericT) * current_block_size * A.internal_size2(),

                                     &(temp_buffer[0]));


     if (remainder_range.size() > 0)

     {

       //

       // Compute L_12 = [ (U_11)^{T}^{-1} A_{21}^T ]^T

       //

       viennacl::matrix_range<MatrixType> U_11(A, block_range,     block_range);

       viennacl::matrix_range<MatrixType> A_21(A, remainder_range, block_range);

       viennacl::linalg::inplace_solve(trans(U_11), trans(A_21), viennacl::linalg::lower_tag());


       //

       // Update remainder of A

       //

       viennacl::matrix_range<MatrixType> L_21(A, remainder_range, block_range);

       viennacl::matrix_range<MatrixType> U_12(A, block_range,     remainder_range);

       viennacl::matrix_range<MatrixType> A_22(A, remainder_range, remainder_range);


       A_22 -= viennacl::linalg::prod(L_21, U_12);

     }

   }


 }


 template<typename NumericT>

 void lu_factorize(matrix<NumericT, viennacl::column_major> & A)

 {

   typedef matrix<NumericT, viennacl::column_major>  MatrixType;


   vcl_size_t max_block_size = 32;

   vcl_size_t num_blocks = (A.size1() - 1) / max_block_size + 1;

   std::vector<NumericT> temp_buffer(A.internal_size1() * max_block_size);


   // Iterate over panels

   for (vcl_size_t panel_id = 0; panel_id < num_blocks; ++panel_id)

   {

     vcl_size_t col_start = panel_id * max_block_size;

     vcl_size_t current_block_size = std::min<vcl_size_t>(A.size1() - col_start, max_block_size);


     viennacl::range     block_range(col_start, col_start + current_block_size);

     viennacl::range remainder_range(col_start + current_block_size, A.size1());


     //

     // Perform LU factorization on panel:

     //


     // Read from matrix to buffer:

     viennacl::backend::memory_read(A.handle(),

                                    sizeof(NumericT) * col_start          * A.internal_size1(),

                                    sizeof(NumericT) * current_block_size * A.internal_size1(),

                                    &(temp_buffer[0]));


     // Factorize (kji-version):

     for (vcl_size_t k=0; k < current_block_size; ++k)

     {

       NumericT a_kk = temp_buffer[col_start + k + k * A.internal_size1()];

       for (vcl_size_t i=col_start+k+1; i < A.size1(); ++i)

         temp_buffer[i + k * A.internal_size1()] /= a_kk;  // write l_ik


       for (vcl_size_t j=k+1; j < current_block_size; ++j)

       {

         NumericT a_kj = temp_buffer[col_start + k + j * A.internal_size1()];

         for (vcl_size_t i=col_start+k+1; i < A.size1(); ++i)

           temp_buffer[i + j * A.internal_size1()] -= temp_buffer[i + k * A.internal_size1()] * a_kj;  // l_ik * a_kj

       }

     }


     // Write back:

     viennacl::backend::memory_write(A.handle(),

                                     sizeof(NumericT) * col_start          * A.internal_size1(),

                                     sizeof(NumericT) * current_block_size * A.internal_size1(),

                                     &(temp_buffer[0]));


     if (remainder_range.size() > 0)

     {

       //

       // Compute U_12:

       //

       viennacl::matrix_range<MatrixType> L_11(A, block_range,     block_range);

       viennacl::matrix_range<MatrixType> A_12(A, block_range, remainder_range);

       viennacl::linalg::inplace_solve(L_11, A_12, viennacl::linalg::unit_lower_tag());


       //

       // Update remainder of A

       //

       viennacl::matrix_range<MatrixType> L_21(A, remainder_range, block_range);

       viennacl::matrix_range<MatrixType> U_12(A, block_range,     remainder_range);

       viennacl::matrix_range<MatrixType> A_22(A, remainder_range, remainder_range);


       A_22 -= viennacl::linalg::prod(L_21, U_12);

     }


   }


 }


 //

 // Convenience layer:

 //


 template<typename NumericT, typename F1, typename F2, unsigned int AlignmentV1, unsigned int AlignmentV2>

 void lu_substitute(matrix<NumericT, F1, AlignmentV1> const & A,

                    matrix<NumericT, F2, AlignmentV2> & B)

 {

   assert(A.size1() == A.size2() && bool("Matrix must be square"));

   assert(A.size1() == B.size1() && bool("Matrix must be square"));

   inplace_solve(A, B, unit_lower_tag());

   inplace_solve(A, B, upper_tag());

 }


 template<typename NumericT, typename F, unsigned int MatAlignmentV, unsigned int VecAlignmentV>

 void lu_substitute(matrix<NumericT, F, MatAlignmentV> const & A,

                    vector<NumericT, VecAlignmentV> & vec)

 {

   assert(A.size1() == A.size2() && bool("Matrix must be square"));

   inplace_solve(A, vec, unit_lower_tag());

   inplace_solve(A, vec, upper_tag());

 }


 }

 }


 #endif

viennacl::linalg::inplace_solve
void inplace_solve(const matrix_base< NumericT > &A, matrix_base< NumericT > &B, SolverTagT)
Direct inplace solver for triangular systems with multiple right hand sides, i.e. A \ B (MATLAB notat...
Definition: direct_solve.hpp:217

viennacl::backend::memory_write
void memory_write(mem_handle &dst_buffer, vcl_size_t dst_offset, vcl_size_t bytes_to_write, const void *ptr, bool async=false)
Writes data from main RAM identified by 'ptr' to the buffer identified by 'dst_buffer'.
Definition: memory.hpp:220

prod.hpp
Generic interface for matrix-vector and matrix-matrix products. See viennacl/linalg/vector_operations...

matrix.hpp
Implementation of the dense matrix class.

viennacl::linalg::lu_substitute
void lu_substitute(matrix< NumericT, F1, AlignmentV1 > const &A, matrix< NumericT, F2, AlignmentV2 > &B)
LU substitution for the system LU = rhs.
Definition: lu.hpp:201

viennacl::linalg::lower_tag
A tag class representing a lower triangular matrix.
Definition: forwards.h:849

viennacl::matrix
A dense matrix class.
Definition: forwards.h:375

viennacl::backend::memory_read
void memory_read(mem_handle const &src_buffer, vcl_size_t src_offset, vcl_size_t bytes_to_read, void *ptr, bool async=false)
Reads data from a buffer back to main RAM.
Definition: memory.hpp:261

NumericT
float NumericT
Definition: bisect.cpp:40

viennacl::linalg::prod
VectorT prod(std::vector< std::vector< T, A1 >, A2 > const &matrix, VectorT const &vector)
Definition: prod.hpp:102

viennacl::linalg::upper_tag
A tag class representing an upper triangular matrix.
Definition: forwards.h:854

viennacl::vcl_size_t
std::size_t vcl_size_t
Definition: forwards.h:75

viennacl::matrix_base< NumericT >::size2
size_type size2() const
Returns the number of columns.
Definition: matrix_def.hpp:226

viennacl::matrix_base< NumericT >::handle
handle_type & handle()
Returns the OpenCL handle, non-const-version.
Definition: matrix_def.hpp:244

viennacl::linalg::trans
void trans(const matrix_expression< const matrix_base< NumericT, SizeT, DistanceT >, const matrix_base< NumericT, SizeT, DistanceT >, op_trans > &proxy, matrix_base< NumericT > &temp_trans)
Definition: matrix_operations.hpp:83

viennacl::vector
Definition: forwards.h:266

viennacl::matrix_base< NumericT >::size1
size_type size1() const
Returns the number of rows.
Definition: matrix_def.hpp:224

direct_solve.hpp
Implementations of dense direct solvers are found here.

matrix_proxy.hpp
Proxy classes for matrices.

viennacl::basic_range
A range class that refers to an interval [start, stop), where 'start' is included, and 'stop' is excluded.
Definition: forwards.h:424

viennacl::linalg::unit_lower_tag
A tag class representing a lower triangular matrix with unit diagonal.
Definition: forwards.h:859

viennacl::matrix_base< NumericT >::internal_size2
size_type internal_size2() const
Returns the internal number of columns. Usually required for launching OpenCL kernels only...
Definition: matrix_def.hpp:240

viennacl::matrix_range
Class for representing non-strided submatrices of a bigger matrix A.
Definition: forwards.h:440

viennacl::matrix_base< NumericT >::internal_size1
size_type internal_size1() const
Returns the internal number of rows. Usually required for launching OpenCL kernels only...
Definition: matrix_def.hpp:238

viennacl::linalg::lu_factorize
void lu_factorize(matrix< NumericT, viennacl::row_major > &A)
LU factorization of a row-major dense matrix.
Definition: lu.hpp:42