doc/matrix__vector_8cpp_source.html

 /* =========================================================================

    Copyright (c) 2010-2016, Institute for Microelectronics,

                             Institute for Analysis and Scientific Computing,

                             TU Wien.

    Portions of this software are copyright by UChicago Argonne, LLC.


                             -----------------

                   ViennaCL - The Vienna Computing Library

                             -----------------


    Project Head:    Karl Rupp                   rupp@iue.tuwien.ac.at


    (A list of authors and contributors can be found in the PDF manual)


    License:         MIT (X11), see file LICENSE in the base directory

 ============================================================================= */


 //

 // *** System

 //

 #include <iostream>

 #include <vector>


 //

 // *** ViennaCL

 //

 //#define VIENNACL_DEBUG_ALL

 #include "viennacl/scalar.hpp"

 #include "viennacl/matrix.hpp"

 #include "viennacl/vector.hpp"

 #include "viennacl/linalg/prod.hpp"

 #include "viennacl/linalg/norm_2.hpp"

 #include "viennacl/linalg/direct_solve.hpp"

 #include "viennacl/linalg/lu.hpp"

 #include "viennacl/linalg/sum.hpp"

 #include "viennacl/tools/random.hpp"


 //

 // -------------------------------------------------------------

 //

 template<typename ScalarType>

 ScalarType diff(ScalarType & s1, viennacl::scalar<ScalarType> & s2)

 {

    viennacl::backend::finish();

    if (s1 != s2)

       return (s1 - s2) / std::max(std::fabs(s1), std::fabs(s2));

    return 0;

 }


 template<typename ScalarType, typename VCLVectorType>

 ScalarType diff(std::vector<ScalarType> const & v1, VCLVectorType const & v2)

 {

    std::vector<ScalarType> v2_cpu(v2.size());

    viennacl::backend::finish();  //workaround for a bug in APP SDK 2.7 on Trinity APUs (with Catalyst 12.8)

    viennacl::copy(v2.begin(), v2.end(), v2_cpu.begin());


    ScalarType norm_inf = 0;

    for (unsigned int i=0;i<v1.size(); ++i)

    {

      if ( std::max( std::fabs(v2_cpu[i]), std::fabs(v1[i]) ) > 0 )

      {

        ScalarType tmp = std::fabs(v2_cpu[i] - v1[i]) / std::max( std::fabs(v2_cpu[i]), std::fabs(v1[i]) );

        if (tmp > norm_inf)

          norm_inf = tmp;

      }

    }


    return norm_inf;

 }


 template<typename ScalarType, typename VCLMatrixType>

 ScalarType diff(std::vector<std::vector<ScalarType> > const & mat1, VCLMatrixType const & mat2)

 {

    std::vector<std::vector<ScalarType> > mat2_cpu(mat2.size1(), std::vector<ScalarType>(mat2.size2()));

    viennacl::backend::finish();  //workaround for a bug in APP SDK 2.7 on Trinity APUs (with Catalyst 12.8)

    viennacl::copy(mat2, mat2_cpu);

    ScalarType ret = 0;

    ScalarType act = 0;


     for (std::size_t i = 0; i < mat2_cpu.size(); ++i)

     {

       for (std::size_t j = 0; j < mat2_cpu[i].size(); ++j)

       {

          act = std::fabs(mat2_cpu[i][j] - mat1[i][j]) / std::max( std::fabs(mat2_cpu[i][j]), std::fabs(mat1[i][j]) );

          if (act > ret)

            ret = act;

       }

     }

    //std::cout << ret << std::endl;

    return ret;

 }

 //

 // -------------------------------------------------------------

 //


 template<typename NumericT, typename Epsilon,

           typename STLMatrixType, typename STLVectorType,

           typename VCLMatrixType, typename VCLVectorType1, typename VCLVectorType2>

 int test_prod_rank1(Epsilon const & epsilon,

                     STLMatrixType & std_m1, STLVectorType & std_v1, STLVectorType & std_v2, STLMatrixType & std_m2,

                     VCLMatrixType & vcl_m1, VCLVectorType1 & vcl_v1, VCLVectorType2 & vcl_v2, VCLMatrixType & vcl_m2)

 {

    int retval = EXIT_SUCCESS;


    // sync data:

    std_v1 = std::vector<NumericT>(std_v1.size(), NumericT(0.1234));

    std_v2 = std::vector<NumericT>(std_v2.size(), NumericT(0.4321));

    viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());

    viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());

    viennacl::copy(std_m1, vcl_m1);


    // --------------------------------------------------------------------------

    std::cout << "Rank 1 update" << std::endl;


    for (std::size_t i=0; i<std_m1.size(); ++i)

      for (std::size_t j=0; j<std_m1[i].size(); ++j)

        std_m1[i][j] += std_v1[i] * std_v2[j];

    vcl_m1 += viennacl::linalg::outer_prod(vcl_v1, vcl_v2);

    if ( std::fabs(diff(std_m1, vcl_m1)) > epsilon )

    {

       std::cout << "# Error at operation: rank 1 update" << std::endl;

       std::cout << "  diff: " << std::fabs(diff(std_m1, vcl_m1)) << std::endl;

       return EXIT_FAILURE;

    }


    // --------------------------------------------------------------------------

    std::cout << "Scaled rank 1 update - CPU Scalar" << std::endl;

    for (std::size_t i=0; i<std_m1.size(); ++i)

      for (std::size_t j=0; j<std_m1[i].size(); ++j)

        std_m1[i][j] += NumericT(4.2) * std_v1[i] * std_v2[j];

    vcl_m1 += NumericT(2.1) * viennacl::linalg::outer_prod(vcl_v1, vcl_v2);

    vcl_m1 += viennacl::linalg::outer_prod(vcl_v1, vcl_v2) * NumericT(2.1);  //check proper compilation

    if ( std::fabs(diff(std_m1, vcl_m1)) > epsilon )

    {

       std::cout << "# Error at operation: scaled rank 1 update - CPU Scalar" << std::endl;

       std::cout << "  diff: " << std::fabs(diff(std_m1, vcl_m1)) << std::endl;

       return EXIT_FAILURE;

    }


       // --------------------------------------------------------------------------

    std::cout << "Scaled rank 1 update - GPU Scalar" << std::endl;

    for (std::size_t i=0; i<std_m1.size(); ++i)

      for (std::size_t j=0; j<std_m1[i].size(); ++j)

        std_m1[i][j] += NumericT(4.2) * std_v1[i] * std_v2[j];

    vcl_m1 += viennacl::scalar<NumericT>(NumericT(2.1)) * viennacl::linalg::outer_prod(vcl_v1, vcl_v2);

    vcl_m1 += viennacl::linalg::outer_prod(vcl_v1, vcl_v2) * viennacl::scalar<NumericT>(NumericT(2.1));  //check proper compilation

    if ( std::fabs(diff(std_m1, vcl_m1)) > epsilon )

    {

       std::cout << "# Error at operation: scaled rank 1 update - GPU Scalar" << std::endl;

       std::cout << "  diff: " << std::fabs(diff(std_m1, vcl_m1)) << std::endl;

       return EXIT_FAILURE;

    }


    //reset vcl_matrix:

    viennacl::copy(std_m1, vcl_m1);


    // --------------------------------------------------------------------------

    std::cout << "Matrix-Vector product" << std::endl;

    for (std::size_t i=0; i<std_m1.size(); ++i)

    {

      std_v1[i] = 0;

      for (std::size_t j=0; j<std_m1[i].size(); ++j)

        std_v1[i] += std_m1[i][j] * std_v2[j];

    }

    vcl_v1   = viennacl::linalg::prod(vcl_m1, vcl_v2);


    if ( std::fabs(diff(std_v1, vcl_v1)) > epsilon )

    {

       std::cout << "# Error at operation: matrix-vector product" << std::endl;

       std::cout << "  diff: " << std::fabs(diff(std_v1, vcl_v1)) << std::endl;

       retval = EXIT_FAILURE;

    }

    // --------------------------------------------------------------------------

    std::cout << "Matrix-Vector product with scaled add" << std::endl;

    NumericT alpha = static_cast<NumericT>(2.786);

    NumericT beta = static_cast<NumericT>(1.432);

    viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());

    viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());


    for (std::size_t i=0; i<std_m1.size(); ++i)

    {

      NumericT tmp = 0;

      for (std::size_t j=0; j<std_m1[i].size(); ++j)

        tmp += std_m1[i][j] * std_v2[j];

      std_v1[i] = alpha * tmp + beta * std_v1[i];

    }

    vcl_v1   = alpha * viennacl::linalg::prod(vcl_m1, vcl_v2) + beta * vcl_v1;


    if ( std::fabs(diff(std_v1, vcl_v1)) > epsilon )

    {

       std::cout << "# Error at operation: matrix-vector product with scaled additions" << std::endl;

       std::cout << "  diff: " << std::fabs(diff(std_v1, vcl_v1)) << std::endl;

       retval = EXIT_FAILURE;

    }

    // --------------------------------------------------------------------------

    std::cout << "Matrix-Vector product with matrix expression" << std::endl;

    for (std::size_t i=0; i<std_m1.size(); ++i)

    {

      std_v1[i] = 0;

      for (std::size_t j=0; j<std_m1[i].size(); ++j)

        std_v1[i] += (std_m1[i][j] + std_m1[i][j]) * std_v2[j];

    }

    vcl_v1   = viennacl::linalg::prod(vcl_m1 + vcl_m1, vcl_v2);


    if ( std::fabs(diff(std_v1, vcl_v1)) > epsilon )

    {

       std::cout << "# Error at operation: matrix-vector product" << std::endl;

       std::cout << "  diff: " << std::fabs(diff(std_v1, vcl_v1)) << std::endl;

       retval = EXIT_FAILURE;

    }

    // --------------------------------------------------------------------------

    std::cout << "Matrix-Vector product with vector expression" << std::endl;

    for (std::size_t i=0; i<std_m1.size(); ++i)

    {

      std_v1[i] = 0;

      for (std::size_t j=0; j<std_m1[i].size(); ++j)

        std_v1[i] += std_m1[i][j] * NumericT(3) * std_v2[j];

    }

    vcl_v1   = viennacl::linalg::prod(vcl_m1, NumericT(3) * vcl_v2);


    if ( std::fabs(diff(std_v1, vcl_v1)) > epsilon )

    {

       std::cout << "# Error at operation: matrix-vector product" << std::endl;

       std::cout << "  diff: " << std::fabs(diff(std_v1, vcl_v1)) << std::endl;

       retval = EXIT_FAILURE;

    }

    // --------------------------------------------------------------------------

    std::cout << "Matrix-Vector product with matrix and vector expression" << std::endl;

    for (std::size_t i=0; i<std_m1.size(); ++i)

    {

      std_v1[i] = 0;

      for (std::size_t j=0; j<std_m1[i].size(); ++j)

        std_v1[i] += (std_m1[i][j] + std_m1[i][j]) * (std_v2[j] + std_v2[j]);

    }

    vcl_v1   = viennacl::linalg::prod(vcl_m1 + vcl_m1, vcl_v2 + vcl_v2);


    if ( std::fabs(diff(std_v1, vcl_v1)) > epsilon )

    {

       std::cout << "# Error at operation: matrix-vector product" << std::endl;

       std::cout << "  diff: " << std::fabs(diff(std_v1, vcl_v1)) << std::endl;

       retval = EXIT_FAILURE;

    }

    // --------------------------------------------------------------------------


    viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());

    viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());


    std::cout << "Transposed Matrix-Vector product" << std::endl;

    for (std::size_t i=0; i<std_m1[0].size(); ++i)

    {

      std_v2[i] = 0;

      for (std::size_t j=0; j<std_m1.size(); ++j)

        std_v2[i] += alpha * std_m1[j][i] * std_v1[j];

    }

    vcl_v2   = alpha * viennacl::linalg::prod(trans(vcl_m1), vcl_v1);


    if ( std::fabs(diff(std_v2, vcl_v2)) > epsilon )

    {

       std::cout << "# Error at operation: transposed matrix-vector product" << std::endl;

       std::cout << "  diff: " << std::fabs(diff(std_v2, vcl_v2)) << std::endl;

       retval = EXIT_FAILURE;

    }


    std::cout << "Transposed Matrix-Vector product with scaled add" << std::endl;

    for (std::size_t i=0; i<std_m1[0].size(); ++i)

    {

      NumericT tmp = 0;

      for (std::size_t j=0; j<std_m1.size(); ++j)

        tmp += std_m1[j][i] * std_v1[j];

      std_v2[i] = alpha * tmp + beta * std_v2[i];

    }

    vcl_v2   = alpha * viennacl::linalg::prod(trans(vcl_m1), vcl_v1) + beta * vcl_v2;


    if ( std::fabs(diff(std_v2, vcl_v2)) > epsilon )

    {

       std::cout << "# Error at operation: transposed matrix-vector product with scaled additions" << std::endl;

       std::cout << "  diff: " << std::fabs(diff(std_v2, vcl_v2)) << std::endl;

       retval = EXIT_FAILURE;

    }

    // --------------------------------------------------------------------------


    std::cout << "Row sum with matrix" << std::endl;

    for (std::size_t i=0; i<std_m1.size(); ++i)

    {

      std_v1[i] = 0;

      for (std::size_t j=0; j<std_m1[i].size(); ++j)

        std_v1[i] += std_m1[i][j];

    }

    vcl_v1   = viennacl::linalg::row_sum(vcl_m1);


    if ( std::fabs(diff(std_v1, vcl_v1)) > epsilon )

    {

       std::cout << "# Error at operation: row sum" << std::endl;

       std::cout << "  diff: " << std::fabs(diff(std_v1, vcl_v1)) << std::endl;

       retval = EXIT_FAILURE;

    }

    // --------------------------------------------------------------------------


    std::cout << "Row sum with matrix expression" << std::endl;

    for (std::size_t i=0; i<std_m1.size(); ++i)

    {

      std_v1[i] = 0;

      for (std::size_t j=0; j<std_m1[i].size(); ++j)

        std_v1[i] += std_m1[i][j] + std_m1[i][j];

    }

    vcl_v1   = viennacl::linalg::row_sum(vcl_m1 + vcl_m1);


    if ( std::fabs(diff(std_v1, vcl_v1)) > epsilon )

    {

       std::cout << "# Error at operation: row sum (with expression)" << std::endl;

       std::cout << "  diff: " << std::fabs(diff(std_v1, vcl_v1)) << std::endl;

       retval = EXIT_FAILURE;

    }

    // --------------------------------------------------------------------------


    std::cout << "Column sum with matrix" << std::endl;

    for (std::size_t i=0; i<std_m1[0].size(); ++i)

    {

      std_v2[i] = 0;

      for (std::size_t j=0; j<std_m1.size(); ++j)

        std_v2[i] += std_m1[j][i];

    }

    vcl_v2   = viennacl::linalg::column_sum(vcl_m1);


    if ( std::fabs(diff(std_v2, vcl_v2)) > epsilon )

    {

       std::cout << "# Error at operation: column sum" << std::endl;

       std::cout << "  diff: " << std::fabs(diff(std_v2, vcl_v2)) << std::endl;

       retval = EXIT_FAILURE;

    }

    // --------------------------------------------------------------------------


    std::cout << "Column sum with matrix expression" << std::endl;

    for (std::size_t i=0; i<std_m1[0].size(); ++i)

    {

      std_v2[i] = 0;

      for (std::size_t j=0; j<std_m1.size(); ++j)

        std_v2[i] += std_m1[j][i] + std_m1[j][i];

    }

    vcl_v2   = viennacl::linalg::column_sum(vcl_m1 + vcl_m1);


    if ( std::fabs(diff(std_v2, vcl_v2)) > epsilon )

    {

       std::cout << "# Error at operation: column sum (with expression)" << std::endl;

       std::cout << "  diff: " << std::fabs(diff(std_v2, vcl_v2)) << std::endl;

       retval = EXIT_FAILURE;

    }

    // --------------------------------------------------------------------------


    viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());

    viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());


    std::cout << "Row extraction from matrix" << std::endl;

    for (std::size_t j=0; j<std_m1[7].size(); ++j)

      std_v2[j] = std_m1[7][j];

    vcl_v2   = row(vcl_m1, std::size_t(7));


    if ( std::fabs(diff(std_v2, vcl_v2)) > epsilon )

    {

       std::cout << "# Error at operation: diagonal extraction from matrix" << std::endl;

       std::cout << "  diff: " << std::fabs(diff(std_v2, vcl_v2)) << std::endl;

       retval = EXIT_FAILURE;

    }


    std::cout << "Column extraction from matrix" << std::endl;

    for (std::size_t i=0; i<std_m1.size(); ++i)

      std_v1[i] = std_m1[i][7];

    vcl_v1   = column(vcl_m1, std::size_t(7));


    if ( std::fabs(diff(std_v1, vcl_v1)) > epsilon )

    {

       std::cout << "# Error at operation: diagonal extraction from matrix" << std::endl;

       std::cout << "  diff: " << std::fabs(diff(std_v2, vcl_v2)) << std::endl;

       retval = EXIT_FAILURE;

    }


    // --------------------------------------------------------------------------


    viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());

    viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());

    viennacl::copy(std_m2, vcl_m2);

    STLMatrixType A = std_m2;


    std::cout << "Diagonal extraction from matrix" << std::endl;

    for (std::size_t i=0; i<std_m1[0].size(); ++i)

      std_v2[i] = std_m1[i + 3][i];

    vcl_v2   = diag(vcl_m1, static_cast<int>(-3));


    if ( std::fabs(diff(std_v2, vcl_v2)) > epsilon )

    {

       std::cout << "# Error at operation: diagonal extraction from matrix" << std::endl;

       std::cout << "  diff: " << std::fabs(diff(std_v2, vcl_v2)) << std::endl;

       retval = EXIT_FAILURE;

    }


    std::cout << "Matrix diagonal assignment from vector" << std::endl;

    A = std::vector<std::vector<NumericT> >(A.size(), std::vector<NumericT>(A[0].size()));

    for (std::size_t i=0; i<std_m1[0].size(); ++i)

      A[i + (A.size() - std_m1[i].size())][i] = std_v2[i];

    vcl_m2 = diag(vcl_v2, static_cast<int>(std_m1[0].size()) - static_cast<int>(A.size()));


    if ( std::fabs(diff(A, vcl_m2)) > epsilon )

    {

       std::cout << "# Error at operation: Matrix assignment from diagonal" << std::endl;

       std::cout << "  diff: " << std::fabs(diff(A, vcl_m2)) << std::endl;

       retval = EXIT_FAILURE;

    }

    // --------------------------------------------------------------------------


    return retval;

 }


 template<typename NumericT>

 void inplace_solve_upper(std::vector<std::vector<NumericT> > const & A, std::vector<NumericT> & b, bool unit_diagonal)

 {

   for (std::size_t i2=0; i2<A.size(); ++i2)

   {

     std::size_t i = A.size() - i2 - 1;

     for (std::size_t j = i+1; j < A.size(); ++j)

       b[i] -= A[i][j] * b[j];

     b[i] = unit_diagonal ? b[i] : b[i] / A[i][i];

   }

 }


 template<typename NumericT>

 void inplace_solve(std::vector<std::vector<NumericT> > const & A, std::vector<NumericT> & b, viennacl::linalg::upper_tag)

 {

   inplace_solve_upper(A, b, false);

 }


 template<typename NumericT>

 void inplace_solve(std::vector<std::vector<NumericT> > const & A, std::vector<NumericT> & b, viennacl::linalg::unit_upper_tag)

 {

   inplace_solve_upper(A, b, true);

 }


 template<typename NumericT>

 void inplace_solve_lower(std::vector<std::vector<NumericT> > const & A, std::vector<NumericT> & b, bool unit_diagonal)

 {

   for (std::size_t i=0; i<A.size(); ++i)

   {

     for (std::size_t j = 0; j < i; ++j)

       b[i] -= A[i][j] * b[j];

     b[i] = unit_diagonal ? b[i] : b[i] / A[i][i];

   }

 }


 template<typename NumericT>

 void inplace_solve(std::vector<std::vector<NumericT> > const & A, std::vector<NumericT> & b, viennacl::linalg::lower_tag)

 {

   inplace_solve_lower(A, b, false);

 }


 template<typename NumericT>

 void inplace_solve(std::vector<std::vector<NumericT> > const & A, std::vector<NumericT> & b, viennacl::linalg::unit_lower_tag)

 {

   inplace_solve_lower(A, b, true);

 }


 template<typename NumericT, typename TagT>

 std::vector<NumericT> solve(std::vector<std::vector<NumericT> > const & A, std::vector<NumericT> const & b, TagT)

 {

   std::vector<NumericT> ret(b);

   inplace_solve(A, ret, TagT());

   return ret;

 }


 template<typename NumericT, typename Epsilon,

           typename STLMatrixType, typename STLVectorType,

           typename VCLMatrixType, typename VCLVectorType1>

 int test_solve(Epsilon const & epsilon,

                STLMatrixType & std_m1, STLVectorType & std_v1,

                VCLMatrixType & vcl_m1, VCLVectorType1 & vcl_v1)

 {

    int retval = EXIT_SUCCESS;


    // sync data:

    //viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());

    viennacl::copy(std_v1, vcl_v1);

    viennacl::copy(std_m1, vcl_m1);


    //upper triangular:

    std::cout << "Upper triangular solver" << std::endl;

    std_v1 = solve(std_m1, std_v1, viennacl::linalg::upper_tag());

    vcl_v1 = viennacl::linalg::solve(vcl_m1, vcl_v1, viennacl::linalg::upper_tag());

    if ( std::fabs(diff(std_v1, vcl_v1)) > epsilon )

    {

       std::cout << "# Error at operation: upper triangular solver" << std::endl;

       std::cout << "  diff: " << std::fabs(diff(std_v1, vcl_v1)) << std::endl;

       retval = EXIT_FAILURE;

    }


    //upper unit triangular:

    std::cout << "Upper unit triangular solver" << std::endl;

    viennacl::copy(std_v1, vcl_v1);

    std_v1 = solve(std_m1, std_v1, viennacl::linalg::unit_upper_tag());

    vcl_v1 = viennacl::linalg::solve(vcl_m1, vcl_v1, viennacl::linalg::unit_upper_tag());

    if ( std::fabs(diff(std_v1, vcl_v1)) > epsilon )

    {

       std::cout << "# Error at operation: unit upper triangular solver" << std::endl;

       std::cout << "  diff: " << std::fabs(diff(std_v1, vcl_v1)) << std::endl;

       retval = EXIT_FAILURE;

    }


    //lower triangular:

    std::cout << "Lower triangular solver" << std::endl;

    viennacl::copy(std_v1, vcl_v1);

    std_v1 = solve(std_m1, std_v1, viennacl::linalg::lower_tag());

    vcl_v1 = viennacl::linalg::solve(vcl_m1, vcl_v1, viennacl::linalg::lower_tag());

    if ( std::fabs(diff(std_v1, vcl_v1)) > epsilon )

    {

       std::cout << "# Error at operation: lower triangular solver" << std::endl;

       std::cout << "  diff: " << std::fabs(diff(std_v1, vcl_v1)) << std::endl;

       retval = EXIT_FAILURE;

    }


    //lower unit triangular:

    std::cout << "Lower unit triangular solver" << std::endl;

    viennacl::copy(std_v1, vcl_v1);

    std_v1 = solve(std_m1, std_v1, viennacl::linalg::unit_lower_tag());

    vcl_v1 = viennacl::linalg::solve(vcl_m1, vcl_v1, viennacl::linalg::unit_lower_tag());

    if ( std::fabs(diff(std_v1, vcl_v1)) > epsilon )

    {

       std::cout << "# Error at operation: unit lower triangular solver" << std::endl;

       std::cout << "  diff: " << std::fabs(diff(std_v1, vcl_v1)) << std::endl;

       retval = EXIT_FAILURE;

    }


    STLMatrixType std_m1_trans(std_m1[0].size(), std::vector<NumericT>(std_m1.size()));

    for (std::size_t i=0; i<std_m1.size(); ++i)

      for (std::size_t j=0; j<std_m1[i].size(); ++j)

        std_m1_trans[j][i] = std_m1[i][j];


    //transposed upper triangular:

    std::cout << "Transposed upper triangular solver" << std::endl;

    viennacl::copy(std_v1, vcl_v1);

    std_v1 = solve(std_m1_trans, std_v1, viennacl::linalg::upper_tag());

    vcl_v1 = viennacl::linalg::solve(trans(vcl_m1), vcl_v1, viennacl::linalg::upper_tag());

    if ( std::fabs(diff(std_v1, vcl_v1)) > epsilon )

    {

       std::cout << "# Error at operation: upper triangular solver" << std::endl;

       std::cout << "  diff: " << std::fabs(diff(std_v1, vcl_v1)) << std::endl;

       retval = EXIT_FAILURE;

    }


    //transposed upper unit triangular:

    std::cout << "Transposed unit upper triangular solver" << std::endl;

    viennacl::copy(std_v1, vcl_v1);

    std_v1 = solve(std_m1_trans, std_v1, viennacl::linalg::unit_upper_tag());

    vcl_v1 = viennacl::linalg::solve(trans(vcl_m1), vcl_v1, viennacl::linalg::unit_upper_tag());

    if ( std::fabs(diff(std_v1, vcl_v1)) > epsilon )

    {

       std::cout << "# Error at operation: unit upper triangular solver" << std::endl;

       std::cout << "  diff: " << std::fabs(diff(std_v1, vcl_v1)) << std::endl;

       retval = EXIT_FAILURE;

    }


    //transposed lower triangular:

    std::cout << "Transposed lower triangular solver" << std::endl;

    viennacl::copy(std_v1, vcl_v1);

    std_v1 = solve(std_m1_trans, std_v1, viennacl::linalg::lower_tag());

    vcl_v1 = viennacl::linalg::solve(trans(vcl_m1), vcl_v1, viennacl::linalg::lower_tag());

    if ( std::fabs(diff(std_v1, vcl_v1)) > epsilon )

    {

       std::cout << "# Error at operation: lower triangular solver" << std::endl;

       std::cout << "  diff: " << std::fabs(diff(std_v1, vcl_v1)) << std::endl;

       retval = EXIT_FAILURE;

    }


    //transposed lower unit triangular:

    std::cout << "Transposed unit lower triangular solver" << std::endl;

    viennacl::copy(std_v1, vcl_v1);

    std_v1 = solve(std_m1_trans, std_v1, viennacl::linalg::unit_lower_tag());

    vcl_v1 = viennacl::linalg::solve(trans(vcl_m1), vcl_v1, viennacl::linalg::unit_lower_tag());

    if ( std::fabs(diff(std_v1, vcl_v1)) > epsilon )

    {

       std::cout << "# Error at operation: unit lower triangular solver" << std::endl;

       std::cout << "  diff: " << std::fabs(diff(std_v1, vcl_v1)) << std::endl;

       retval = EXIT_FAILURE;

    }


    return retval;

 }


 //

 // -------------------------------------------------------------

 //

 template< typename NumericT, typename F, typename Epsilon >

 int test(Epsilon const& epsilon)

 {

    int retval = EXIT_SUCCESS;


    viennacl::tools::uniform_random_numbers<NumericT> randomNumber;


    std::size_t num_rows = 141; //note: use num_rows > num_cols + 3 for diag() tests to work

    std::size_t num_cols = 103;


    // --------------------------------------------------------------------------

    std::vector<NumericT> std_v1(num_rows);

    for (std::size_t i = 0; i < std_v1.size(); ++i)

      std_v1[i] = randomNumber();

    std::vector<NumericT> std_v2 = std::vector<NumericT>(num_cols, NumericT(3.1415));


    std::vector<std::vector<NumericT> > std_m1(std_v1.size(), std::vector<NumericT>(std_v2.size()));


    for (std::size_t i = 0; i < std_m1.size(); ++i)

       for (std::size_t j = 0; j < std_m1[i].size(); ++j)

         std_m1[i][j] = static_cast<NumericT>(0.1) * randomNumber();


    std::vector<std::vector<NumericT> > std_m2(std_v1.size(), std::vector<NumericT>(std_v1.size()));


    for (std::size_t i = 0; i < std_m2.size(); ++i)

    {

       for (std::size_t j = 0; j < std_m2[i].size(); ++j)

          std_m2[i][j] = static_cast<NumericT>(-0.1) * randomNumber();

       std_m2[i][i] = static_cast<NumericT>(2) + randomNumber();

    }


    viennacl::vector<NumericT> vcl_v1_native(std_v1.size());

    viennacl::vector<NumericT> vcl_v1_large(4 * std_v1.size());

    viennacl::vector_range< viennacl::vector<NumericT> > vcl_v1_range(vcl_v1_large, viennacl::range(3, std_v1.size() + 3));

    viennacl::vector_slice< viennacl::vector<NumericT> > vcl_v1_slice(vcl_v1_large, viennacl::slice(2, 3, std_v1.size()));


    viennacl::vector<NumericT> vcl_v2_native(std_v2.size());

    viennacl::vector<NumericT> vcl_v2_large(4 * std_v2.size());

    viennacl::vector_range< viennacl::vector<NumericT> > vcl_v2_range(vcl_v2_large, viennacl::range(8, std_v2.size() + 8));

    viennacl::vector_slice< viennacl::vector<NumericT> > vcl_v2_slice(vcl_v2_large, viennacl::slice(6, 2, std_v2.size()));


    viennacl::matrix<NumericT, F> vcl_m1_native(std_m1.size(), std_m1[0].size());

    viennacl::matrix<NumericT, F> vcl_m1_large(4 * std_m1.size(), 4 * std_m1[0].size());

    viennacl::matrix_range< viennacl::matrix<NumericT, F> > vcl_m1_range(vcl_m1_large,

                                                                         viennacl::range(8, std_m1.size() + 8),

                                                                         viennacl::range(std_m1[0].size(), 2 * std_m1[0].size()) );

    viennacl::matrix_slice< viennacl::matrix<NumericT, F> > vcl_m1_slice(vcl_m1_large,

                                                                         viennacl::slice(6, 2, std_m1.size()),

                                                                         viennacl::slice(std_m1[0].size(), 2, std_m1[0].size()) );


    viennacl::matrix<NumericT, F> vcl_m2_native(std_m2.size(), std_m2[0].size());

    viennacl::matrix<NumericT, F> vcl_m2_large(4 * std_m2.size(), 4 * std_m2[0].size());

    viennacl::matrix_range< viennacl::matrix<NumericT, F> > vcl_m2_range(vcl_m2_large,

                                                                         viennacl::range(8, std_m2.size() + 8),

                                                                         viennacl::range(std_m2[0].size(), 2 * std_m2[0].size()) );

    viennacl::matrix_slice< viennacl::matrix<NumericT, F> > vcl_m2_slice(vcl_m2_large,

                                                                         viennacl::slice(6, 2, std_m2.size()),

                                                                         viennacl::slice(std_m2[0].size(), 2, std_m2[0].size()) );


 /*   std::cout << "Matrix resizing (to larger)" << std::endl;

    matrix.resize(2*num_rows, 2*num_cols, true);

    for (unsigned int i = 0; i < matrix.size1(); ++i)

    {

       for (unsigned int j = (i<result.size() ? rhs.size() : 0); j < matrix.size2(); ++j)

          matrix(i,j) = 0;

    }

    vcl_matrix.resize(2*num_rows, 2*num_cols, true);

    viennacl::copy(vcl_matrix, matrix);

    if ( std::fabs(diff(matrix, vcl_matrix)) > epsilon )

    {

       std::cout << "# Error at operation: matrix resize (to larger)" << std::endl;

       std::cout << "  diff: " << std::fabs(diff(matrix, vcl_matrix)) << std::endl;

       return EXIT_FAILURE;

    }


    matrix(12, 14) = NumericT(1.9);

    matrix(19, 16) = NumericT(1.0);

    matrix (13, 15) =  NumericT(-9);

    vcl_matrix(12, 14) = NumericT(1.9);

    vcl_matrix(19, 16) = NumericT(1.0);

    vcl_matrix (13, 15) =  NumericT(-9);


    std::cout << "Matrix resizing (to smaller)" << std::endl;

    matrix.resize(result.size(), rhs.size(), true);

    vcl_matrix.resize(result.size(), rhs.size(), true);

    if ( std::fabs(diff(matrix, vcl_matrix)) > epsilon )

    {

       std::cout << "# Error at operation: matrix resize (to smaller)" << std::endl;

       std::cout << "  diff: " << std::fabs(diff(matrix, vcl_matrix)) << std::endl;

       return EXIT_FAILURE;

    }

    */


    //

    // Run a bunch of tests for rank-1-updates, matrix-vector products

    //

    std::cout << "------------ Testing rank-1-updates and matrix-vector products ------------------" << std::endl;


    std::cout << "* m = full, v1 = full, v2 = full" << std::endl;

    retval = test_prod_rank1<NumericT>(epsilon,

                                       std_m1, std_v1, std_v2, std_m2,

                                       vcl_m1_native, vcl_v1_native, vcl_v2_native, vcl_m2_native);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    std::cout << "* m = full, v1 = full, v2 = range" << std::endl;

    retval = test_prod_rank1<NumericT>(epsilon,

                                       std_m1, std_v1, std_v2, std_m2,

                                       vcl_m1_native, vcl_v1_native, vcl_v2_range, vcl_m2_native);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    std::cout << "* m = full, v1 = full, v2 = slice" << std::endl;

    retval = test_prod_rank1<NumericT>(epsilon,

                                       std_m1, std_v1, std_v2, std_m2,

                                       vcl_m1_native, vcl_v1_native, vcl_v2_slice, vcl_m2_native);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    // v1 = range


    std::cout << "* m = full, v1 = range, v2 = full" << std::endl;

    retval = test_prod_rank1<NumericT>(epsilon,

                                       std_m1, std_v1, std_v2, std_m2,

                                       vcl_m1_native, vcl_v1_range, vcl_v2_native, vcl_m2_native);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    std::cout << "* m = full, v1 = range, v2 = range" << std::endl;

    retval = test_prod_rank1<NumericT>(epsilon,

                                       std_m1, std_v1, std_v2, std_m2,

                                       vcl_m1_native, vcl_v1_range, vcl_v2_range, vcl_m2_native);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    std::cout << "* m = full, v1 = range, v2 = slice" << std::endl;

    retval = test_prod_rank1<NumericT>(epsilon,

                                       std_m1, std_v1, std_v2, std_m2,

                                       vcl_m1_native, vcl_v1_range, vcl_v2_slice, vcl_m2_native);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    // v1 = slice


    std::cout << "* m = full, v1 = slice, v2 = full" << std::endl;

    retval = test_prod_rank1<NumericT>(epsilon,

                                       std_m1, std_v1, std_v2, std_m2,

                                       vcl_m1_native, vcl_v1_slice, vcl_v2_native, vcl_m2_native);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    std::cout << "* m = full, v1 = slice, v2 = range" << std::endl;

    retval = test_prod_rank1<NumericT>(epsilon,

                                       std_m1, std_v1, std_v2, std_m2,

                                       vcl_m1_native, vcl_v1_slice, vcl_v2_range, vcl_m2_native);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    std::cout << "* m = full, v1 = slice, v2 = slice" << std::endl;

    retval = test_prod_rank1<NumericT>(epsilon,

                                       std_m1, std_v1, std_v2, std_m2,

                                       vcl_m1_native, vcl_v1_slice, vcl_v2_slice, vcl_m2_native);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    std::cout << "* m = range, v1 = full, v2 = full" << std::endl;

    retval = test_prod_rank1<NumericT>(epsilon,

                                       std_m1, std_v1, std_v2, std_m2,

                                       vcl_m1_range, vcl_v1_native, vcl_v2_native, vcl_m2_range);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    std::cout << "* m = range, v1 = full, v2 = range" << std::endl;

    retval = test_prod_rank1<NumericT>(epsilon,

                                       std_m1, std_v1, std_v2, std_m2,

                                       vcl_m1_range, vcl_v1_native, vcl_v2_range, vcl_m2_range);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    std::cout << "* m = range, v1 = full, v2 = slice" << std::endl;

    retval = test_prod_rank1<NumericT>(epsilon,

                                       std_m1, std_v1, std_v2, std_m2,

                                       vcl_m1_range, vcl_v1_native, vcl_v2_slice, vcl_m2_range);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    // v1 = range


    std::cout << "* m = range, v1 = range, v2 = full" << std::endl;

    retval = test_prod_rank1<NumericT>(epsilon,

                                       std_m1, std_v1, std_v2, std_m2,

                                       vcl_m1_range, vcl_v1_range, vcl_v2_native, vcl_m2_range);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    std::cout << "* m = range, v1 = range, v2 = range" << std::endl;

    retval = test_prod_rank1<NumericT>(epsilon,

                                       std_m1, std_v1, std_v2, std_m2,

                                       vcl_m1_range, vcl_v1_range, vcl_v2_range, vcl_m2_range);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    std::cout << "* m = range, v1 = range, v2 = slice" << std::endl;

    retval = test_prod_rank1<NumericT>(epsilon,

                                       std_m1, std_v1, std_v2, std_m2,

                                       vcl_m1_range, vcl_v1_range, vcl_v2_slice, vcl_m2_range);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    // v1 = slice


    std::cout << "* m = range, v1 = slice, v2 = full" << std::endl;

    retval = test_prod_rank1<NumericT>(epsilon,

                                       std_m1, std_v1, std_v2, std_m2,

                                       vcl_m1_range, vcl_v1_slice, vcl_v2_native, vcl_m2_range);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    std::cout << "* m = range, v1 = slice, v2 = range" << std::endl;

    retval = test_prod_rank1<NumericT>(epsilon,

                                       std_m1, std_v1, std_v2, std_m2,

                                       vcl_m1_range, vcl_v1_slice, vcl_v2_range, vcl_m2_range);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    std::cout << "* m = range, v1 = slice, v2 = slice" << std::endl;

    retval = test_prod_rank1<NumericT>(epsilon,

                                       std_m1, std_v1, std_v2, std_m2,

                                       vcl_m1_range, vcl_v1_slice, vcl_v2_slice, vcl_m2_range);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    std::cout << "* m = slice, v1 = full, v2 = full" << std::endl;

    retval = test_prod_rank1<NumericT>(epsilon,

                                       std_m1, std_v1, std_v2, std_m2,

                                       vcl_m1_slice, vcl_v1_native, vcl_v2_native, vcl_m2_slice);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    std::cout << "* m = slice, v1 = full, v2 = range" << std::endl;

    retval = test_prod_rank1<NumericT>(epsilon,

                                       std_m1, std_v1, std_v2, std_m2,

                                       vcl_m1_slice, vcl_v1_native, vcl_v2_range, vcl_m2_slice);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    std::cout << "* m = slice, v1 = full, v2 = slice" << std::endl;

    retval = test_prod_rank1<NumericT>(epsilon,

                                       std_m1, std_v1, std_v2, std_m2,

                                       vcl_m1_slice, vcl_v1_native, vcl_v2_slice, vcl_m2_slice);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    // v1 = range


    std::cout << "* m = slice, v1 = range, v2 = full" << std::endl;

    retval = test_prod_rank1<NumericT>(epsilon,

                                       std_m1, std_v1, std_v2, std_m2,

                                       vcl_m1_slice, vcl_v1_range, vcl_v2_native, vcl_m2_slice);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    std::cout << "* m = slice, v1 = range, v2 = range" << std::endl;

    retval = test_prod_rank1<NumericT>(epsilon,

                                       std_m1, std_v1, std_v2, std_m2,

                                       vcl_m1_slice, vcl_v1_range, vcl_v2_range, vcl_m2_slice);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    std::cout << "* m = slice, v1 = range, v2 = slice" << std::endl;

    retval = test_prod_rank1<NumericT>(epsilon,

                                       std_m1, std_v1, std_v2, std_m2,

                                       vcl_m1_slice, vcl_v1_range, vcl_v2_slice, vcl_m2_slice);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    // v1 = slice


    std::cout << "* m = slice, v1 = slice, v2 = full" << std::endl;

    retval = test_prod_rank1<NumericT>(epsilon,

                                       std_m1, std_v1, std_v2, std_m2,

                                       vcl_m1_slice, vcl_v1_slice, vcl_v2_native, vcl_m2_slice);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    std::cout << "* m = slice, v1 = slice, v2 = range" << std::endl;

    retval = test_prod_rank1<NumericT>(epsilon,

                                       std_m1, std_v1, std_v2, std_m2,

                                       vcl_m1_slice, vcl_v1_slice, vcl_v2_range, vcl_m2_slice);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    std::cout << "* m = slice, v1 = slice, v2 = slice" << std::endl;

    retval = test_prod_rank1<NumericT>(epsilon,

                                       std_m1, std_v1, std_v2, std_m2,

                                       vcl_m1_slice, vcl_v1_slice, vcl_v2_slice, vcl_m2_slice);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    //

    // Testing triangular solve() routines

    //


    std::cout << "------------ Testing triangular solves ------------------" << std::endl;


    std::cout << "* m = full, v1 = full" << std::endl;

    retval = test_solve<NumericT>(epsilon,

                                  std_m2, std_v1,

                                  vcl_m2_native, vcl_v1_native);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    std::cout << "* m = full, v1 = range" << std::endl;

    retval = test_solve<NumericT>(epsilon,

                                  std_m2, std_v1,

                                  vcl_m2_native, vcl_v1_range);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    std::cout << "* m = full, v1 = slice" << std::endl;

    retval = test_solve<NumericT>(epsilon,

                                  std_m2, std_v1,

                                  vcl_m2_native, vcl_v1_slice);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    std::cout << "* m = range, v1 = full" << std::endl;

    retval = test_solve<NumericT>(epsilon,

                                  std_m2, std_v1,

                                  vcl_m2_range, vcl_v1_native);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    std::cout << "* m = range, v1 = range" << std::endl;

    retval = test_solve<NumericT>(epsilon,

                                  std_m2, std_v1,

                                  vcl_m2_range, vcl_v1_range);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    std::cout << "* m = range, v1 = slice" << std::endl;

    retval = test_solve<NumericT>(epsilon,

                                  std_m2, std_v1,

                                  vcl_m2_range, vcl_v1_slice);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    std::cout << "* m = slice, v1 = full" << std::endl;

    retval = test_solve<NumericT>(epsilon,

                                  std_m2, std_v1,

                                  vcl_m2_slice, vcl_v1_native);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    std::cout << "* m = slice, v1 = range" << std::endl;

    retval = test_solve<NumericT>(epsilon,

                                  std_m2, std_v1,

                                  vcl_m2_slice, vcl_v1_range);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    std::cout << "* m = slice, v1 = slice" << std::endl;

    retval = test_solve<NumericT>(epsilon,

                                  std_m2, std_v1,

                                  vcl_m2_slice, vcl_v1_slice);

    if (retval == EXIT_FAILURE)

    {

      std::cout << " --- FAILED! ---" << std::endl;

      return retval;

    }

    else

      std::cout << " --- PASSED ---" << std::endl;


    //full solver:

    std::cout << "Full solver" << std::endl;

    unsigned int lu_dim = 100;

    std::vector<std::vector<NumericT> > square_matrix(lu_dim, std::vector<NumericT>(lu_dim));

    std::vector<NumericT> lu_rhs(lu_dim);

    std::vector<NumericT> lu_result(lu_dim);

    viennacl::matrix<NumericT, F> vcl_square_matrix(lu_dim, lu_dim);

    viennacl::vector<NumericT> vcl_lu_rhs(lu_dim);


    for (std::size_t i=0; i<lu_dim; ++i)

      for (std::size_t j=0; j<lu_dim; ++j)

        square_matrix[i][j] = -static_cast<NumericT>(0.5) * randomNumber();


    //put some more weight on diagonal elements:

    for (std::size_t j=0; j<lu_dim; ++j)

    {

      square_matrix[j][j] = static_cast<NumericT>(20.0) + randomNumber();

      lu_result[j] = NumericT(0.1) + randomNumber();

    }


    for (std::size_t i=0; i<lu_dim; ++i)

      for (std::size_t j=0; j<lu_dim; ++j)

        lu_rhs[i] += square_matrix[i][j] * lu_result[j];


    viennacl::copy(square_matrix, vcl_square_matrix);

    viennacl::copy(lu_rhs, vcl_lu_rhs);


    // ViennaCL:

    viennacl::linalg::lu_factorize(vcl_square_matrix);

    viennacl::linalg::lu_substitute(vcl_square_matrix, vcl_lu_rhs);


    if ( std::fabs(diff(lu_result, vcl_lu_rhs)) > epsilon )

    {

       std::cout << "# Error at operation: dense solver" << std::endl;

       std::cout << "  diff: " << std::fabs(diff(lu_rhs, vcl_lu_rhs)) << std::endl;

       retval = EXIT_FAILURE;

    }


    return retval;

 }

 //

 // -------------------------------------------------------------

 //

 int main()

 {

    std::cout << std::endl;

    std::cout << "----------------------------------------------" << std::endl;

    std::cout << "----------------------------------------------" << std::endl;

    std::cout << "## Test :: Matrix" << std::endl;

    std::cout << "----------------------------------------------" << std::endl;

    std::cout << "----------------------------------------------" << std::endl;

    std::cout << std::endl;


    int retval = EXIT_SUCCESS;


 //   std::cout << std::endl;

 //   std::cout << "----------------------------------------------" << std::endl;

 //   std::cout << std::endl;

 //   {

 //      typedef float NumericT;

 //      NumericT epsilon = NumericT(1.0E-3);

 //      std::cout << "# Testing setup:" << std::endl;

 //      std::cout << "  eps:     " << epsilon << std::endl;

 //      std::cout << "  numeric: float" << std::endl;

 //      std::cout << "  layout: row-major" << std::endl;

 //      retval = test<NumericT, viennacl::row_major>(epsilon);

 //      if ( retval == EXIT_SUCCESS )

 //         std::cout << "# Test passed" << std::endl;

 //      else

 //         return retval;

 //   }

    std::cout << std::endl;

    std::cout << "----------------------------------------------" << std::endl;

    std::cout << std::endl;

    {

       typedef float NumericT;

       NumericT epsilon = NumericT(1.0E-3);

       std::cout << "# Testing setup:" << std::endl;

       std::cout << "  eps:     " << epsilon << std::endl;

       std::cout << "  numeric: float" << std::endl;

       std::cout << "  layout: column-major" << std::endl;

       retval = test<NumericT, viennacl::column_major>(epsilon);

       if ( retval == EXIT_SUCCESS )

          std::cout << "# Test passed" << std::endl;

       else

          return retval;

    }

    std::cout << std::endl;

    std::cout << "----------------------------------------------" << std::endl;

    std::cout << std::endl;


 #ifdef VIENNACL_WITH_OPENCL

    if ( viennacl::ocl::current_device().double_support() )

 #endif

    {

       {

          typedef double NumericT;

          NumericT epsilon = 1.0E-11;

          std::cout << "# Testing setup:" << std::endl;

          std::cout << "  eps:     " << epsilon << std::endl;

          std::cout << "  numeric: double" << std::endl;

          std::cout << "  layout: row-major" << std::endl;

          retval = test<NumericT, viennacl::row_major>(epsilon);

             if ( retval == EXIT_SUCCESS )

                std::cout << "# Test passed" << std::endl;

             else

               return retval;

       }

       std::cout << std::endl;

       std::cout << "----------------------------------------------" << std::endl;

       std::cout << std::endl;

       {

          typedef double NumericT;

          NumericT epsilon = 1.0E-11;

          std::cout << "# Testing setup:" << std::endl;

          std::cout << "  eps:     " << epsilon << std::endl;

          std::cout << "  numeric: double" << std::endl;

          std::cout << "  layout: column-major" << std::endl;

          retval = test<NumericT, viennacl::column_major>(epsilon);

             if ( retval == EXIT_SUCCESS )

                std::cout << "# Test passed" << std::endl;

             else

               return retval;

       }

       std::cout << std::endl;

       std::cout << "----------------------------------------------" << std::endl;

       std::cout << std::endl;

    }


    std::cout << std::endl;

    std::cout << "------- Test completed --------" << std::endl;

    std::cout << std::endl;


    return retval;

 }

viennacl::scalar
This class represents a single scalar value on the GPU and behaves mostly like a built-in scalar type...
Definition: forwards.h:227

norm_2.hpp
Generic interface for the l^2-norm. See viennacl/linalg/vector_operations.hpp for implementations...

viennacl::matrix_slice
Class for representing strided submatrices of a bigger matrix A.
Definition: forwards.h:443

trans
std::vector< std::vector< NumericT > > trans(std::vector< std::vector< NumericT > > const &A)
Definition: blas3_solve.cpp:195

prod.hpp
Generic interface for matrix-vector and matrix-matrix products. See viennacl/linalg/vector_operations...

matrix.hpp
Implementation of the dense matrix class.

viennacl::linalg::row_sum
viennacl::vector_expression< const viennacl::matrix_base< NumericT >, const viennacl::matrix_base< NumericT >, viennacl::op_row_sum > row_sum(viennacl::matrix_base< NumericT > const &A)
User interface function for computing the sum of all elements of each row of a matrix.
Definition: sum.hpp:77

viennacl::linalg::lu_substitute
void lu_substitute(matrix< NumericT, F1, AlignmentV1 > const &A, matrix< NumericT, F2, AlignmentV2 > &B)
LU substitution for the system LU = rhs.
Definition: lu.hpp:201

viennacl::linalg::lower_tag
A tag class representing a lower triangular matrix.
Definition: forwards.h:849

inplace_solve_upper
void inplace_solve_upper(std::vector< std::vector< NumericT > > const &A, std::vector< NumericT > &b, bool unit_diagonal)
Definition: matrix_vector.cpp:422

viennacl::backend::finish
void finish()
Synchronizes the execution. finish() will only return after all compute kernels (CUDA, OpenCL) have completed.
Definition: memory.hpp:54

viennacl::matrix
A dense matrix class.
Definition: forwards.h:375

s2
viennacl::scalar< int > s2
Definition: global_variables.cpp:58

s1
viennacl::scalar< float > s1
Definition: global_variables.cpp:57

viennacl::linalg::detail::max
T max(const T &lhs, const T &rhs)
Maximum.
Definition: util.hpp:59

viennacl::ocl::current_device
viennacl::ocl::device const & current_device()
Convenience function for returning the active device in the current context.
Definition: backend.hpp:351

viennacl::linalg::solve
VectorT solve(MatrixT const &matrix, VectorT const &rhs, bicgstab_tag const &tag, PreconditionerT const &precond)
Definition: bicgstab.hpp:496

main
int main()
Definition: matrix_vector.cpp:1253

NumericT
float NumericT
Definition: bisect.cpp:40

v1
viennacl::vector< float > v1
Definition: global_variables.cpp:60

viennacl::linalg::prod
VectorT prod(std::vector< std::vector< T, A1 >, A2 > const &matrix, VectorT const &vector)
Definition: prod.hpp:102

inplace_solve
void inplace_solve(std::vector< std::vector< NumericT > > const &A, std::vector< NumericT > &b, viennacl::linalg::upper_tag)
Definition: matrix_vector.cpp:434

viennacl::traits::size
vcl_size_t size(VectorType const &vec)
Generic routine for obtaining the size of a vector (ViennaCL, uBLAS, etc.)
Definition: size.hpp:239

viennacl::tools::uniform_random_numbers
Random number generator for returning uniformly distributed values in the closed interval [0...
Definition: random.hpp:44

viennacl::vector_range
Class for representing non-strided subvectors of a bigger vector x.
Definition: forwards.h:434

viennacl::linalg::upper_tag
A tag class representing an upper triangular matrix.
Definition: forwards.h:854

test_solve
int test_solve(Epsilon const &epsilon, STLMatrixType &std_m1, STLVectorType &std_v1, VCLMatrixType &vcl_m1, VCLVectorType1 &vcl_v1)
Definition: matrix_vector.cpp:481

viennacl::vector_slice
Class for representing strided subvectors of a bigger vector x.
Definition: forwards.h:437

viennacl::ocl::device::double_support
bool double_support() const
ViennaCL convenience function: Returns true if the device supports double precision.
Definition: device.hpp:956

viennacl::vector< NumericT >

viennacl::diag
vector_expression< const matrix_base< NumericT >, const int, op_matrix_diag > diag(const matrix_base< NumericT > &A, int k=0)
Definition: matrix.hpp:895

lu.hpp
Implementations of LU factorization for row-major and column-major dense matrices.

direct_solve.hpp
Implementations of dense direct solvers are found here.

viennacl::row
vector_expression< const matrix_base< NumericT, F >, const unsigned int, op_row > row(const matrix_base< NumericT, F > &A, unsigned int i)
Definition: matrix.hpp:910

viennacl::linalg::outer_prod
viennacl::matrix_expression< const vector_base< NumericT >, const vector_base< NumericT >, op_prod > outer_prod(const vector_base< NumericT > &vec1, const vector_base< NumericT > &vec2)
Returns a proxy class for the operation mat += vec1 * vec2^T, i.e. a rank 1 update.
Definition: matrix_operations.hpp:840

sum.hpp
Stub routines for the summation of elements in a vector, or all elements in either a row or column of...

v2
viennacl::vector< int > v2
Definition: global_variables.cpp:61

vector.hpp
The vector type with operator-overloads and proxy classes is defined here. Linear algebra operations ...

viennacl::linalg::norm_inf
T norm_inf(std::vector< T, A > const &v1)
Definition: norm_inf.hpp:60

viennacl::copy
void copy(std::vector< NumericT > &cpu_vec, circulant_matrix< NumericT, AlignmentV > &gpu_mat)
Copies a circulant matrix from the std::vector to the OpenCL device (either GPU or multi-core CPU) ...
Definition: circulant_matrix.hpp:150

random.hpp
A small collection of sequential random number generators.

viennacl::basic_range
A range class that refers to an interval [start, stop), where 'start' is included, and 'stop' is excluded.
Definition: forwards.h:424

ScalarType
float ScalarType
Definition: fft_1d.cpp:42

viennacl::linalg::unit_lower_tag
A tag class representing a lower triangular matrix with unit diagonal.
Definition: forwards.h:859

test_prod_rank1
int test_prod_rank1(Epsilon const &epsilon, STLMatrixType &std_m1, STLVectorType &std_v1, STLVectorType &std_v2, STLMatrixType &std_m2, VCLMatrixType &vcl_m1, VCLVectorType1 &vcl_v1, VCLVectorType2 &vcl_v2, VCLMatrixType &vcl_m2)
Definition: matrix_vector.cpp:104

diff
ScalarType diff(ScalarType &s1, viennacl::scalar< ScalarType > &s2)
Definition: matrix_vector.cpp:47

inplace_solve_lower
void inplace_solve_lower(std::vector< std::vector< NumericT > > const &A, std::vector< NumericT > &b, bool unit_diagonal)
Definition: matrix_vector.cpp:447

viennacl::matrix_range
Class for representing non-strided submatrices of a bigger matrix A.
Definition: forwards.h:440

viennacl::column
vector_expression< const matrix_base< NumericT, F >, const unsigned int, op_column > column(const matrix_base< NumericT, F > &A, unsigned int j)
Definition: matrix.hpp:918

viennacl::basic_slice
A slice class that refers to an interval [start, stop), where 'start' is included, and 'stop' is excluded.
Definition: forwards.h:429

viennacl::linalg::column_sum
viennacl::vector_expression< const viennacl::matrix_base< NumericT >, const viennacl::matrix_base< NumericT >, viennacl::op_col_sum > column_sum(viennacl::matrix_base< NumericT > const &A)
User interface function for computing the sum of all elements of each column of a matrix...
Definition: sum.hpp:109

scalar.hpp
Implementation of the ViennaCL scalar class.

test
int test(Epsilon const &epsilon)
Definition: matrix_vector.cpp:606

viennacl::linalg::lu_factorize
void lu_factorize(matrix< NumericT, viennacl::row_major > &A)
LU factorization of a row-major dense matrix.
Definition: lu.hpp:42

viennacl::linalg::unit_upper_tag
A tag class representing an upper triangular matrix with unit diagonal.
Definition: forwards.h:864

solve
std::vector< NumericT > solve(std::vector< std::vector< NumericT > > const &A, std::vector< NumericT > const &b, TagT)
Definition: matrix_vector.cpp:471