doc/vector__uint_8cpp_source.html

 /* =========================================================================

    Copyright (c) 2010-2016, Institute for Microelectronics,

                             Institute for Analysis and Scientific Computing,

                             TU Wien.

    Portions of this software are copyright by UChicago Argonne, LLC.


                             -----------------

                   ViennaCL - The Vienna Computing Library

                             -----------------


    Project Head:    Karl Rupp                   rupp@iue.tuwien.ac.at


    (A list of authors and contributors can be found in the PDF manual)


    License:         MIT (X11), see file LICENSE in the base directory

 ============================================================================= */


 //

 // *** System

 //

 #include <iostream>

 #include <iomanip>

 #include <vector>


 //

 // *** ViennaCL

 //

 #include "viennacl/vector.hpp"

 #include "viennacl/vector_proxy.hpp"

 #include "viennacl/linalg/inner_prod.hpp"

 #include "viennacl/linalg/norm_1.hpp"

 #include "viennacl/linalg/norm_2.hpp"

 #include "viennacl/linalg/norm_inf.hpp"

 #include "viennacl/linalg/maxmin.hpp"

 #include "viennacl/linalg/sum.hpp"


 //

 // -------------------------------------------------------------

 //

 template<typename ScalarType>

 ScalarType diff(ScalarType const & s1, ScalarType const & s2)

 {

   viennacl::backend::finish();

   return s1 - s2;

 }

 //

 // -------------------------------------------------------------

 //

 template<typename ScalarType>

 ScalarType diff(ScalarType const & s1, viennacl::scalar<ScalarType> const & s2)

 {

   viennacl::backend::finish();

   return s1 - s2;

 }

 //

 // -------------------------------------------------------------

 //

 template<typename ScalarType>

 ScalarType diff(ScalarType const & s1, viennacl::entry_proxy<ScalarType> const & s2)

 {

   viennacl::backend::finish();

   return s1 - s2;

 }

 //

 // -------------------------------------------------------------

 //

 template<typename ScalarType, typename VCLVectorType>

 ScalarType diff(std::vector<ScalarType> const & v1, VCLVectorType const & v2)

 {

    std::vector<ScalarType> v2_cpu(v2.size());

    viennacl::backend::finish();  //workaround for a bug in APP SDK 2.7 on Trinity APUs (with Catalyst 12.8)

    viennacl::copy(v2.begin(), v2.end(), v2_cpu.begin());


    for (unsigned int i=0;i<v1.size(); ++i)

    {

       if (v2_cpu[i] != v1[i])

         return 1;

    }


    return 0;

 }


 template<typename T1, typename T2>

 int check(T1 const & t1, T2 const & t2)

 {

   int retval = EXIT_SUCCESS;


   if (diff(t1, t2) != 0)

   {

     std::cout << "# Error! Difference: " << diff(t1, t2) << std::endl;

     retval = EXIT_FAILURE;

   }

   return retval;

 }


 //

 // -------------------------------------------------------------

 //

 template< typename NumericT, typename STLVectorType, typename ViennaCLVectorType1, typename ViennaCLVectorType2 >

 int test(STLVectorType       & std_v1, STLVectorType       & std_v2,

          ViennaCLVectorType1 & vcl_v1, ViennaCLVectorType2 & vcl_v2)

 {

   int retval = EXIT_SUCCESS;


   NumericT                    cpu_result = 42;

   viennacl::scalar<NumericT>  gpu_result = 43;


   //

   // Initializer:

   //

   std::cout << "Checking for zero_vector initializer..." << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] = 0;

   vcl_v1 = viennacl::zero_vector<NumericT>(vcl_v1.size());

   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Checking for scalar_vector initializer..." << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] = cpu_result;

   vcl_v1 = viennacl::scalar_vector<NumericT>(vcl_v1.size(), cpu_result);

   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] = cpu_result + 1;

   vcl_v1 = viennacl::scalar_vector<NumericT>(vcl_v1.size(), gpu_result);

   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Checking for unit_vector initializer..." << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] = (i == 5) ? 1 : 0;

   vcl_v1 = viennacl::unit_vector<NumericT>(vcl_v1.size(), 5);

   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   for (std::size_t i=0; i<std_v1.size(); ++i)

   {

     std_v1[i] = NumericT(i);

     std_v2[i] = NumericT(i+42);

   }


   viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());  //resync

   viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());


   std::cout << "Checking for successful copy..." << std::endl;

   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;

   if (check(std_v2, vcl_v2) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   //

   // Part 1: Norms and inner product

   //


   // --------------------------------------------------------------------------

   std::cout << "Testing inner_prod..." << std::endl;

   cpu_result = 0;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     cpu_result += std_v1[i] * std_v2[i];

   NumericT cpu_result2 = viennacl::linalg::inner_prod(vcl_v1, vcl_v2);

   gpu_result = viennacl::linalg::inner_prod(vcl_v1, vcl_v2);


   if (check(cpu_result, cpu_result2) != EXIT_SUCCESS)

     return EXIT_FAILURE;

   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   cpu_result = 0;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     cpu_result += (std_v1[i] + std_v2[i]) * (2*std_v2[i]);

   NumericT cpu_result3 = viennacl::linalg::inner_prod(vcl_v1 + vcl_v2, 2*vcl_v2);

   gpu_result = viennacl::linalg::inner_prod(vcl_v1 + vcl_v2, 2*vcl_v2);


   if (check(cpu_result, cpu_result3) != EXIT_SUCCESS)

     return EXIT_FAILURE;

   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   // --------------------------------------------------------------------------

   std::cout << "Testing norm_1..." << std::endl;

   cpu_result = 0;

   for (std::size_t i=0; i<std_v1.size(); ++i)   //note: norm_1 broken for unsigned ints on MacOS

     cpu_result += std_v1[i];

   gpu_result = viennacl::linalg::norm_1(vcl_v1);


   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   cpu_result2 = 0; //reset

   for (std::size_t i=0; i<std_v1.size(); ++i)   //note: norm_1 broken for unsigned ints on MacOS

     cpu_result2 += std_v1[i];

   cpu_result = viennacl::linalg::norm_1(vcl_v1);


   if (check(cpu_result, cpu_result2) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   cpu_result2 = 0;

   for (std::size_t i=0; i<std_v1.size(); ++i)   //note: norm_1 broken for unsigned ints on MacOS

     cpu_result2 += std_v1[i] + std_v2[i];

   cpu_result = viennacl::linalg::norm_1(vcl_v1 + vcl_v2);


   if (check(cpu_result, cpu_result2) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   // --------------------------------------------------------------------------

   std::cout << "Testing norm_inf..." << std::endl;

   cpu_result = 0;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     if (std_v1[i] > cpu_result)

       cpu_result = std_v1[i];

   gpu_result = viennacl::linalg::norm_inf(vcl_v1);


   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   cpu_result2 = 0;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     if (std_v1[i] > cpu_result2)

       cpu_result2 = std_v1[i];

   cpu_result = viennacl::linalg::norm_inf(vcl_v1);


   if (check(cpu_result, cpu_result2) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   cpu_result2 = 0;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     if (std_v1[i] + std_v2[i] > cpu_result2)

       cpu_result2 = std_v1[i] + std_v2[i];

   cpu_result = viennacl::linalg::norm_inf(vcl_v1 + vcl_v2);


   if (check(cpu_result, cpu_result2) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   // --------------------------------------------------------------------------

   std::cout << "Testing index_norm_inf..." << std::endl;


   std::size_t cpu_index = 0;

   cpu_result = 0;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     if (std_v1[i] > cpu_result)

     {

       cpu_result = std_v1[i];

       cpu_index = i;

     }

   std::size_t gpu_index = viennacl::linalg::index_norm_inf(vcl_v1);


   if (check(static_cast<NumericT>(cpu_index), static_cast<NumericT>(gpu_index)) != EXIT_SUCCESS)

     return EXIT_FAILURE;

   // --------------------------------------------------------------------------

   gpu_result = vcl_v1[viennacl::linalg::index_norm_inf(vcl_v1)];


   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   cpu_index = 0;

   cpu_result = 0;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     if (std_v1[i] + std_v2[i] > cpu_result)

     {

       cpu_result = std_v1[i];

       cpu_index = i;

     }

   gpu_result = vcl_v1[viennacl::linalg::index_norm_inf(vcl_v1 + vcl_v2)];


   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   // --------------------------------------------------------------------------

   std::cout << "Testing max..." << std::endl;

   cpu_result = std_v1[0];

   for (std::size_t i=0; i<std_v1.size(); ++i)

     cpu_result = std::max<NumericT>(cpu_result, std_v1[i]);

   gpu_result = viennacl::linalg::max(vcl_v1);


   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   cpu_result = std_v1[0];

   for (std::size_t i=0; i<std_v1.size(); ++i)

     cpu_result = std::max<NumericT>(cpu_result, std_v1[i]);

   gpu_result = cpu_result;

   cpu_result *= 2; //reset

   cpu_result = viennacl::linalg::max(vcl_v1);


   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   cpu_result = std_v1[0] + std_v2[0];

   for (std::size_t i=0; i<std_v1.size(); ++i)

     cpu_result = std::max<NumericT>(cpu_result, std_v1[i] + std_v2[i]);

   gpu_result = cpu_result;

   cpu_result *= 2; //reset

   cpu_result = viennacl::linalg::max(vcl_v1 + vcl_v2);


   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   // --------------------------------------------------------------------------

   std::cout << "Testing min..." << std::endl;

   cpu_result = std_v1[0];

   for (std::size_t i=0; i<std_v1.size(); ++i)

     cpu_result = std::min<NumericT>(cpu_result, std_v1[i]);

   gpu_result = viennacl::linalg::min(vcl_v1);


   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   cpu_result = std_v1[0];

   for (std::size_t i=0; i<std_v1.size(); ++i)

     cpu_result = std::min<NumericT>(cpu_result, std_v1[i]);

   gpu_result = cpu_result;

   cpu_result *= 2; //reset

   cpu_result = viennacl::linalg::min(vcl_v1);


   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   cpu_result = std_v1[0] + std_v2[0];

   for (std::size_t i=0; i<std_v1.size(); ++i)

     cpu_result = std::min<NumericT>(cpu_result, std_v1[i] + std_v2[i]);

   gpu_result = cpu_result;

   cpu_result *= 2; //reset

   cpu_result = viennacl::linalg::min(vcl_v1 + vcl_v2);


   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   // --------------------------------------------------------------------------

   std::cout << "Testing sum..." << std::endl;

   cpu_result = 0;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     cpu_result += std_v1[i];

   cpu_result2 = viennacl::linalg::sum(vcl_v1);

   gpu_result = viennacl::linalg::sum(vcl_v1);


   if (check(cpu_result, cpu_result2) != EXIT_SUCCESS)

     return EXIT_FAILURE;

   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   cpu_result = 0;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     cpu_result += std_v1[i] + std_v2[i];

   cpu_result3 = viennacl::linalg::sum(vcl_v1 + vcl_v2);

   gpu_result = viennacl::linalg::sum(vcl_v1 + vcl_v2);


   if (check(cpu_result, cpu_result3) != EXIT_SUCCESS)

     return EXIT_FAILURE;

   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   // --------------------------------------------------------------------------


   std::cout << "Testing assignments..." << std::endl;

   NumericT val = static_cast<NumericT>(1);

   for (size_t i=0; i < std_v1.size(); ++i)

     std_v1[i] = val;


   for (size_t i=0; i < vcl_v1.size(); ++i)

     vcl_v1(i) = val;


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   //

   // multiplication and division of vectors by scalars

   //

   std::cout << "Testing scaling with CPU scalar..." << std::endl;

   NumericT alpha = static_cast<NumericT>(3);

   viennacl::scalar<NumericT> gpu_alpha = alpha;


   for (size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] *= alpha;

   vcl_v1 *= alpha;


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing scaling with GPU scalar..." << std::endl;

   for (size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] *= alpha;

   vcl_v1 *= gpu_alpha;


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   NumericT beta  = static_cast<NumericT>(2);

   viennacl::scalar<NumericT> gpu_beta = beta;


   std::cout << "Testing shrinking with CPU scalar..." << std::endl;

   for (size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] /= beta;

   vcl_v1 /= beta;


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing shrinking with GPU scalar..." << std::endl;

   for (size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] /= beta;

   vcl_v1 /= gpu_beta;


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   //

   // add and inplace_add of vectors

   //

   for (size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] = NumericT(i);

   for (size_t i=0; i<std_v1.size(); ++i)

     std_v2[i] = 3 * std_v1[i];

   viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());  //resync

   viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());


   std::cout << "Testing add on vector..." << std::endl;


   std::cout << "Checking for successful copy..." << std::endl;

   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;

   if (check(std_v2, vcl_v2) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   for (size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] = std_v1[i] + std_v2[i];

   vcl_v1 = vcl_v1 + vcl_v2;


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace-add on vector..." << std::endl;

   for (size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] += std_v2[i];

   vcl_v1 += vcl_v2;


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   //

   // multiply-add

   //

   std::cout << "Testing multiply-add on vector with CPU scalar (right)..." << std::endl;

   for (size_t i=0; i < std_v1.size(); ++i)

     std_v1[i] = NumericT(i);

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v2[i] = 3 * std_v1[i];

   viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());

   viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());


   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] = std_v1[i] + alpha * std_v2[i];

   vcl_v1 = vcl_v1 + alpha * vcl_v2;


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing multiply-add on vector with CPU scalar (left)..." << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v2[i] = 3 * std_v1[i];

   viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());

   viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());


   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] = alpha * std_v1[i] + std_v2[i];

   vcl_v1 = alpha * vcl_v1 + vcl_v2;


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing multiply-add on vector with CPU scalar (both)..." << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v2[i] = 3 * std_v1[i];

   viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());

   viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());


   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] = alpha * std_v1[i] + beta * std_v2[i];

   vcl_v1 = alpha * vcl_v1 + beta * vcl_v2;


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace multiply-add on vector with CPU scalar..." << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v2[i] = 3 * std_v1[i];

   viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());

   viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());


   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] += alpha * std_v2[i];

   vcl_v1 += alpha * vcl_v2;


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing multiply-add on vector with GPU scalar (right)..." << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v2[i] = 3 * std_v1[i];

   viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());

   viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());


   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] = std_v1[i] + alpha * std_v2[i];

   vcl_v1   = vcl_v1   + gpu_alpha *   vcl_v2;


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing multiply-add on vector with GPU scalar (left)..." << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v2[i] = 3 * std_v1[i];

   viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());

   viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());


   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] = std_v1[i] + alpha * std_v2[i];

   vcl_v1 = vcl_v1 + gpu_alpha * vcl_v2;


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing multiply-add on vector with GPU scalar (both)..." << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v2[i] = 3 * std_v1[i];

   viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());

   viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());


   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] = alpha * std_v1[i] + beta * std_v2[i];

   vcl_v1 = gpu_alpha * vcl_v1 + gpu_beta * vcl_v2;


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace multiply-add on vector with GPU scalar (both, adding)..." << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v2[i] = 3 * std_v1[i];

   viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());

   viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());


   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] += alpha * std_v1[i] + beta * std_v2[i];

   vcl_v1 += gpu_alpha * vcl_v1 + gpu_beta * vcl_v2;


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace multiply-add on vector with GPU scalar..." << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v2[i] = 3 * std_v1[i];

   viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());

   viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());


   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] += alpha * std_v2[i];

   vcl_v1 += gpu_alpha * vcl_v2;


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   //

   // division-add

   //

   std::cout << "Testing division-add on vector with CPU scalar (right)..." << std::endl;

   for (size_t i=0; i < std_v1.size(); ++i)

     std_v1[i] = NumericT(i);

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v2[i] = 3 * std_v1[i];

   viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());

   viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());


   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] = std_v1[i] + std_v2[i] / alpha;

   vcl_v1 = vcl_v1 + vcl_v2 / alpha;


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing division-add on vector with CPU scalar (left)..." << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v2[i] = 3 * std_v1[i];

   viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());

   viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());


   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] = std_v1[i] / alpha + std_v2[i];

   vcl_v1 = vcl_v1 / alpha + vcl_v2;


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing division-add on vector with CPU scalar (both)..." << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v2[i] = 3 * std_v1[i];

   viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());

   viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());


   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] = std_v1[i] / alpha + std_v2[i] / beta;

   vcl_v1 = vcl_v1 / alpha + vcl_v2 / beta;


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing division-multiply-add on vector with CPU scalar..." << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v2[i] = 3 * std_v1[i];

   viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());

   viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());


   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] = std_v1[i] / alpha + std_v2[i] * beta;

   vcl_v1 = vcl_v1 / alpha + vcl_v2 * beta;


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing multiply-division-add on vector with CPU scalar..." << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v2[i] = 3 * std_v1[i];

   viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());

   viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());


   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] = std_v1[i] * alpha + std_v2[i] / beta;

   vcl_v1 = vcl_v1 * alpha + vcl_v2 / beta;


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace division-add on vector with CPU scalar..." << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v2[i] = 3 * std_v1[i];

   viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());

   viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());


   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] += std_v2[i] / alpha;

   vcl_v1 += vcl_v2 / alpha;


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing division-add on vector with GPU scalar (right)..." << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v2[i] = 3 * std_v1[i];

   viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());

   viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());


   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] = std_v1[i] + std_v2[i] / alpha;

   vcl_v1 = vcl_v1 + vcl_v2 / gpu_alpha;


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing division-add on vector with GPU scalar (left)..." << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v2[i] = 3 * std_v1[i];

   viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());

   viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());


   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] = std_v1[i] + std_v2[i] / alpha;

   vcl_v1   = vcl_v1   +   vcl_v2 / gpu_alpha;


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing division-add on vector with GPU scalar (both)..." << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v2[i] = 3 * std_v1[i];

   viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());

   viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());


   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] = std_v1[i] / alpha + std_v2[i] / beta;

   vcl_v1 = vcl_v1 / gpu_alpha + vcl_v2 / gpu_beta;


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace division-add on vector with GPU scalar (both, adding)..." << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v2[i] = 3 * std_v1[i];

   viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());

   viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());


   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] += std_v1[i] / alpha + std_v2[i] / beta;

   vcl_v1 += vcl_v1 / gpu_alpha + vcl_v2 / gpu_beta;


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace division-multiply-add on vector with GPU scalar (adding)..." << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v2[i] = 3 * std_v1[i];

   viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());

   viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());


   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] += std_v1[i] / alpha + std_v2[i] * beta;

   vcl_v1 += vcl_v1 / gpu_alpha + vcl_v2 * gpu_beta;


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace division-add on vector with GPU scalar..." << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v2[i] = 3 * std_v1[i];

   viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());

   viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());


   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] += std_v2[i] * alpha;

   vcl_v1 += vcl_v2 * gpu_alpha;


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   //

   // More complicated expressions (for ensuring the operator overloads work correctly)

   //

   for (size_t i=0; i < std_v1.size(); ++i)

     std_v1[i] = NumericT(i);

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v2[i] = 3 * std_v1[i];

   viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());

   viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());


   std::cout << "Testing three vector additions..." << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] = std_v2[i] + std_v1[i] + std_v2[i];

   vcl_v1 = vcl_v2 + vcl_v1 + vcl_v2;


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   // --------------------------------------------------------------------------

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v2[i] = 3 * std_v1[i];

   viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());

   viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());


   std::cout << "Testing swap..." << std::endl;

   swap(std_v1, std_v2);

   swap(vcl_v1, vcl_v2);


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing elementwise multiplication..." << std::endl;

   std::cout << " v1 = element_prod(v1, v2);" << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] = std_v1[i] * std_v2[i];

   vcl_v1 = viennacl::linalg::element_prod(vcl_v1, vcl_v2);


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " v1 += element_prod(v1, v2);" << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] += std_v1[i] * std_v2[i];

   vcl_v1 += viennacl::linalg::element_prod(vcl_v1, vcl_v2);


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " v1 = element_prod(v1 + v2, v2);" << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] = (std_v1[i] + std_v2[i]) * std_v2[i];

   vcl_v1 = viennacl::linalg::element_prod(vcl_v1 + vcl_v2, vcl_v2);


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " v1 += element_prod(v1 + v2, v2);" << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] += (std_v1[i] + std_v2[i]) * std_v2[i];

   vcl_v1 += viennacl::linalg::element_prod(vcl_v1 + vcl_v2, vcl_v2);


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " v1 = element_prod(v1, v2 + v1);" << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] = std_v1[i] * (std_v2[i] + std_v1[i]);

   vcl_v1 = viennacl::linalg::element_prod(vcl_v1, vcl_v2 + vcl_v1);


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " v1 += element_prod(v1, v2 + v1);" << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] += std_v1[i] * (std_v2[i] + std_v1[i]);

   vcl_v1 += viennacl::linalg::element_prod(vcl_v1, vcl_v2 + vcl_v1);


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " v1 = element_prod(v1 + v2, v2 + v1);" << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] = (std_v1[i] + std_v2[i]) * (std_v2[i] + std_v1[i]);

   vcl_v1 = viennacl::linalg::element_prod(vcl_v1 + vcl_v2, vcl_v2 + vcl_v1);


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " v1 += element_prod(v1 + v2, v2 + v1);" << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] += (std_v1[i] + std_v2[i]) * (std_v2[i] + std_v1[i]);

   vcl_v1 += viennacl::linalg::element_prod(vcl_v1 + vcl_v2, vcl_v2 + vcl_v1);


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing elementwise division..." << std::endl;

   for (std::size_t i=0; i<std_v1.size(); ++i)

   {

     std_v1[i] = NumericT(1 + i);

     std_v2[i] = NumericT(5 + i);

   }


   viennacl::copy(std_v1.begin(), std_v1.end(), vcl_v1.begin());

   viennacl::copy(std_v2.begin(), std_v2.end(), vcl_v2.begin());


   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] = std_v1[i] / std_v2[i];

   vcl_v1 = viennacl::linalg::element_div(vcl_v1, vcl_v2);


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] += std_v1[i] / std_v2[i];

   vcl_v1 += viennacl::linalg::element_div(vcl_v1, vcl_v2);


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] = (std_v1[i] + std_v2[i]) / std_v2[i];

   vcl_v1 = viennacl::linalg::element_div(vcl_v1 + vcl_v2, vcl_v2);


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] += (std_v1[i] + std_v2[i]) / std_v2[i];

   vcl_v1 += viennacl::linalg::element_div(vcl_v1 + vcl_v2, vcl_v2);


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] = std_v1[i] / (std_v2[i] + std_v1[i]);

   vcl_v1 = viennacl::linalg::element_div(vcl_v1, vcl_v2 + vcl_v1);


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] += std_v1[i] / (std_v2[i] + std_v1[i]);

   vcl_v1 += viennacl::linalg::element_div(vcl_v1, vcl_v2 + vcl_v1);


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] = (std_v1[i] + std_v2[i]) / (std_v2[i] + std_v1[i]);

   vcl_v1 = viennacl::linalg::element_div(vcl_v1 + vcl_v2, vcl_v2 + vcl_v1);


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   for (std::size_t i=0; i<std_v1.size(); ++i)

     std_v1[i] += (std_v1[i] + std_v2[i]) / (std_v2[i] + std_v1[i]);

   vcl_v1 += viennacl::linalg::element_div(vcl_v1 + vcl_v2, vcl_v2 + vcl_v1);


   if (check(std_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   // --------------------------------------------------------------------------

   return retval;

 }


 template< typename NumericT >

 int test()

 {

   int retval = EXIT_SUCCESS;

   std::size_t size = 12345;


   std::cout << "Running tests for vector of size " << size << std::endl;


   //

   // Set up STL objects

   //

   std::vector<NumericT> std_full_vec(size);

   std::vector<NumericT> std_full_vec2(std_full_vec.size());


   for (std::size_t i=0; i<std_full_vec.size(); ++i)

   {

     std_full_vec[i]  = NumericT(1.0) + NumericT(i);

     std_full_vec2[i] = NumericT(2.0) + NumericT(i) / NumericT(2);

   }


   std::vector<NumericT> std_range_vec (2 * std_full_vec.size() / 4 - std_full_vec.size() / 4);

   std::vector<NumericT> std_range_vec2(2 * std_full_vec.size() / 4 - std_full_vec.size() / 4);


   for (std::size_t i=0; i<std_range_vec.size(); ++i)

     std_range_vec[i] = std_full_vec[i + std_full_vec.size() / 4];

   for (std::size_t i=0; i<std_range_vec2.size(); ++i)

     std_range_vec2[i] = std_full_vec2[i + 2 * std_full_vec2.size() / 4];


   std::vector<NumericT> std_slice_vec (std_full_vec.size() / 4);

   std::vector<NumericT> std_slice_vec2(std_full_vec.size() / 4);


   for (std::size_t i=0; i<std_slice_vec.size(); ++i)

     std_slice_vec[i] = std_full_vec[3*i + std_full_vec.size() / 4];

   for (std::size_t i=0; i<std_slice_vec2.size(); ++i)

     std_slice_vec2[i] = std_full_vec2[2*i + 2 * std_full_vec2.size() / 4];


   //

   // Set up ViennaCL objects

   //

   viennacl::vector<NumericT> vcl_full_vec(std_full_vec.size());

   viennacl::vector<NumericT> vcl_full_vec2(std_full_vec2.size());


   viennacl::fast_copy(std_full_vec.begin(), std_full_vec.end(), vcl_full_vec.begin());

   viennacl::copy(std_full_vec2.begin(), std_full_vec2.end(), vcl_full_vec2.begin());


   viennacl::range vcl_r1(    vcl_full_vec.size() / 4, 2 * vcl_full_vec.size() / 4);

   viennacl::range vcl_r2(2 * vcl_full_vec2.size() / 4, 3 * vcl_full_vec2.size() / 4);

   viennacl::vector_range< viennacl::vector<NumericT> > vcl_range_vec(vcl_full_vec, vcl_r1);

   viennacl::vector_range< viennacl::vector<NumericT> > vcl_range_vec2(vcl_full_vec2, vcl_r2);


   {

     viennacl::vector<NumericT> vcl_short_vec(vcl_range_vec);

     viennacl::vector<NumericT> vcl_short_vec2 = vcl_range_vec2;


     std::vector<NumericT> std_short_vec(std_range_vec);

     std::vector<NumericT> std_short_vec2(std_range_vec2);


     std::cout << "Testing creation of vectors from range..." << std::endl;

     if (check(std_short_vec, vcl_short_vec) != EXIT_SUCCESS)

       return EXIT_FAILURE;

     if (check(std_short_vec2, vcl_short_vec2) != EXIT_SUCCESS)

       return EXIT_FAILURE;

   }


   viennacl::slice vcl_s1(    vcl_full_vec.size() / 4, 3, vcl_full_vec.size() / 4);

   viennacl::slice vcl_s2(2 * vcl_full_vec2.size() / 4, 2, vcl_full_vec2.size() / 4);

   viennacl::vector_slice< viennacl::vector<NumericT> > vcl_slice_vec(vcl_full_vec, vcl_s1);

   viennacl::vector_slice< viennacl::vector<NumericT> > vcl_slice_vec2(vcl_full_vec2, vcl_s2);


   viennacl::vector<NumericT> vcl_short_vec(vcl_slice_vec);

   viennacl::vector<NumericT> vcl_short_vec2 = vcl_slice_vec2;


   std::vector<NumericT> std_short_vec(std_slice_vec);

   std::vector<NumericT> std_short_vec2(std_slice_vec2);


   std::cout << "Testing creation of vectors from slice..." << std::endl;

   if (check(std_short_vec, vcl_short_vec) != EXIT_SUCCESS)

     return EXIT_FAILURE;

   if (check(std_short_vec2, vcl_short_vec2) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   //

   // Now start running tests for vectors, ranges and slices:

   //


   std::cout << " ** vcl_v1 = vector, vcl_v2 = vector **" << std::endl;

   retval = test<NumericT>(std_short_vec, std_short_vec2,

                           vcl_short_vec, vcl_short_vec2);

   if (retval != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " ** vcl_v1 = vector, vcl_v2 = range **" << std::endl;

   retval = test<NumericT>(std_short_vec, std_short_vec2,

                           vcl_short_vec, vcl_range_vec2);

   if (retval != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " ** vcl_v1 = vector, vcl_v2 = slice **" << std::endl;

   retval = test<NumericT>(std_short_vec, std_short_vec2,

                           vcl_short_vec, vcl_slice_vec2);

   if (retval != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " ** vcl_v1 = range, vcl_v2 = vector **" << std::endl;

   retval = test<NumericT>(std_short_vec, std_short_vec2,

                           vcl_range_vec, vcl_short_vec2);

   if (retval != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " ** vcl_v1 = range, vcl_v2 = range **" << std::endl;

   retval = test<NumericT>(std_short_vec, std_short_vec2,

                           vcl_range_vec, vcl_range_vec2);

   if (retval != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " ** vcl_v1 = range, vcl_v2 = slice **" << std::endl;

   retval = test<NumericT>(std_short_vec, std_short_vec2,

                           vcl_range_vec, vcl_slice_vec2);

   if (retval != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " ** vcl_v1 = slice, vcl_v2 = vector **" << std::endl;

   retval = test<NumericT>(std_short_vec, std_short_vec2,

                           vcl_slice_vec, vcl_short_vec2);

   if (retval != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " ** vcl_v1 = slice, vcl_v2 = range **" << std::endl;

   retval = test<NumericT>(std_short_vec, std_short_vec2,

                           vcl_slice_vec, vcl_range_vec2);

   if (retval != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " ** vcl_v1 = slice, vcl_v2 = slice **" << std::endl;

   retval = test<NumericT>(std_short_vec, std_short_vec2,

                           vcl_slice_vec, vcl_slice_vec2);

   if (retval != EXIT_SUCCESS)

     return EXIT_FAILURE;


   return EXIT_SUCCESS;

 }


 //

 // -------------------------------------------------------------

 //

 int main()

 {

   std::cout << std::endl;

   std::cout << "----------------------------------------------" << std::endl;

   std::cout << "----------------------------------------------" << std::endl;

   std::cout << "## Test :: Vector with Integer types" << std::endl;

   std::cout << "----------------------------------------------" << std::endl;

   std::cout << "----------------------------------------------" << std::endl;

   std::cout << std::endl;


   int retval = EXIT_SUCCESS;


   std::cout << std::endl;

   std::cout << "----------------------------------------------" << std::endl;

   std::cout << std::endl;

   {

     std::cout << "# Testing setup:" << std::endl;

     std::cout << "  numeric: unsigned int" << std::endl;

     retval = test<unsigned int>();

     if ( retval == EXIT_SUCCESS )

       std::cout << "# Test passed" << std::endl;

     else

       return retval;

   }

   std::cout << std::endl;

   std::cout << "----------------------------------------------" << std::endl;

   std::cout << std::endl;

   {

     std::cout << "# Testing setup:" << std::endl;

     std::cout << "  numeric: long" << std::endl;

     retval = test<unsigned long>();

     if ( retval == EXIT_SUCCESS )

       std::cout << "# Test passed" << std::endl;

     else

       return retval;

   }

   std::cout << std::endl;

   std::cout << "----------------------------------------------" << std::endl;

   std::cout << std::endl;


   std::cout << std::endl;

   std::cout << "------- Test completed --------" << std::endl;

   std::cout << std::endl;


   return retval;

 }

viennacl::linalg::element_div
viennacl::vector_expression< const vector_base< T >, const vector_base< T >, op_element_binary< op_div > > element_div(vector_base< T > const &v1, vector_base< T > const &v2)

viennacl::linalg::index_norm_inf
vcl_size_t index_norm_inf(vector_base< T > const &vec)
Computes the index of the first entry that is equal to the supremum-norm in modulus.
Definition: vector_operations.hpp:845

viennacl::scalar
This class represents a single scalar value on the GPU and behaves mostly like a built-in scalar type...
Definition: forwards.h:227

norm_2.hpp
Generic interface for the l^2-norm. See viennacl/linalg/vector_operations.hpp for implementations...

viennacl::linalg::sum
viennacl::scalar_expression< const viennacl::vector_base< NumericT >, const viennacl::vector_base< NumericT >, viennacl::op_sum > sum(viennacl::vector_base< NumericT > const &x)
User interface function for computing the sum of all elements of a vector.
Definition: sum.hpp:45

check
int check(T1 const &t1, T2 const &t2)
Definition: vector_uint.cpp:92

viennacl::backend::finish
void finish()
Synchronizes the execution. finish() will only return after all compute kernels (CUDA, OpenCL) have completed.
Definition: memory.hpp:54

viennacl::zero_vector
Definition: vector_def.hpp:93

viennacl::linalg::inner_prod
viennacl::enable_if< viennacl::is_stl< typename viennacl::traits::tag_of< VectorT1 >::type >::value, typename VectorT1::value_type >::type inner_prod(VectorT1 const &v1, VectorT2 const &v2)
Definition: inner_prod.hpp:100

s2
viennacl::scalar< int > s2
Definition: global_variables.cpp:58

s1
viennacl::scalar< float > s1
Definition: global_variables.cpp:57

inner_prod.hpp
Generic interface for the computation of inner products. See viennacl/linalg/vector_operations.hpp for implementations.

test
int test(STLVectorType &std_v1, STLVectorType &std_v2, ViennaCLVectorType1 &vcl_v1, ViennaCLVectorType2 &vcl_v2)
Definition: vector_uint.cpp:109

norm_1.hpp
Generic interface for the l^1-norm. See viennacl/linalg/vector_operations.hpp for implementations...

NumericT
float NumericT
Definition: bisect.cpp:40

v1
viennacl::vector< float > v1
Definition: global_variables.cpp:60

maxmin.hpp

viennacl::traits::size
vcl_size_t size(VectorType const &vec)
Generic routine for obtaining the size of a vector (ViennaCL, uBLAS, etc.)
Definition: size.hpp:239

viennacl::vector_range
Class for representing non-strided subvectors of a bigger vector x.
Definition: forwards.h:434

viennacl::vector_slice
Class for representing strided subvectors of a bigger vector x.
Definition: forwards.h:437

viennacl::vector< NumericT >

vector_proxy.hpp
Proxy classes for vectors.

viennacl::linalg::cuda::swap
viennacl::enable_if< viennacl::is_scalar< ScalarT1 >::value &&viennacl::is_scalar< ScalarT2 >::value >::type swap(ScalarT1 &s1, ScalarT2 &s2)
Swaps the contents of two scalars, data is copied.
Definition: scalar_operations.hpp:361

main
int main()
Definition: vector_uint.cpp:1076

diff
ScalarType diff(ScalarType const &s1, ScalarType const &s2)
Definition: vector_uint.cpp:48

viennacl::unit_vector
Represents a vector consisting of 1 at a given index and zeros otherwise.
Definition: vector_def.hpp:76

sum.hpp
Stub routines for the summation of elements in a vector, or all elements in either a row or column of...

v2
viennacl::vector< int > v2
Definition: global_variables.cpp:61

vector.hpp
The vector type with operator-overloads and proxy classes is defined here. Linear algebra operations ...

viennacl::scalar_vector
Represents a vector consisting of scalars 's' only, i.e. v[i] = s for all i. To be used as an initial...
Definition: vector_def.hpp:87

viennacl::linalg::max
NumericT max(std::vector< NumericT > const &v1)
Definition: maxmin.hpp:47

viennacl::linalg::norm_inf
T norm_inf(std::vector< T, A > const &v1)
Definition: norm_inf.hpp:60

viennacl::copy
void copy(std::vector< NumericT > &cpu_vec, circulant_matrix< NumericT, AlignmentV > &gpu_mat)
Copies a circulant matrix from the std::vector to the OpenCL device (either GPU or multi-core CPU) ...
Definition: circulant_matrix.hpp:150

viennacl::linalg::norm_1
T norm_1(std::vector< T, A > const &v1)
Definition: norm_1.hpp:61

viennacl::basic_range
A range class that refers to an interval [start, stop), where 'start' is included, and 'stop' is excluded.
Definition: forwards.h:424

ScalarType
float ScalarType
Definition: fft_1d.cpp:42

viennacl::linalg::element_prod
viennacl::vector_expression< const vector_base< T >, const vector_base< T >, op_element_binary< op_prod > > element_prod(vector_base< T > const &v1, vector_base< T > const &v2)

viennacl::basic_slice
A slice class that refers to an interval [start, stop), where 'start' is included, and 'stop' is excluded.
Definition: forwards.h:429

viennacl::entry_proxy
A proxy class for a single element of a vector or matrix. This proxy should not be noticed by end-use...
Definition: forwards.h:233

norm_inf.hpp
Generic interface for the l^infty-norm. See viennacl/linalg/vector_operations.hpp for implementations...

viennacl::linalg::min
NumericT min(std::vector< NumericT > const &v1)
Definition: maxmin.hpp:91

viennacl::fast_copy
void fast_copy(const const_vector_iterator< SCALARTYPE, ALIGNMENT > &gpu_begin, const const_vector_iterator< SCALARTYPE, ALIGNMENT > &gpu_end, CPU_ITERATOR cpu_begin)