monitoring_system/simd__aggregator_8h_source.html

// BSD 3-Clause License

// Copyright (c) 2021-2025, 🍀☀🌕🌥 🌊

// See the LICENSE file in the project root for full license information.


#pragma once


#include <algorithm>

#include <atomic>

#include <cmath>

#include <cstddef>

#include <limits>

#include <memory>

#include <numeric>

#include <vector>


#include "kcenon/monitoring/core/result_types.h"


// Platform-specific SIMD includes

#if defined(__x86_64__) || defined(_M_X64) || defined(__i386__) || defined(_M_IX86)

    #if defined(__AVX2__)

        #include <immintrin.h>

        #define SIMD_AVX2_AVAILABLE 1

    #elif defined(__SSE4_1__)

        #include <smmintrin.h>

        #define SIMD_SSE4_AVAILABLE 1

    #elif defined(__SSE2__)

        #include <emmintrin.h>

        #define SIMD_SSE2_AVAILABLE 1

    #endif

#elif defined(__aarch64__) || defined(_M_ARM64)

    #include <arm_neon.h>

    #define SIMD_NEON_AVAILABLE 1

#endif


namespace kcenon::monitoring {


struct simd_capabilities {

    bool sse2_available = false;

    bool sse4_available = false;

    bool avx_available = false;

    bool avx2_available = false;

    bool avx512_available = false;

    bool neon_available = false;


    static simd_capabilities detect() {

        simd_capabilities caps;


#if defined(SIMD_AVX2_AVAILABLE)

        caps.avx2_available = true;

        caps.avx_available = true;

        caps.sse4_available = true;

        caps.sse2_available = true;

#elif defined(SIMD_SSE4_AVAILABLE)

        caps.sse4_available = true;

        caps.sse2_available = true;

#elif defined(SIMD_SSE2_AVAILABLE)

        caps.sse2_available = true;

#elif defined(SIMD_NEON_AVAILABLE)

        caps.neon_available = true;

#endif


        return caps;

    }


};


struct simd_config {

    bool enable_simd = true;

    size_t vector_size = 8;

    size_t alignment = 32;

    bool use_fma = true;


    bool validate() const {

        // Vector size must be power of 2

        if (vector_size == 0 || (vector_size & (vector_size - 1)) != 0) {

            return false;

        }

        // Alignment must be power of 2

        if (alignment == 0 || (alignment & (alignment - 1)) != 0) {

            return false;

        }

        return true;

    }


};


struct statistical_summary {

    size_t count = 0;

    double sum = 0.0;

    double mean = 0.0;

    double variance = 0.0;

    double std_dev = 0.0;

    double min_val = 0.0;

    double max_val = 0.0;

};


struct simd_aggregator_statistics {

    std::atomic<size_t> total_operations{0};

    std::atomic<size_t> simd_operations{0};

    std::atomic<size_t> scalar_operations{0};

    std::atomic<size_t> total_elements_processed{0};


    simd_aggregator_statistics() = default;


    simd_aggregator_statistics(const simd_aggregator_statistics& other)

        : total_operations(other.total_operations.load())

        , simd_operations(other.simd_operations.load())

        , scalar_operations(other.scalar_operations.load())

        , total_elements_processed(other.total_elements_processed.load()) {}


    simd_aggregator_statistics& operator=(const simd_aggregator_statistics& other) {

        if (this != &other) {

            total_operations.store(other.total_operations.load());

            simd_operations.store(other.simd_operations.load());

            scalar_operations.store(other.scalar_operations.load());

            total_elements_processed.store(other.total_elements_processed.load());

        }

        return *this;

    }


    simd_aggregator_statistics(simd_aggregator_statistics&& other) noexcept

        : total_operations(other.total_operations.load())

        , simd_operations(other.simd_operations.load())

        , scalar_operations(other.scalar_operations.load())

        , total_elements_processed(other.total_elements_processed.load()) {}


    simd_aggregator_statistics& operator=(simd_aggregator_statistics&& other) noexcept {

        if (this != &other) {

            total_operations.store(other.total_operations.load());

            simd_operations.store(other.simd_operations.load());

            scalar_operations.store(other.scalar_operations.load());

            total_elements_processed.store(other.total_elements_processed.load());

        }

        return *this;

    }


    double get_simd_utilization() const {

        auto total = total_operations.load();

        if (total == 0) {

            return 0.0;

        }

        return (static_cast<double>(simd_operations.load()) / static_cast<double>(total)) * 100.0;

    }


    void reset() {

        total_operations.store(0);

        simd_operations.store(0);

        scalar_operations.store(0);

        total_elements_processed.store(0);

    }


};


class simd_aggregator {

public:

    simd_aggregator() : simd_aggregator(simd_config{}) {}


    explicit simd_aggregator(const simd_config& config)

        : config_(config)

        , capabilities_(simd_capabilities::detect()) {}


    common::Result<double> sum(const std::vector<double>& data) {

        if (data.empty()) {

            return common::Result<double>::err(error_info(monitoring_error_code::invalid_argument, "Cannot compute sum of empty data").to_common_error());

        }


        stats_.total_operations++;

        stats_.total_elements_processed += data.size();


        double result = 0.0;


        if (should_use_simd(data.size())) {

            result = sum_simd(data);

            stats_.simd_operations++;

        } else {

            result = sum_scalar(data);

            stats_.scalar_operations++;

        }


        return common::ok(result);

    }


    common::Result<double> mean(const std::vector<double>& data) {

        if (data.empty()) {

            return common::Result<double>::err(error_info(monitoring_error_code::invalid_argument, "Cannot compute mean of empty data").to_common_error());

        }


        auto sum_result = sum(data);

        if (sum_result.is_err()) {

            return sum_result;

        }


        return common::ok(sum_result.value() / static_cast<double>(data.size()));

    }


    common::Result<double> min(const std::vector<double>& data) {

        if (data.empty()) {

            return common::Result<double>::err(error_info(monitoring_error_code::invalid_argument, "Cannot compute min of empty data").to_common_error());

        }


        stats_.total_operations++;

        stats_.total_elements_processed += data.size();


        double result = 0.0;


        if (should_use_simd(data.size())) {

            result = min_simd(data);

            stats_.simd_operations++;

        } else {

            result = min_scalar(data);

            stats_.scalar_operations++;

        }


        return common::ok(result);

    }


    common::Result<double> max(const std::vector<double>& data) {

        if (data.empty()) {

            return common::Result<double>::err(error_info(monitoring_error_code::invalid_argument, "Cannot compute max of empty data").to_common_error());

        }


        stats_.total_operations++;

        stats_.total_elements_processed += data.size();


        double result = 0.0;


        if (should_use_simd(data.size())) {

            result = max_simd(data);

            stats_.simd_operations++;

        } else {

            result = max_scalar(data);

            stats_.scalar_operations++;

        }


        return common::ok(result);

    }


    common::Result<double> variance(const std::vector<double>& data) {

        if (data.empty()) {

            return common::Result<double>::err(error_info(monitoring_error_code::invalid_argument, "Cannot compute variance of empty data").to_common_error());

        }


        if (data.size() == 1) {

            return common::ok(0.0);

        }


        auto mean_result = mean(data);

        if (mean_result.is_err()) {

            return mean_result;

        }


        double data_mean = mean_result.value();

        double sum_sq_diff = 0.0;


        for (const auto& val : data) {

            double diff = val - data_mean;

            sum_sq_diff += diff * diff;

        }


        return common::ok(sum_sq_diff / static_cast<double>(data.size() - 1));

    }


    common::Result<statistical_summary> compute_summary(const std::vector<double>& data) {

        if (data.empty()) {

            return common::Result<statistical_summary>::err(error_info(monitoring_error_code::invalid_argument, "Cannot compute summary of empty data").to_common_error());

        }


        statistical_summary summary;

        summary.count = data.size();


        // Compute sum

        auto sum_result = sum(data);

        if (sum_result.is_err()) {

            return common::Result<statistical_summary>::err(error_info(monitoring_error_code::operation_failed, "Failed to compute sum").to_common_error());

        }

        summary.sum = sum_result.value();

        summary.mean = summary.sum / static_cast<double>(summary.count);


        // Compute min/max

        auto min_result = min(data);

        auto max_result = max(data);


        if (min_result.is_err() || max_result.is_err()) {

            return common::Result<statistical_summary>::err(error_info(monitoring_error_code::operation_failed, "Failed to compute min/max").to_common_error());

        }


        summary.min_val = min_result.value();

        summary.max_val = max_result.value();


        // Compute variance

        if (summary.count > 1) {

            auto var_result = variance(data);

            if (var_result.is_ok()) {

                summary.variance = var_result.value();

                summary.std_dev = std::sqrt(summary.variance);

            }

        }


        return common::ok(summary);

    }


    const simd_capabilities& get_capabilities() const {

        return capabilities_;

    }


    common::Result<bool> test_simd() {

        // Create test data

        std::vector<double> test_data = {1.0, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0, 8.0};


        // Test sum

        auto sum_result = sum(test_data);

        if (sum_result.is_err()) {

            return common::ok(false);

        }


        if (std::abs(sum_result.value() - 36.0) > 1e-10) {

            return common::ok(false);

        }


        // Test mean

        auto mean_result = mean(test_data);

        if (mean_result.is_err()) {

            return common::ok(false);

        }


        if (std::abs(mean_result.value() - 4.5) > 1e-10) {

            return common::ok(false);

        }


        // Test min/max

        auto min_result = min(test_data);

        auto max_result = max(test_data);


        if (min_result.is_err() || max_result.is_err()) {

            return common::ok(false);

        }


        if (std::abs(min_result.value() - 1.0) > 1e-10 ||

            std::abs(max_result.value() - 8.0) > 1e-10) {

            return common::ok(false);

        }


        return common::ok(true);

    }


    const simd_aggregator_statistics& get_statistics() const {

        return stats_;

    }


    void reset_statistics() {

        stats_.reset();

    }


private:


    bool should_use_simd(size_t data_size) const {

        if (!config_.enable_simd) {

            return false;

        }


        // Use SIMD only for sufficiently large datasets

        if (data_size < config_.vector_size * 2) {

            return false;

        }


        // Check if any SIMD is available

        return capabilities_.avx2_available ||

               capabilities_.sse2_available ||

               capabilities_.neon_available;

    }


    double sum_scalar(const std::vector<double>& data) const {

        return std::accumulate(data.begin(), data.end(), 0.0);

    }


    double sum_simd(const std::vector<double>& data) const {

#if defined(SIMD_AVX2_AVAILABLE) && (defined(__x86_64__) || defined(_M_X64) || defined(__i386__) || defined(_M_IX86)) && defined(__AVX2__)

        const size_t simd_width = 4;  // AVX processes 4 doubles at a time

        size_t simd_count = data.size() / simd_width;


        __m256d sum_vec = _mm256_setzero_pd();


        for (size_t i = 0; i < simd_count; ++i) {

            __m256d vec = _mm256_loadu_pd(&data[i * simd_width]);

            sum_vec = _mm256_add_pd(sum_vec, vec);

        }


        // Horizontal sum

        alignas(32) double temp[4];

        _mm256_storeu_pd(temp, sum_vec);

        double result = temp[0] + temp[1] + temp[2] + temp[3];


        // Handle remaining elements

        for (size_t i = simd_count * simd_width; i < data.size(); ++i) {

            result += data[i];

        }


        return result;

#elif defined(SIMD_SSE2_AVAILABLE) && (defined(__x86_64__) || defined(_M_X64) || defined(__i386__) || defined(_M_IX86))

        const size_t simd_width = 2;  // SSE processes 2 doubles at a time

        size_t simd_count = data.size() / simd_width;


        __m128d sum_vec = _mm_setzero_pd();


        for (size_t i = 0; i < simd_count; ++i) {

            __m128d vec = _mm_loadu_pd(&data[i * simd_width]);

            sum_vec = _mm_add_pd(sum_vec, vec);

        }


        alignas(16) double temp[2];

        _mm_storeu_pd(temp, sum_vec);

        double result = temp[0] + temp[1];


        for (size_t i = simd_count * simd_width; i < data.size(); ++i) {

            result += data[i];

        }


        return result;

#elif defined(SIMD_NEON_AVAILABLE) && (defined(__aarch64__) || defined(_M_ARM64))

        const size_t simd_width = 2;  // NEON processes 2 doubles at a time

        size_t simd_count = data.size() / simd_width;


        float64x2_t sum_vec = vdupq_n_f64(0.0);


        for (size_t i = 0; i < simd_count; ++i) {

            float64x2_t vec = vld1q_f64(&data[i * simd_width]);

            sum_vec = vaddq_f64(sum_vec, vec);

        }


        double result = vgetq_lane_f64(sum_vec, 0) + vgetq_lane_f64(sum_vec, 1);


        for (size_t i = simd_count * simd_width; i < data.size(); ++i) {

            result += data[i];

        }


        return result;

#else

        return sum_scalar(data);

#endif

    }


    double min_scalar(const std::vector<double>& data) const {

        return *std::min_element(data.begin(), data.end());

    }


    double min_simd(const std::vector<double>& data) const {

#if defined(SIMD_AVX2_AVAILABLE) && (defined(__x86_64__) || defined(_M_X64) || defined(__i386__) || defined(_M_IX86)) && defined(__AVX2__)

        const size_t simd_width = 4;

        size_t simd_count = data.size() / simd_width;


        __m256d min_vec = _mm256_set1_pd(std::numeric_limits<double>::max());


        for (size_t i = 0; i < simd_count; ++i) {

            __m256d vec = _mm256_loadu_pd(&data[i * simd_width]);

            min_vec = _mm256_min_pd(min_vec, vec);

        }


        alignas(32) double temp[4];

        _mm256_storeu_pd(temp, min_vec);

        double result = std::min({temp[0], temp[1], temp[2], temp[3]});


        for (size_t i = simd_count * simd_width; i < data.size(); ++i) {

            result = std::min(result, data[i]);

        }


        return result;

#elif defined(SIMD_SSE2_AVAILABLE) && (defined(__x86_64__) || defined(_M_X64) || defined(__i386__) || defined(_M_IX86))

        const size_t simd_width = 2;

        size_t simd_count = data.size() / simd_width;


        __m128d min_vec = _mm_set1_pd(std::numeric_limits<double>::max());


        for (size_t i = 0; i < simd_count; ++i) {

            __m128d vec = _mm_loadu_pd(&data[i * simd_width]);

            min_vec = _mm_min_pd(min_vec, vec);

        }


        alignas(16) double temp[2];

        _mm_storeu_pd(temp, min_vec);

        double result = std::min(temp[0], temp[1]);


        for (size_t i = simd_count * simd_width; i < data.size(); ++i) {

            result = std::min(result, data[i]);

        }


        return result;

#elif defined(SIMD_NEON_AVAILABLE) && (defined(__aarch64__) || defined(_M_ARM64))

        const size_t simd_width = 2;

        size_t simd_count = data.size() / simd_width;


        float64x2_t min_vec = vdupq_n_f64(std::numeric_limits<double>::max());


        for (size_t i = 0; i < simd_count; ++i) {

            float64x2_t vec = vld1q_f64(&data[i * simd_width]);

            min_vec = vminq_f64(min_vec, vec);

        }


        double result = std::min(vgetq_lane_f64(min_vec, 0), vgetq_lane_f64(min_vec, 1));


        for (size_t i = simd_count * simd_width; i < data.size(); ++i) {

            result = std::min(result, data[i]);

        }


        return result;

#else

        return min_scalar(data);

#endif

    }


    double max_scalar(const std::vector<double>& data) const {

        return *std::max_element(data.begin(), data.end());

    }


    double max_simd(const std::vector<double>& data) const {

#if defined(SIMD_AVX2_AVAILABLE) && (defined(__x86_64__) || defined(_M_X64) || defined(__i386__) || defined(_M_IX86)) && defined(__AVX2__)

        const size_t simd_width = 4;

        size_t simd_count = data.size() / simd_width;


        __m256d max_vec = _mm256_set1_pd(std::numeric_limits<double>::lowest());


        for (size_t i = 0; i < simd_count; ++i) {

            __m256d vec = _mm256_loadu_pd(&data[i * simd_width]);

            max_vec = _mm256_max_pd(max_vec, vec);

        }


        alignas(32) double temp[4];

        _mm256_storeu_pd(temp, max_vec);

        double result = std::max({temp[0], temp[1], temp[2], temp[3]});


        for (size_t i = simd_count * simd_width; i < data.size(); ++i) {

            result = std::max(result, data[i]);

        }


        return result;

#elif defined(SIMD_SSE2_AVAILABLE) && (defined(__x86_64__) || defined(_M_X64) || defined(__i386__) || defined(_M_IX86))

        const size_t simd_width = 2;

        size_t simd_count = data.size() / simd_width;


        __m128d max_vec = _mm_set1_pd(std::numeric_limits<double>::lowest());


        for (size_t i = 0; i < simd_count; ++i) {

            __m128d vec = _mm_loadu_pd(&data[i * simd_width]);

            max_vec = _mm_max_pd(max_vec, vec);

        }


        alignas(16) double temp[2];

        _mm_storeu_pd(temp, max_vec);

        double result = std::max(temp[0], temp[1]);


        for (size_t i = simd_count * simd_width; i < data.size(); ++i) {

            result = std::max(result, data[i]);

        }


        return result;

#elif defined(SIMD_NEON_AVAILABLE) && (defined(__aarch64__) || defined(_M_ARM64))

        const size_t simd_width = 2;

        size_t simd_count = data.size() / simd_width;


        float64x2_t max_vec = vdupq_n_f64(std::numeric_limits<double>::lowest());


        for (size_t i = 0; i < simd_count; ++i) {

            float64x2_t vec = vld1q_f64(&data[i * simd_width]);

            max_vec = vmaxq_f64(max_vec, vec);

        }


        double result = std::max(vgetq_lane_f64(max_vec, 0), vgetq_lane_f64(max_vec, 1));


        for (size_t i = simd_count * simd_width; i < data.size(); ++i) {

            result = std::max(result, data[i]);

        }


        return result;

#else

        return max_scalar(data);

#endif

    }


    simd_config config_;

    simd_capabilities capabilities_;

    mutable simd_aggregator_statistics stats_;

};


inline std::unique_ptr<simd_aggregator> make_simd_aggregator() {

    return std::make_unique<simd_aggregator>();

}


inline std::unique_ptr<simd_aggregator> make_simd_aggregator(const simd_config& config) {

    return std::make_unique<simd_aggregator>(config);

}


inline std::vector<simd_config> create_default_simd_configs() {

    return {

        // SIMD enabled with default settings

        {.enable_simd = true, .vector_size = 8, .alignment = 32, .use_fma = true},

        // SIMD disabled for comparison

        {.enable_simd = false, .vector_size = 8, .alignment = 32, .use_fma = false},

        // Small vector size for smaller datasets

        {.enable_simd = true, .vector_size = 4, .alignment = 16, .use_fma = true},

        // Large vector size for AVX-512

        {.enable_simd = true, .vector_size = 16, .alignment = 64, .use_fma = true}

    };

}


} // namespace kcenon::monitoring

kcenon::monitoring::simd_aggregator
SIMD-accelerated statistical aggregator.
Definition simd_aggregator.h:189

kcenon::monitoring::simd_aggregator::simd_aggregator
simd_aggregator()
Default constructor with default configuration.
Definition simd_aggregator.h:194

kcenon::monitoring::simd_aggregator::reset_statistics
void reset_statistics()
Reset statistics.
Definition simd_aggregator.h:437

kcenon::monitoring::simd_aggregator::compute_summary
common::Result< statistical_summary > compute_summary(const std::vector< double > &data)
Compute full statistical summary.
Definition simd_aggregator.h:335

kcenon::monitoring::simd_aggregator::min_scalar
double min_scalar(const std::vector< double > &data) const
Definition simd_aggregator.h:528

kcenon::monitoring::simd_aggregator::should_use_simd
bool should_use_simd(size_t data_size) const
Definition simd_aggregator.h:442

kcenon::monitoring::simd_aggregator::get_statistics
const simd_aggregator_statistics & get_statistics() const
Get aggregator statistics.
Definition simd_aggregator.h:430

kcenon::monitoring::simd_aggregator::max_scalar
double max_scalar(const std::vector< double > &data) const
Definition simd_aggregator.h:596

kcenon::monitoring::simd_aggregator::mean
common::Result< double > mean(const std::vector< double > &data)
Calculate mean of elements.
Definition simd_aggregator.h:235

kcenon::monitoring::simd_aggregator::max_simd
double max_simd(const std::vector< double > &data) const
Definition simd_aggregator.h:600

kcenon::monitoring::simd_aggregator::capabilities_
simd_capabilities capabilities_
Definition simd_aggregator.h:665

kcenon::monitoring::simd_aggregator::test_simd
common::Result< bool > test_simd()
Self-test SIMD functionality.
Definition simd_aggregator.h:386

kcenon::monitoring::simd_aggregator::sum
common::Result< double > sum(const std::vector< double > &data)
Calculate sum of elements.
Definition simd_aggregator.h:209

kcenon::monitoring::simd_aggregator::variance
common::Result< double > variance(const std::vector< double > &data)
Calculate variance of elements.
Definition simd_aggregator.h:305

kcenon::monitoring::simd_aggregator::min_simd
double min_simd(const std::vector< double > &data) const
Definition simd_aggregator.h:532

kcenon::monitoring::simd_aggregator::simd_aggregator
simd_aggregator(const simd_config &config)
Construct with configuration.
Definition simd_aggregator.h:200

kcenon::monitoring::simd_aggregator::stats_
simd_aggregator_statistics stats_
Definition simd_aggregator.h:666

kcenon::monitoring::simd_aggregator::sum_simd
double sum_simd(const std::vector< double > &data) const
Definition simd_aggregator.h:462

kcenon::monitoring::simd_aggregator::get_capabilities
const simd_capabilities & get_capabilities() const
Get SIMD capabilities.
Definition simd_aggregator.h:378

kcenon::monitoring::simd_aggregator::min
common::Result< double > min(const std::vector< double > &data)
Find minimum value.
Definition simd_aggregator.h:253

kcenon::monitoring::simd_aggregator::sum_scalar
double sum_scalar(const std::vector< double > &data) const
Definition simd_aggregator.h:458

kcenon::monitoring::simd_aggregator::max
common::Result< double > max(const std::vector< double > &data)
Find maximum value.
Definition simd_aggregator.h:279

kcenon::monitoring::simd_aggregator::config_
simd_config config_
Definition simd_aggregator.h:664

kcenon::monitoring
Definition common_to_monitoring_adapter.h:30

kcenon::monitoring::metric_type::summary
@ summary
Pre-calculated quantiles and count/sum.

kcenon::monitoring::make_simd_aggregator
std::unique_ptr< simd_aggregator > make_simd_aggregator()
Create a SIMD aggregator with default configuration.
Definition simd_aggregator.h:673

kcenon::monitoring::create_default_simd_configs
std::vector< simd_config > create_default_simd_configs()
Create default SIMD configurations for different use cases.
Definition simd_aggregator.h:690

kcenon::monitoring::monitoring_error_code::invalid_argument
@ invalid_argument

kcenon::monitoring::monitoring_error_code::operation_failed
@ operation_failed

kcenon::monitoring::gpu_vendor::other
@ other
Other vendor.

result_types.h
Result pattern type definitions for monitoring system.

kcenon::monitoring::error_info
Extended error information with context.
Definition result_types.h:35

kcenon::monitoring::simd_aggregator_statistics
Statistics for SIMD aggregator operations.
Definition simd_aggregator.h:120

kcenon::monitoring::simd_aggregator_statistics::simd_aggregator_statistics
simd_aggregator_statistics(simd_aggregator_statistics &&other) noexcept
Definition simd_aggregator.h:143

kcenon::monitoring::simd_aggregator_statistics::simd_aggregator_statistics
simd_aggregator_statistics(const simd_aggregator_statistics &other)
Definition simd_aggregator.h:127

kcenon::monitoring::simd_aggregator_statistics::simd_aggregator_statistics
simd_aggregator_statistics()=default

kcenon::monitoring::simd_aggregator_statistics::operator=
simd_aggregator_statistics & operator=(simd_aggregator_statistics &&other) noexcept
Definition simd_aggregator.h:149

kcenon::monitoring::simd_aggregator_statistics::scalar_operations
std::atomic< size_t > scalar_operations
Definition simd_aggregator.h:123

kcenon::monitoring::simd_aggregator_statistics::simd_operations
std::atomic< size_t > simd_operations
Definition simd_aggregator.h:122

kcenon::monitoring::simd_aggregator_statistics::reset
void reset()
Reset all statistics.
Definition simd_aggregator.h:174

kcenon::monitoring::simd_aggregator_statistics::operator=
simd_aggregator_statistics & operator=(const simd_aggregator_statistics &other)
Definition simd_aggregator.h:133

kcenon::monitoring::simd_aggregator_statistics::get_simd_utilization
double get_simd_utilization() const
Get SIMD utilization rate.
Definition simd_aggregator.h:163

kcenon::monitoring::simd_aggregator_statistics::total_operations
std::atomic< size_t > total_operations
Definition simd_aggregator.h:121

kcenon::monitoring::simd_aggregator_statistics::total_elements_processed
std::atomic< size_t > total_elements_processed
Definition simd_aggregator.h:124

kcenon::monitoring::simd_capabilities
SIMD capabilities detection.
Definition simd_aggregator.h:46

kcenon::monitoring::simd_capabilities::detect
static simd_capabilities detect()
Detect available SIMD features at runtime.
Definition simd_aggregator.h:57

kcenon::monitoring::simd_capabilities::avx512_available
bool avx512_available
Definition simd_aggregator.h:51

kcenon::monitoring::simd_capabilities::neon_available
bool neon_available
Definition simd_aggregator.h:52

kcenon::monitoring::simd_capabilities::avx2_available
bool avx2_available
Definition simd_aggregator.h:50

kcenon::monitoring::simd_capabilities::sse2_available
bool sse2_available
Definition simd_aggregator.h:47

kcenon::monitoring::simd_capabilities::sse4_available
bool sse4_available
Definition simd_aggregator.h:48

kcenon::monitoring::simd_capabilities::avx_available
bool avx_available
Definition simd_aggregator.h:49

kcenon::monitoring::simd_config
Configuration for SIMD aggregator.
Definition simd_aggregator.h:81

kcenon::monitoring::simd_config::validate
bool validate() const
Validate configuration.
Definition simd_aggregator.h:91

kcenon::monitoring::simd_config::enable_simd
bool enable_simd
Enable SIMD acceleration.
Definition simd_aggregator.h:82

kcenon::monitoring::simd_config::alignment
size_t alignment
Memory alignment for SIMD operations.
Definition simd_aggregator.h:84

kcenon::monitoring::simd_config::vector_size
size_t vector_size
SIMD vector width for processing.
Definition simd_aggregator.h:83

kcenon::monitoring::simd_config::use_fma
bool use_fma
Use fused multiply-add if available.
Definition simd_aggregator.h:85

kcenon::monitoring::statistical_summary
Statistical summary result.
Definition simd_aggregator.h:107

kcenon::monitoring::statistical_summary::count
size_t count
Definition simd_aggregator.h:108

kcenon::monitoring::statistical_summary::mean
double mean
Definition simd_aggregator.h:110

kcenon::monitoring::statistical_summary::min_val
double min_val
Definition simd_aggregator.h:113

kcenon::monitoring::statistical_summary::max_val
double max_val
Definition simd_aggregator.h:114

kcenon::monitoring::statistical_summary::variance
double variance
Definition simd_aggregator.h:111

kcenon::monitoring::statistical_summary::std_dev
double std_dev
Definition simd_aggregator.h:112

kcenon::monitoring::statistical_summary::sum
double sum
Definition simd_aggregator.h:109