thread_system/enhanced__metrics_8cpp_source.html

// BSD 3-Clause License

// Copyright (c) 2024, 🍀☀🌕🌥 🌊

// See the LICENSE file in the project root for full license information.


#include <kcenon/thread/metrics/enhanced_metrics.h>

#include <kcenon/thread/metrics/metrics_backend.h>


namespace kcenon::thread::metrics {


EnhancedThreadPoolMetrics::EnhancedThreadPoolMetrics(std::size_t worker_count)

    : throughput_1s_(std::chrono::seconds{1}),

      throughput_1m_(std::chrono::seconds{60}),

      per_worker_metrics_(worker_count) {

    for (std::size_t i = 0; i < worker_count; ++i) {

        per_worker_metrics_[i].worker_id = i;

    }

}


void EnhancedThreadPoolMetrics::record_submission() {

    tasks_submitted_.fetch_add(1, std::memory_order_relaxed);

}


void EnhancedThreadPoolMetrics::record_enqueue(std::chrono::nanoseconds latency) {

    enqueue_latency_.record(latency);

}


void EnhancedThreadPoolMetrics::record_execution(

    std::chrono::nanoseconds latency,

    bool success) {

    execution_latency_.record(latency);


    if (success) {

        tasks_executed_.fetch_add(1, std::memory_order_relaxed);

    } else {

        tasks_failed_.fetch_add(1, std::memory_order_relaxed);

    }


    // Update throughput counters

    throughput_1s_.increment();

    throughput_1m_.increment();

}


void EnhancedThreadPoolMetrics::record_wait_time(std::chrono::nanoseconds wait) {

    wait_time_.record(wait);

}


void EnhancedThreadPoolMetrics::record_queue_depth(std::size_t depth) {

    current_queue_depth_.store(depth, std::memory_order_relaxed);


    // Update peak

    auto current_peak = peak_queue_depth_.load(std::memory_order_relaxed);

    while (depth > current_peak) {

        if (peak_queue_depth_.compare_exchange_weak(

                current_peak, depth,

                std::memory_order_relaxed,

                std::memory_order_relaxed)) {

            break;

        }

    }


    // Update average calculation

    queue_depth_sum_.fetch_add(depth, std::memory_order_relaxed);

    queue_depth_samples_.fetch_add(1, std::memory_order_relaxed);

}


void EnhancedThreadPoolMetrics::record_worker_state(

    std::size_t worker_id,

    bool busy,

    std::uint64_t duration_ns) {

    // Update global totals

    if (busy) {

        total_busy_time_ns_.fetch_add(duration_ns, std::memory_order_relaxed);

    } else {

        total_idle_time_ns_.fetch_add(duration_ns, std::memory_order_relaxed);

    }


    // Update per-worker metrics

    std::lock_guard<std::mutex> lock(workers_mutex_);

    if (worker_id < per_worker_metrics_.size()) {

        auto& worker = per_worker_metrics_[worker_id];

        worker.is_busy = busy;

        if (busy) {

            worker.busy_time_ns += duration_ns;

        } else {

            worker.idle_time_ns += duration_ns;

        }

        if (!busy && duration_ns > 0) {

            // Task completed

            worker.tasks_executed++;

        }

    }

}


void EnhancedThreadPoolMetrics::set_active_workers(std::size_t count) {

    active_workers_.store(count, std::memory_order_relaxed);

}


EnhancedSnapshot EnhancedThreadPoolMetrics::snapshot() const {

    EnhancedSnapshot snap;

    snap.snapshot_time = std::chrono::steady_clock::now();


    // Basic counters (from MetricsBase)

    snap.tasks_submitted = tasks_submitted();

    snap.tasks_executed = tasks_executed();

    snap.tasks_failed = tasks_failed();


    // Latency percentiles (convert ns to μs)

    snap.enqueue_latency_p50_us = ns_to_us(enqueue_latency_.p50());

    snap.enqueue_latency_p90_us = ns_to_us(enqueue_latency_.p90());

    snap.enqueue_latency_p99_us = ns_to_us(enqueue_latency_.p99());


    snap.execution_latency_p50_us = ns_to_us(execution_latency_.p50());

    snap.execution_latency_p90_us = ns_to_us(execution_latency_.p90());

    snap.execution_latency_p99_us = ns_to_us(execution_latency_.p99());


    snap.wait_time_p50_us = ns_to_us(wait_time_.p50());

    snap.wait_time_p90_us = ns_to_us(wait_time_.p90());

    snap.wait_time_p99_us = ns_to_us(wait_time_.p99());


    // Throughput

    snap.throughput_1s = throughput_1s_.rate_per_second();

    snap.throughput_1m = throughput_1m_.rate_per_second();


    // Queue health

    snap.current_queue_depth = current_queue_depth_.load(std::memory_order_relaxed);

    snap.peak_queue_depth = peak_queue_depth_.load(std::memory_order_relaxed);


    auto samples = queue_depth_samples_.load(std::memory_order_relaxed);

    if (samples > 0) {

        snap.avg_queue_depth =

            static_cast<double>(queue_depth_sum_.load(std::memory_order_relaxed)) /

            static_cast<double>(samples);

    }


    // Worker utilization (from MetricsBase)

    snap.total_busy_time_ns = total_busy_time_ns();

    snap.total_idle_time_ns = total_idle_time_ns();

    snap.active_workers = active_workers_.load(std::memory_order_relaxed);


    auto total_time = snap.total_busy_time_ns + snap.total_idle_time_ns;

    if (total_time > 0) {

        snap.worker_utilization =

            static_cast<double>(snap.total_busy_time_ns) /

            static_cast<double>(total_time);

    }


    // Per-worker utilization

    {

        std::lock_guard<std::mutex> lock(workers_mutex_);

        snap.per_worker_utilization.reserve(per_worker_metrics_.size());

        for (const auto& worker : per_worker_metrics_) {

            auto worker_total = worker.busy_time_ns + worker.idle_time_ns;

            if (worker_total > 0) {

                snap.per_worker_utilization.push_back(

                    static_cast<double>(worker.busy_time_ns) /

                    static_cast<double>(worker_total));

            } else {

                snap.per_worker_utilization.push_back(0.0);

            }

        }

    }


    return snap;

}


const LatencyHistogram& EnhancedThreadPoolMetrics::enqueue_latency() const {

    return enqueue_latency_;

}


const LatencyHistogram& EnhancedThreadPoolMetrics::execution_latency() const {

    return execution_latency_;

}


const LatencyHistogram& EnhancedThreadPoolMetrics::wait_time() const {

    return wait_time_;

}


std::vector<WorkerMetrics> EnhancedThreadPoolMetrics::worker_metrics() const {

    std::lock_guard<std::mutex> lock(workers_mutex_);

    return per_worker_metrics_;

}


const SlidingWindowCounter& EnhancedThreadPoolMetrics::throughput_1s() const {

    return throughput_1s_;

}


const SlidingWindowCounter& EnhancedThreadPoolMetrics::throughput_1m() const {

    return throughput_1m_;

}


void EnhancedThreadPoolMetrics::reset() {

    // Reset base class counters first

    MetricsBase::reset();


    // Reset histograms

    enqueue_latency_.reset();

    execution_latency_.reset();

    wait_time_.reset();


    // Reset throughput counters

    throughput_1s_.reset();

    throughput_1m_.reset();


    // Reset queue depth tracking

    current_queue_depth_.store(0, std::memory_order_relaxed);

    peak_queue_depth_.store(0, std::memory_order_relaxed);

    queue_depth_sum_.store(0, std::memory_order_relaxed);

    queue_depth_samples_.store(0, std::memory_order_relaxed);


    // Reset per-worker metrics

    {

        std::lock_guard<std::mutex> lock(workers_mutex_);

        for (auto& worker : per_worker_metrics_) {

            worker.tasks_executed = 0;

            worker.busy_time_ns = 0;

            worker.idle_time_ns = 0;

            worker.is_busy = false;

        }

    }

}


void EnhancedThreadPoolMetrics::update_worker_count(std::size_t count) {

    std::lock_guard<std::mutex> lock(workers_mutex_);

    if (count > per_worker_metrics_.size()) {

        auto old_size = per_worker_metrics_.size();

        per_worker_metrics_.resize(count);

        for (std::size_t i = old_size; i < count; ++i) {

            per_worker_metrics_[i].worker_id = i;

        }

    }

}


std::string EnhancedThreadPoolMetrics::to_json() const {

    // Delegate to JsonBackend for consistent output format

    auto backend = BackendRegistry::instance().get("json");

    if (backend) {

        return backend->export_enhanced(snapshot());

    }


    // Fallback if registry is not initialized (shouldn't happen)

    JsonBackend fallback;

    return fallback.export_enhanced(snapshot());

}


std::string EnhancedThreadPoolMetrics::to_prometheus(

    const std::string& prefix) const {

    // Create a PrometheusBackend with the specified prefix

    PrometheusBackend backend;

    backend.set_prefix(prefix);

    return backend.export_enhanced(snapshot());

}


} // namespace kcenon::thread::metrics


kcenon::thread::metrics::BackendRegistry::instance
static BackendRegistry & instance()
Get the singleton instance.
Definition metrics_backend.h:270

kcenon::thread::metrics::BackendRegistry::get
std::shared_ptr< MetricsBackend > get(const std::string &name) const
Get a backend by name.
Definition metrics_backend.h:290

kcenon::thread::metrics::EnhancedThreadPoolMetrics::active_workers_
std::atomic< std::size_t > active_workers_
Definition enhanced_metrics.h:426

kcenon::thread::metrics::EnhancedThreadPoolMetrics::record_submission
void record_submission()
Record a task submission.
Definition enhanced_metrics.cpp:19

kcenon::thread::metrics::EnhancedThreadPoolMetrics::current_queue_depth_
std::atomic< std::size_t > current_queue_depth_
Definition enhanced_metrics.h:420

kcenon::thread::metrics::EnhancedThreadPoolMetrics::throughput_1s
const SlidingWindowCounter & throughput_1s() const
Get the 1-second throughput counter (read-only).
Definition enhanced_metrics.cpp:183

kcenon::thread::metrics::EnhancedThreadPoolMetrics::execution_latency
const LatencyHistogram & execution_latency() const
Get the execution latency histogram (read-only).
Definition enhanced_metrics.cpp:170

kcenon::thread::metrics::EnhancedThreadPoolMetrics::set_active_workers
void set_active_workers(std::size_t count)
Set the number of active workers.
Definition enhanced_metrics.cpp:94

kcenon::thread::metrics::EnhancedThreadPoolMetrics::record_execution
void record_execution(std::chrono::nanoseconds latency, bool success)
Record task execution completion.
Definition enhanced_metrics.cpp:27

kcenon::thread::metrics::EnhancedThreadPoolMetrics::snapshot
EnhancedSnapshot snapshot() const
Get a comprehensive snapshot of all metrics.
Definition enhanced_metrics.cpp:98

kcenon::thread::metrics::EnhancedThreadPoolMetrics::throughput_1m
const SlidingWindowCounter & throughput_1m() const
Get the 1-minute throughput counter (read-only).
Definition enhanced_metrics.cpp:187

kcenon::thread::metrics::EnhancedThreadPoolMetrics::wait_time_
LatencyHistogram wait_time_
Definition enhanced_metrics.h:410

kcenon::thread::metrics::EnhancedThreadPoolMetrics::to_prometheus
std::string to_prometheus(const std::string &prefix="thread_pool") const
Export metrics in Prometheus/OpenMetrics format.
Definition enhanced_metrics.cpp:245

kcenon::thread::metrics::EnhancedThreadPoolMetrics::throughput_1s_
SlidingWindowCounter throughput_1s_
Definition enhanced_metrics.h:413

kcenon::thread::metrics::EnhancedThreadPoolMetrics::worker_metrics
std::vector< WorkerMetrics > worker_metrics() const
Get per-worker metrics.
Definition enhanced_metrics.cpp:178

kcenon::thread::metrics::EnhancedThreadPoolMetrics::execution_latency_
LatencyHistogram execution_latency_
Definition enhanced_metrics.h:409

kcenon::thread::metrics::EnhancedThreadPoolMetrics::record_worker_state
void record_worker_state(std::size_t worker_id, bool busy, std::uint64_t duration_ns=0)
Update worker state.
Definition enhanced_metrics.cpp:66

kcenon::thread::metrics::EnhancedThreadPoolMetrics::queue_depth_sum_
std::atomic< std::uint64_t > queue_depth_sum_
Definition enhanced_metrics.h:422

kcenon::thread::metrics::EnhancedThreadPoolMetrics::record_wait_time
void record_wait_time(std::chrono::nanoseconds wait)
Record wait time (time spent in queue).
Definition enhanced_metrics.cpp:43

kcenon::thread::metrics::EnhancedThreadPoolMetrics::to_json
std::string to_json() const
Export metrics as JSON string.
Definition enhanced_metrics.cpp:233

kcenon::thread::metrics::EnhancedThreadPoolMetrics::peak_queue_depth_
std::atomic< std::size_t > peak_queue_depth_
Definition enhanced_metrics.h:421

kcenon::thread::metrics::EnhancedThreadPoolMetrics::per_worker_metrics_
std::vector< WorkerMetrics > per_worker_metrics_
Definition enhanced_metrics.h:430

kcenon::thread::metrics::EnhancedThreadPoolMetrics::reset
void reset() override
Reset all metrics to initial state.
Definition enhanced_metrics.cpp:191

kcenon::thread::metrics::EnhancedThreadPoolMetrics::queue_depth_samples_
std::atomic< std::uint64_t > queue_depth_samples_
Definition enhanced_metrics.h:423

kcenon::thread::metrics::EnhancedThreadPoolMetrics::wait_time
const LatencyHistogram & wait_time() const
Get the wait time histogram (read-only).
Definition enhanced_metrics.cpp:174

kcenon::thread::metrics::EnhancedThreadPoolMetrics::enqueue_latency
const LatencyHistogram & enqueue_latency() const
Get the enqueue latency histogram (read-only).
Definition enhanced_metrics.cpp:166

kcenon::thread::metrics::EnhancedThreadPoolMetrics::ns_to_us
static double ns_to_us(double ns)
Definition enhanced_metrics.h:433

kcenon::thread::metrics::EnhancedThreadPoolMetrics::record_enqueue
void record_enqueue(std::chrono::nanoseconds latency)
Record enqueue operation latency.
Definition enhanced_metrics.cpp:23

kcenon::thread::metrics::EnhancedThreadPoolMetrics::enqueue_latency_
LatencyHistogram enqueue_latency_
Definition enhanced_metrics.h:408

kcenon::thread::metrics::EnhancedThreadPoolMetrics::EnhancedThreadPoolMetrics
EnhancedThreadPoolMetrics(std::size_t worker_count=0)
Constructs enhanced metrics with the specified worker count.
Definition enhanced_metrics.cpp:10

kcenon::thread::metrics::EnhancedThreadPoolMetrics::update_worker_count
void update_worker_count(std::size_t count)
Update worker count.
Definition enhanced_metrics.cpp:222

kcenon::thread::metrics::EnhancedThreadPoolMetrics::throughput_1m_
SlidingWindowCounter throughput_1m_
Definition enhanced_metrics.h:414

kcenon::thread::metrics::EnhancedThreadPoolMetrics::record_queue_depth
void record_queue_depth(std::size_t depth)
Record current queue depth.
Definition enhanced_metrics.cpp:47

kcenon::thread::metrics::EnhancedThreadPoolMetrics::workers_mutex_
std::mutex workers_mutex_
Definition enhanced_metrics.h:429

kcenon::thread::metrics::JsonBackend
JSON format backend.
Definition metrics_backend.h:196

kcenon::thread::metrics::JsonBackend::export_enhanced
std::string export_enhanced(const EnhancedSnapshot &snapshot) const override
Export enhanced metrics snapshot.
Definition metrics_backend.cpp:180

kcenon::thread::metrics::LatencyHistogram
HDR-style histogram for latency distribution with logarithmic buckets.
Definition latency_histogram.h:51

kcenon::thread::metrics::LatencyHistogram::record
void record(std::chrono::nanoseconds value)
Record a latency value.
Definition latency_histogram.cpp:91

kcenon::thread::metrics::LatencyHistogram::p50
double p50() const
Get the 50th percentile (median).
Definition latency_histogram.h:124

kcenon::thread::metrics::LatencyHistogram::p90
double p90() const
Get the 90th percentile.
Definition latency_histogram.h:130

kcenon::thread::metrics::LatencyHistogram::p99
double p99() const
Get the 99th percentile.
Definition latency_histogram.h:142

kcenon::thread::metrics::LatencyHistogram::reset
void reset()
Reset all buckets and counters to zero.
Definition latency_histogram.cpp:211

kcenon::thread::metrics::MetricsBackend::set_prefix
virtual void set_prefix(const std::string &prefix)
Set metric name prefix.
Definition metrics_backend.h:90

kcenon::thread::metrics::MetricsBase::total_busy_time_ns
std::uint64_t total_busy_time_ns() const
Get the total busy time in nanoseconds.
Definition metrics_base.h:171

kcenon::thread::metrics::MetricsBase::tasks_failed_
std::atomic< std::uint64_t > tasks_failed_
Counter for failed tasks.
Definition metrics_base.h:266

kcenon::thread::metrics::MetricsBase::tasks_executed
std::uint64_t tasks_executed() const
Get the total number of tasks successfully executed.
Definition metrics_base.h:155

kcenon::thread::metrics::MetricsBase::total_idle_time_ns_
std::atomic< std::uint64_t > total_idle_time_ns_
Accumulated idle time in nanoseconds.
Definition metrics_base.h:276

kcenon::thread::metrics::MetricsBase::tasks_submitted
std::uint64_t tasks_submitted() const
Get the total number of tasks submitted.
Definition metrics_base.h:147

kcenon::thread::metrics::MetricsBase::tasks_failed
std::uint64_t tasks_failed() const
Get the total number of failed tasks.
Definition metrics_base.h:163

kcenon::thread::metrics::MetricsBase::total_busy_time_ns_
std::atomic< std::uint64_t > total_busy_time_ns_
Accumulated busy time in nanoseconds.
Definition metrics_base.h:271

kcenon::thread::metrics::MetricsBase::tasks_submitted_
std::atomic< std::uint64_t > tasks_submitted_
Counter for submitted tasks.
Definition metrics_base.h:256

kcenon::thread::metrics::MetricsBase::total_idle_time_ns
std::uint64_t total_idle_time_ns() const
Get the total idle time in nanoseconds.
Definition metrics_base.h:179

kcenon::thread::metrics::MetricsBase::tasks_executed_
std::atomic< std::uint64_t > tasks_executed_
Counter for successfully executed tasks.
Definition metrics_base.h:261

kcenon::thread::metrics::MetricsBase::reset
virtual void reset()
Reset all metrics to their initial state.
Definition metrics_base.h:131

kcenon::thread::metrics::PrometheusBackend
Prometheus/OpenMetrics format backend.
Definition metrics_backend.h:149

kcenon::thread::metrics::PrometheusBackend::export_enhanced
std::string export_enhanced(const EnhancedSnapshot &snapshot) const override
Export enhanced metrics snapshot.
Definition metrics_backend.cpp:66

kcenon::thread::metrics::SlidingWindowCounter
Sliding window counter for throughput measurement.
Definition sliding_window_counter.h:51

kcenon::thread::metrics::SlidingWindowCounter::reset
void reset()
Reset the counter.
Definition sliding_window_counter.cpp:127

kcenon::thread::metrics::SlidingWindowCounter::increment
void increment(std::size_t count=1)
Increment the counter.
Definition sliding_window_counter.cpp:89

kcenon::thread::metrics::SlidingWindowCounter::rate_per_second
double rate_per_second() const
Get the current rate per second.
Definition sliding_window_counter.cpp:103

enhanced_metrics.h
Enhanced metrics snapshot with latency percentiles and throughput.

metrics_backend.h
Abstract interface for metrics export backends.

kcenon::thread::metrics
Definition enhanced_metrics.cpp:8

kcenon::thread::error_code::success
@ success

kcenon::thread::scaling_reason::latency
@ latency
Latency threshold exceeded.

kcenon::thread::dag_failure_policy::fallback
@ fallback
Execute fallback job if available.

std
STL namespace.

kcenon::thread::metrics::EnhancedSnapshot
Enhanced snapshot with latency percentiles and throughput.
Definition enhanced_metrics.h:35

kcenon::thread::metrics::EnhancedSnapshot::throughput_1s
double throughput_1s
Tasks completed per second (1-second window).
Definition enhanced_metrics.h:111

kcenon::thread::metrics::EnhancedSnapshot::peak_queue_depth
std::size_t peak_queue_depth
Peak queue depth since last reset.
Definition enhanced_metrics.h:130

kcenon::thread::metrics::EnhancedSnapshot::worker_utilization
double worker_utilization
Overall worker utilization (0.0 - 1.0).
Definition enhanced_metrics.h:146

kcenon::thread::metrics::EnhancedSnapshot::active_workers
std::size_t active_workers
Number of active workers.
Definition enhanced_metrics.h:156

kcenon::thread::metrics::EnhancedSnapshot::enqueue_latency_p50_us
double enqueue_latency_p50_us
Median (P50) enqueue latency in microseconds.
Definition enhanced_metrics.h:62

kcenon::thread::metrics::EnhancedSnapshot::tasks_failed
std::uint64_t tasks_failed
Total tasks that failed during execution.
Definition enhanced_metrics.h:53

kcenon::thread::metrics::EnhancedSnapshot::total_busy_time_ns
std::uint64_t total_busy_time_ns
Total busy time across all workers in nanoseconds.
Definition enhanced_metrics.h:165

kcenon::thread::metrics::EnhancedSnapshot::snapshot_time
std::chrono::steady_clock::time_point snapshot_time
Timestamp when this snapshot was taken.
Definition enhanced_metrics.h:175

kcenon::thread::metrics::EnhancedSnapshot::enqueue_latency_p90_us
double enqueue_latency_p90_us
90th percentile enqueue latency in microseconds.
Definition enhanced_metrics.h:67

kcenon::thread::metrics::EnhancedSnapshot::wait_time_p90_us
double wait_time_p90_us
90th percentile wait time in microseconds.
Definition enhanced_metrics.h:97

kcenon::thread::metrics::EnhancedSnapshot::execution_latency_p99_us
double execution_latency_p99_us
99th percentile execution latency in microseconds.
Definition enhanced_metrics.h:87

kcenon::thread::metrics::EnhancedSnapshot::tasks_executed
std::uint64_t tasks_executed
Total tasks successfully executed.
Definition enhanced_metrics.h:48

kcenon::thread::metrics::EnhancedSnapshot::tasks_submitted
std::uint64_t tasks_submitted
Total tasks submitted to the pool.
Definition enhanced_metrics.h:43

kcenon::thread::metrics::EnhancedSnapshot::total_idle_time_ns
std::uint64_t total_idle_time_ns
Total idle time across all workers in nanoseconds.
Definition enhanced_metrics.h:170

kcenon::thread::metrics::EnhancedSnapshot::avg_queue_depth
double avg_queue_depth
Average queue depth over the sampling period.
Definition enhanced_metrics.h:135

kcenon::thread::metrics::EnhancedSnapshot::execution_latency_p50_us
double execution_latency_p50_us
Median execution latency in microseconds.
Definition enhanced_metrics.h:77

kcenon::thread::metrics::EnhancedSnapshot::wait_time_p50_us
double wait_time_p50_us
Median wait time (queue time) in microseconds.
Definition enhanced_metrics.h:92

kcenon::thread::metrics::EnhancedSnapshot::throughput_1m
double throughput_1m
Tasks completed per second (1-minute window average).
Definition enhanced_metrics.h:116

kcenon::thread::metrics::EnhancedSnapshot::execution_latency_p90_us
double execution_latency_p90_us
90th percentile execution latency in microseconds.
Definition enhanced_metrics.h:82

kcenon::thread::metrics::EnhancedSnapshot::current_queue_depth
std::size_t current_queue_depth
Current queue depth.
Definition enhanced_metrics.h:125

kcenon::thread::metrics::EnhancedSnapshot::wait_time_p99_us
double wait_time_p99_us
99th percentile wait time in microseconds.
Definition enhanced_metrics.h:102

kcenon::thread::metrics::EnhancedSnapshot::per_worker_utilization
std::vector< double > per_worker_utilization
Per-worker utilization (0.0 - 1.0 each).
Definition enhanced_metrics.h:151

kcenon::thread::metrics::EnhancedSnapshot::enqueue_latency_p99_us
double enqueue_latency_p99_us
99th percentile enqueue latency in microseconds.
Definition enhanced_metrics.h:72