thread_system/scaling__metrics_8h_source.html

// BSD 3-Clause License

// Copyright (c) 2024, 🍀☀🌕🌥 🌊

// See the LICENSE file in the project root for full license information.


#pragma once


#include <chrono>

#include <cstddef>

#include <cstdint>


namespace kcenon::thread

{


    enum class scaling_direction

    {

        none,

        up,

        down

    };


    enum class scaling_reason

    {

        queue_depth,

        worker_utilization,

        latency,

        manual,

        scheduled

    };


    struct scaling_metrics_sample

    {

        std::chrono::steady_clock::time_point timestamp;


        std::size_t worker_count{0};


        std::size_t active_workers{0};


        std::size_t queue_depth{0};


        double utilization{0.0};


        double queue_depth_per_worker{0.0};


        double p95_latency_ms{0.0};


        std::uint64_t jobs_completed{0};


        std::uint64_t jobs_submitted{0};


        double throughput_per_second{0.0};

    };


    struct scaling_decision

    {

        scaling_direction direction{scaling_direction::none};


        scaling_reason reason{scaling_reason::queue_depth};


        std::size_t target_workers{0};


        std::string explanation;


        [[nodiscard]] auto should_scale() const -> bool

        {

            return direction != scaling_direction::none;

        }


    };


    struct autoscaling_stats

    {

        std::size_t scale_up_count{0};


        std::size_t scale_down_count{0};


        std::size_t decisions_evaluated{0};


        std::chrono::steady_clock::time_point last_scale_up;


        std::chrono::steady_clock::time_point last_scale_down;


        std::size_t peak_workers{0};


        std::size_t min_workers{0};

    };


} // namespace kcenon::thread

kcenon::thread::pressure_level::none
@ none
Below low_watermark, queue is healthy.

kcenon::thread
Core threading foundation of the thread system library.
Definition thread_impl.h:17

kcenon::thread::scaling_direction
scaling_direction
Scaling direction for autoscaling decisions.
Definition scaling_metrics.h:24

kcenon::thread::scaling_direction::none
@ none
No scaling needed.

kcenon::thread::scaling_direction::up
@ up
Scale up (add workers)

kcenon::thread::scaling_direction::down
@ down
Scale down (remove workers)

kcenon::thread::scaling_reason
scaling_reason
Reason for scaling decision.
Definition scaling_metrics.h:34

kcenon::thread::scaling_reason::manual
@ manual
Manual trigger via API.

kcenon::thread::scaling_reason::scheduled
@ scheduled
Scheduled scaling event.

kcenon::thread::scaling_reason::latency
@ latency
Latency threshold exceeded.

kcenon::thread::scaling_reason::worker_utilization
@ worker_utilization
Worker utilization threshold exceeded.

kcenon::thread::scaling_reason::queue_depth
@ queue_depth
Queue depth threshold exceeded.

kcenon::thread::autoscaling_stats
Statistics for autoscaling operations.
Definition scaling_metrics.h:121

kcenon::thread::autoscaling_stats::scale_up_count
std::size_t scale_up_count
Number of scale-up events.
Definition scaling_metrics.h:123

kcenon::thread::autoscaling_stats::decisions_evaluated
std::size_t decisions_evaluated
Number of decisions evaluated.
Definition scaling_metrics.h:129

kcenon::thread::autoscaling_stats::last_scale_down
std::chrono::steady_clock::time_point last_scale_down
Time of last scale-down event.
Definition scaling_metrics.h:135

kcenon::thread::autoscaling_stats::last_scale_up
std::chrono::steady_clock::time_point last_scale_up
Time of last scale-up event.
Definition scaling_metrics.h:132

kcenon::thread::autoscaling_stats::scale_down_count
std::size_t scale_down_count
Number of scale-down events.
Definition scaling_metrics.h:126

kcenon::thread::autoscaling_stats::peak_workers
std::size_t peak_workers
Peak worker count observed.
Definition scaling_metrics.h:138

kcenon::thread::autoscaling_stats::min_workers
std::size_t min_workers
Minimum worker count observed.
Definition scaling_metrics.h:141

kcenon::thread::scaling_decision
Scaling decision result.
Definition scaling_metrics.h:91

kcenon::thread::scaling_decision::explanation
std::string explanation
Human-readable explanation.
Definition scaling_metrics.h:102

kcenon::thread::scaling_decision::should_scale
auto should_scale() const -> bool
Checks if scaling should occur.
Definition scaling_metrics.h:108

kcenon::thread::scaling_decision::reason
scaling_reason reason
Reason for the decision.
Definition scaling_metrics.h:96

kcenon::thread::scaling_decision::direction
scaling_direction direction
The scaling direction.
Definition scaling_metrics.h:93

kcenon::thread::scaling_decision::target_workers
std::size_t target_workers
Target worker count after scaling.
Definition scaling_metrics.h:99

kcenon::thread::scaling_metrics_sample
Metrics sample for autoscaling decisions.
Definition scaling_metrics.h:52

kcenon::thread::scaling_metrics_sample::jobs_submitted
std::uint64_t jobs_submitted
Jobs submitted since last sample.
Definition scaling_metrics.h:78

kcenon::thread::scaling_metrics_sample::worker_count
std::size_t worker_count
Current number of workers in the pool.
Definition scaling_metrics.h:57

kcenon::thread::scaling_metrics_sample::timestamp
std::chrono::steady_clock::time_point timestamp
Timestamp when this sample was collected.
Definition scaling_metrics.h:54

kcenon::thread::scaling_metrics_sample::queue_depth_per_worker
double queue_depth_per_worker
Jobs per worker ratio.
Definition scaling_metrics.h:69

kcenon::thread::scaling_metrics_sample::jobs_completed
std::uint64_t jobs_completed
Jobs completed since last sample.
Definition scaling_metrics.h:75

kcenon::thread::scaling_metrics_sample::queue_depth
std::size_t queue_depth
Number of jobs waiting in the queue.
Definition scaling_metrics.h:63

kcenon::thread::scaling_metrics_sample::p95_latency_ms
double p95_latency_ms
P95 latency in milliseconds.
Definition scaling_metrics.h:72

kcenon::thread::scaling_metrics_sample::throughput_per_second
double throughput_per_second
Throughput in jobs per second.
Definition scaling_metrics.h:81

kcenon::thread::scaling_metrics_sample::active_workers
std::size_t active_workers
Number of workers currently processing jobs.
Definition scaling_metrics.h:60

kcenon::thread::scaling_metrics_sample::utilization
double utilization
Worker utilization ratio (0.0 - 1.0)
Definition scaling_metrics.h:66