thread_system/work__stealing__stats_8h_source.html

// BSD 3-Clause License

// Copyright (c) 2024, 🍀☀🌕🌥 🌊

// See the LICENSE file in the project root for full license information.


#pragma once


#include <atomic>

#include <cstdint>


namespace kcenon::thread

{


struct work_stealing_stats_snapshot

{

    std::uint64_t steal_attempts{0};

    std::uint64_t successful_steals{0};

    std::uint64_t failed_steals{0};

    std::uint64_t jobs_stolen{0};

    std::uint64_t same_node_steals{0};

    std::uint64_t cross_node_steals{0};

    std::uint64_t batch_steals{0};

    std::uint64_t total_batch_size{0};

    std::uint64_t total_steal_time_ns{0};

    std::uint64_t total_backoff_time_ns{0};


    [[nodiscard]] auto steal_success_rate() const -> double

    {

        if (steal_attempts == 0)

        {

            return 0.0;

        }

        return static_cast<double>(successful_steals) / static_cast<double>(steal_attempts);

    }


    [[nodiscard]] auto avg_batch_size() const -> double

    {

        if (batch_steals == 0)

        {

            return 0.0;

        }

        return static_cast<double>(total_batch_size) / static_cast<double>(batch_steals);

    }


    [[nodiscard]] auto cross_node_ratio() const -> double

    {

        auto total = same_node_steals + cross_node_steals;

        if (total == 0)

        {

            return 0.0;

        }

        return static_cast<double>(cross_node_steals) / static_cast<double>(total);

    }


    [[nodiscard]] auto avg_steal_time_ns() const -> double

    {

        if (steal_attempts == 0)

        {

            return 0.0;

        }

        return static_cast<double>(total_steal_time_ns) / static_cast<double>(steal_attempts);

    }


};


struct work_stealing_stats

{

    // ========================================================================

    // Steal Counts

    // ========================================================================


    std::atomic<std::uint64_t> steal_attempts{0};


    std::atomic<std::uint64_t> successful_steals{0};


    std::atomic<std::uint64_t> failed_steals{0};


    std::atomic<std::uint64_t> jobs_stolen{0};


    // ========================================================================

    // NUMA Statistics

    // ========================================================================


    std::atomic<std::uint64_t> same_node_steals{0};


    std::atomic<std::uint64_t> cross_node_steals{0};


    // ========================================================================

    // Batch Statistics

    // ========================================================================


    std::atomic<std::uint64_t> batch_steals{0};


    std::atomic<std::uint64_t> total_batch_size{0};


    // ========================================================================

    // Timing Statistics

    // ========================================================================


    std::atomic<std::uint64_t> total_steal_time_ns{0};


    std::atomic<std::uint64_t> total_backoff_time_ns{0};


    // ========================================================================

    // Computed Metrics

    // ========================================================================


    [[nodiscard]] auto steal_success_rate() const -> double

    {

        auto attempts = steal_attempts.load(std::memory_order_relaxed);

        if (attempts == 0)

        {

            return 0.0;

        }

        auto successes = successful_steals.load(std::memory_order_relaxed);

        return static_cast<double>(successes) / static_cast<double>(attempts);

    }


    [[nodiscard]] auto avg_batch_size() const -> double

    {

        auto batches = batch_steals.load(std::memory_order_relaxed);

        if (batches == 0)

        {

            return 0.0;

        }

        auto total = total_batch_size.load(std::memory_order_relaxed);

        return static_cast<double>(total) / static_cast<double>(batches);

    }


    [[nodiscard]] auto cross_node_ratio() const -> double

    {

        auto same = same_node_steals.load(std::memory_order_relaxed);

        auto cross = cross_node_steals.load(std::memory_order_relaxed);

        auto total = same + cross;

        if (total == 0)

        {

            return 0.0;

        }

        return static_cast<double>(cross) / static_cast<double>(total);

    }


    [[nodiscard]] auto avg_steal_time_ns() const -> double

    {

        auto attempts = steal_attempts.load(std::memory_order_relaxed);

        if (attempts == 0)

        {

            return 0.0;

        }

        auto total_time = total_steal_time_ns.load(std::memory_order_relaxed);

        return static_cast<double>(total_time) / static_cast<double>(attempts);

    }


    void reset()

    {

        steal_attempts.store(0, std::memory_order_relaxed);

        successful_steals.store(0, std::memory_order_relaxed);

        failed_steals.store(0, std::memory_order_relaxed);

        jobs_stolen.store(0, std::memory_order_relaxed);

        same_node_steals.store(0, std::memory_order_relaxed);

        cross_node_steals.store(0, std::memory_order_relaxed);

        batch_steals.store(0, std::memory_order_relaxed);

        total_batch_size.store(0, std::memory_order_relaxed);

        total_steal_time_ns.store(0, std::memory_order_relaxed);

        total_backoff_time_ns.store(0, std::memory_order_relaxed);

    }


    [[nodiscard]] auto snapshot() const -> work_stealing_stats_snapshot

    {

        work_stealing_stats_snapshot snap;

        snap.steal_attempts = steal_attempts.load(std::memory_order_acquire);

        snap.successful_steals = successful_steals.load(std::memory_order_acquire);

        snap.failed_steals = failed_steals.load(std::memory_order_acquire);

        snap.jobs_stolen = jobs_stolen.load(std::memory_order_acquire);

        snap.same_node_steals = same_node_steals.load(std::memory_order_acquire);

        snap.cross_node_steals = cross_node_steals.load(std::memory_order_acquire);

        snap.batch_steals = batch_steals.load(std::memory_order_acquire);

        snap.total_batch_size = total_batch_size.load(std::memory_order_acquire);

        snap.total_steal_time_ns = total_steal_time_ns.load(std::memory_order_acquire);

        snap.total_backoff_time_ns = total_backoff_time_ns.load(std::memory_order_acquire);

        return snap;

    }


};


} // namespace kcenon::thread

kcenon::thread
Core threading foundation of the thread system library.
Definition thread_impl.h:17

kcenon::thread::work_stealing_stats_snapshot
Non-atomic snapshot of work-stealing statistics.
Definition work_stealing_stats.h:28

kcenon::thread::work_stealing_stats_snapshot::successful_steals
std::uint64_t successful_steals
Definition work_stealing_stats.h:30

kcenon::thread::work_stealing_stats_snapshot::total_batch_size
std::uint64_t total_batch_size
Definition work_stealing_stats.h:36

kcenon::thread::work_stealing_stats_snapshot::cross_node_ratio
auto cross_node_ratio() const -> double
Definition work_stealing_stats.h:58

kcenon::thread::work_stealing_stats_snapshot::steal_success_rate
auto steal_success_rate() const -> double
Definition work_stealing_stats.h:40

kcenon::thread::work_stealing_stats_snapshot::failed_steals
std::uint64_t failed_steals
Definition work_stealing_stats.h:31

kcenon::thread::work_stealing_stats_snapshot::same_node_steals
std::uint64_t same_node_steals
Definition work_stealing_stats.h:33

kcenon::thread::work_stealing_stats_snapshot::avg_steal_time_ns
auto avg_steal_time_ns() const -> double
Definition work_stealing_stats.h:68

kcenon::thread::work_stealing_stats_snapshot::total_steal_time_ns
std::uint64_t total_steal_time_ns
Definition work_stealing_stats.h:37

kcenon::thread::work_stealing_stats_snapshot::avg_batch_size
auto avg_batch_size() const -> double
Definition work_stealing_stats.h:49

kcenon::thread::work_stealing_stats_snapshot::steal_attempts
std::uint64_t steal_attempts
Definition work_stealing_stats.h:29

kcenon::thread::work_stealing_stats_snapshot::cross_node_steals
std::uint64_t cross_node_steals
Definition work_stealing_stats.h:34

kcenon::thread::work_stealing_stats_snapshot::total_backoff_time_ns
std::uint64_t total_backoff_time_ns
Definition work_stealing_stats.h:38

kcenon::thread::work_stealing_stats_snapshot::batch_steals
std::uint64_t batch_steals
Definition work_stealing_stats.h:35

kcenon::thread::work_stealing_stats_snapshot::jobs_stolen
std::uint64_t jobs_stolen
Definition work_stealing_stats.h:32

kcenon::thread::work_stealing_stats
Statistics for work-stealing operations.
Definition work_stealing_stats.h:111

kcenon::thread::work_stealing_stats::total_steal_time_ns
std::atomic< std::uint64_t > total_steal_time_ns
Total time spent in steal operations (nanoseconds)
Definition work_stealing_stats.h:153

kcenon::thread::work_stealing_stats::total_backoff_time_ns
std::atomic< std::uint64_t > total_backoff_time_ns
Total time spent in backoff delays (nanoseconds)
Definition work_stealing_stats.h:156

kcenon::thread::work_stealing_stats::avg_batch_size
auto avg_batch_size() const -> double
Calculate the average batch size.
Definition work_stealing_stats.h:185

kcenon::thread::work_stealing_stats::failed_steals
std::atomic< std::uint64_t > failed_steals
Number of failed steal operations.
Definition work_stealing_stats.h:123

kcenon::thread::work_stealing_stats::snapshot
auto snapshot() const -> work_stealing_stats_snapshot
Create a snapshot of current statistics.
Definition work_stealing_stats.h:262

kcenon::thread::work_stealing_stats::jobs_stolen
std::atomic< std::uint64_t > jobs_stolen
Total number of jobs successfully stolen.
Definition work_stealing_stats.h:126

kcenon::thread::work_stealing_stats::total_batch_size
std::atomic< std::uint64_t > total_batch_size
Total size of all batch steals (for averaging)
Definition work_stealing_stats.h:146

kcenon::thread::work_stealing_stats::avg_steal_time_ns
auto avg_steal_time_ns() const -> double
Calculate average steal operation time.
Definition work_stealing_stats.h:221

kcenon::thread::work_stealing_stats::cross_node_steals
std::atomic< std::uint64_t > cross_node_steals
Steals from workers on different NUMA nodes.
Definition work_stealing_stats.h:136

kcenon::thread::work_stealing_stats::successful_steals
std::atomic< std::uint64_t > successful_steals
Number of successful steal operations.
Definition work_stealing_stats.h:120

kcenon::thread::work_stealing_stats::steal_attempts
std::atomic< std::uint64_t > steal_attempts
Total number of steal attempts.
Definition work_stealing_stats.h:117

kcenon::thread::work_stealing_stats::batch_steals
std::atomic< std::uint64_t > batch_steals
Number of batch steal operations (stealing multiple jobs)
Definition work_stealing_stats.h:143

kcenon::thread::work_stealing_stats::reset
void reset()
Reset all statistics to zero.
Definition work_stealing_stats.h:241

kcenon::thread::work_stealing_stats::same_node_steals
std::atomic< std::uint64_t > same_node_steals
Steals from workers on the same NUMA node.
Definition work_stealing_stats.h:133

kcenon::thread::work_stealing_stats::cross_node_ratio
auto cross_node_ratio() const -> double
Calculate the cross-NUMA node steal ratio.
Definition work_stealing_stats.h:203

kcenon::thread::work_stealing_stats::steal_success_rate
auto steal_success_rate() const -> double
Calculate the steal success rate.
Definition work_stealing_stats.h:168