当前位置: 首页 > 新闻动态 > 网络资讯

C++怎么计算程序运行时间 C++高精度计时器实现代码【测试】

作者:尼克 浏览: 发布日期:2026-02-01
[导读]:std::chrono::high_resolution_clock是C++11起跨平台纳秒级计时首选,须用同一时钟的两个time_point相减得duration再转换单位;禁用编译器优化、避免绝对时间戳相减、长期监控应改用steady_clock。
std::chrono::high_resolution_clock是C++11起跨平台纳秒级计时首选,须用同一时钟的两个time_point相减得duration再转换单位;禁用编译器优化、避免绝对时间戳相减、长期监控应改用steady_clock。

std::chrono::high_resolution_clock 获取纳秒级时间差

在 C++11 及以后,std::chrono::high_resolution_clock 是最常用、最便携的高精度计时方案。它不依赖系统 API,跨平台(Windows/Linux/macOS)行为一致,且精度通常达纳秒级(实际取决于硬件和 OS 调度,但测量差值足够可靠)。

关键点是:必须用同一个时钟的两个 time_point 相减,得到 duration,再转为所需单位(如毫秒、微秒)。直接用 time(NULL)clock() 精度太低,且受 CPU 占用率影响大。

常见错误:把 high_resolution_clock::now().time_since_epoch().count() 当作绝对时间戳相减——这在某些实现中可能因时钟重置或单调性问题出错;正确做法始终用 operator- 得到 duration。

示例:

#include 
#include 

auto start = std::chrono::high_resolution_clock::now(); // ... 你的代码 auto end = std::chrono::high_resolution_clock::now();

auto duration = std::chrono::duration_cast(end - start); std::cout << "耗时: " << duration.count() << " 微秒\n";

为什么不用 QueryPerformanceCounterclock_gettime

这些是系统级 API,虽然底层精度高,但破坏了可移植性,且封装不当容易出错。比如 Windows 的 QueryPerformanceCounter 需要配合 QueryPerformanceFrequency 换算,若频率获取失败或未处理整数溢出,结果会偏差几个数量级;Linux 的 clock_gettime(CLOCK_MONOTONIC, ...) 虽稳定,但需手动处理 struct timespec,还涉及链接 -lrt

除非你在写内核模块、实时系统或对纳秒抖动有极端要求(如高频交易),否则 std::chrono 完全够用,且编译器对其做了充分优化。实测中,high_resolution_clock 在主流编译器(MSVC/GCC/Clang)下生成的汇编与直接调用系统 API 几乎等价。

注意:high_resolution_clock 在部分旧版 MinGW 或嵌入式 STL 中可能退化为 system_clock,可通过静态断言验证:

static_assert(std::chrono::high_resolution_clock::is_steady,
              "high_resolution_clock must be steady");

测试时避免编译器优化干扰计时结果

如果你测的是一个简单函数(比如排序小数组),编译器可能在 -O2 下整个优化掉,导致测出 0ns。这不是计时器不准,而是代码没执行。

解决方法:

  • volatilestd::atomic 强制保留计算结果(例如把返回值存到 volatile int sink
  • 将待测逻辑封装进函数,并禁用内联:[[gnu::noinline]](GCC/Clang)或 __declspec(noinline)(MSVC)
  • 运行多次取最小值或中位数,排除 OS 调度抖动(单次测量意义不大)

示例防优化写法:

[[gnu::noinline]] int compute_heavy() {
    int sum = 0;
    for (int i = 0; i < 1000000; ++i) sum += i * i;
    return sum;
}

volatile int sink = compute_heavy(); // 防止被优化掉

跨平台计时库要不要引入?

Boost.Chronofo

lly::Chrono 提供了更丰富的格式化和统计工具,但对单纯“测一段代码跑多久”属于过度设计。C++ 标准库的 chrono 已覆盖全部基础需求:构造、相减、转换、输出。

真正容易被忽略的是时钟的“稳定性”和“单调性”。high_resolution_clock 标准只要求它是“最高分辨率的可用时钟”,但未强制要求单调(即不保证不会倒流)。实践中,所有主流实现都基于单调时钟(如 Linux 的 CLOCK_MONOTONIC、Windows 的 QueryPerformanceCounter),但如果你做长时间运行的性能监控(小时级),建议显式使用 steady_clock ——它标准规定必须单调且不可逆。

所以,日常测试用 high_resolution_clock 没问题;长期服务监控请改用 std::chrono::steady_clock

免责声明:转载请注明出处:http://shjed.com/news/792736.html

扫一扫高效沟通

多一份参考总有益处

免费领取网站策划SEO优化策划方案

请填写下方表单,我们会尽快与您联系
感谢您的咨询,我们会尽快给您回复!