HertzBeat 幕后花絮：公制集合的工作原理

2025年04月03日 11:192025/4/3大约 4 分钟

来自Apache HertzBeat 社区韩国朋友 @JuJinPark 的文章，写的很棒，这里就直接贴原文不翻译了。

HertzBeat 是一个开源的实时监控系统，旨在实现灵活性和易用性。但它究竟是如何收集、处理和存储来自各种系统的指标的呢？

在这篇文章中，我们将借助高级系统图来了解 HertzBeat 指标收集管道背后的内部架构——从作业分配到警报和存储。

图：HertzBeat 指标收集系统的高级架构。Manager 处理作业调度、警报和存储，而 Collector（外部或内部）执行实际的指标收集。Manager 和 Collectors 之间的通信使用自定义的 Netty TCP 协议。

当 Manager 组件启动时，它会从数据库加载监视目标。这些目标定义主机、收集间隔和其他参数。

为了分配工作负载，Manager 通过基于 Netty 的自定义 TCP 协议将作业发送到外部收集器。该模块使用一致的哈希处理此逻辑，确保作业在收集器之间均匀分布。CollectJobScheduling

💡 HertzBeat 还包括一个内置的主收集器（标识为），它直接在管理器内运行。这使得 HertzBeat 可以在独立模式下运行，而无需任何外部收集器。MAIN_COLLECTOR_NODE

收集器收到作业后，它会将其注册到 TimerDispatch 系统。

每个收集器在后台线程中运行一个**计时器**，该计时器根据其配置的时间间隔计划任务。时间到时，计时器会触发开始指标收集。TimerTask

触发 a 时，它会创建一个任务并将其传递给，后者将其置于 MetricsCollectorQueue 中。TimerTask``MetricsCollect``MetricsTaskDispatch

收集指标后，结果将由 CollectDataDispatch 模块处理。

对于外部收集器，结果通过 Netty TCP 连接发送回 Manager。对于主收集器，结果直接转发到下一个处理阶段，没有网络开销。

Manager 接收指标数据并将其推送到中，通过两个主要管道进行处理：MetricsDataToAlertQueue

得益于内置的主集电器，HertzBeat 可以完全在独立模式下运行。这对于测试、小型部署或快速设置特别有用。所有核心组件（作业调度、收集、警报和存储）都在单个进程中运行。

HertzBeat 的公制收集系统专为性能、可扩展性和灵活性而设计。凭借它：

它以最小的开销和高效率处理大规模监控工作负载。

如果您想了解更多信息：

https://github.com/apache/hertzbeat