神探!Apache Hudi集成Prometheus/Pushgateway 进行监控
The following article is from OLAP Author liujinhui
1. 可用性
在Hudi最新master分支,prometheus监控Hudi应用指标,该功能将在即将发布的0.6.0 版本中可用。
2. 简介
prometheus是一个流行的监控服务。在即将发布的Apache Hudi 0.6.0
版本中,除已有的报告者类型(Graphite、JMX、DATADOG、用户自定义指标)之外,我们将引入通过pushgateway和httpserver方式报告Hudi指标的功能。
3. 配置
3.1 pushgateway
类似于其他支持的报告者,启用pushgateway报告者需要配置以下属性。
hoodie.metrics.on=truehoodie.metrics.reporter.type=PROMETHEUS_PUSHGATEWAY
下面的属性用来配置pushgateway 的地址和端口号。地址默认是localhost,端口默认是9091
hoodie.metrics.pushgateway.host=x.x.x.xhoodie.metrics.pushgateway.port=9091
下面属性用来配置任务结束时候是否将监控信息从pushgateway删除,默认是true
hoodie.metrics.pushgateway.delete.on.shutdown=false下面属性用来配置任务名称前缀、是否需要随机的后缀,默认是true
hoodie.metrics.pushgateway.job.name=xiaommhoodie.metrics.pushgateway.random.job.name.suffix=false
下面属性用来配置任务结束时候是否将监控信息从pushgateway删除,默认是true
hoodie.metrics.pushgateway.delete.on.shutdown=false3.2 prometheus-httpserver
hoodie.metrics.on=truehoodie.metrics.reporter.type=PROMETHEUS
hoodie.metrics.reporter.host=9090
至此配置介绍结束
4. 示例演示
在这个示例中,我们运行了一个 HoodieDeltaStreamer
,启用了指标收集并做了相应的配置。
5. 总结
Hudi提供了多种报告者,方便监控Hudi应用运行时的各项指标,及时发现系统中的问题。后续将会有更多的主流监控组件集成进来,尽请期待。
推荐阅读
Apache Hudi + AWS S3 + Athena实践
官宣!AWS Athena正式可查Apache Hudi数据集