运维
catpaw 标签描述

前言 这两天看到SRETalk公众号的秦总,写了个新工具太卷了,史上最简单的监控系统catpaw简介,而且目前最新版还提供硬件监控的能力机器硬件监控,最简单的方案,没有之一,看上去挺厉害的,特地来体验这个轻量级告警监控的工具,上手把玩一下看看咋样。 使用介绍 使用起来其实还挺简单,所需要准备: 部署catepaw catepaw直在目标机器上采集告警事件,启动前修改对应配置,插件配置。 catpaw不能取代指标监控和日志系统,它只是一个轻量的check工具,一些场景举例: 探测某个HTTP地址,如果不可用,把不可用的原因发出来 探测某个TCP地址,如果不可用,把不可用的原因发出来 探测...

  veRHuRoEnYSe   2023年11月02日   73   0   0 linuxcatpaw运维监控

问题 监控系统用于监控其他的系统、基础设施,绝对是P0级的服务,那监控系统的自监控应该怎么做呢?如果自己监控自己,有些组件挂掉了难免循环依赖,如果单独搞一套新的监控系统来监控当前服役的监控系统,又搞得有些过于复杂。本文我们来探讨一下监控系统的自监控应该怎么做。 解决方案:自身指标 首先,监控系统自身是会暴露监控指标的,比如Prometheus、VictoriaMetrics、Nightingale,都通过 /metrics 接口暴露了自身的监控指标,这些指标通过监控系统自身的采集机制去采集就好,相关数据的历史趋势图、告警规则,也在监控系统自身配置好,只要自身模块没有挂掉,或...

  wzFl6rDubusz   2023年11月13日   34   0   0 catpaw自监控

原始需求是如果系统的密码被修改,或者创建了新用户,就告警出来。本质上,只需要监控 /etc/shadow 文件变化即可。但是在指标监控体系里,这个事情就比较棘手,只能把文件的mtime作为指标的值上报,服务端再利用delta或者increase函数来判断mtime是否发生了变化。告警出来的文本也会比较简陋。 使用catpaw搭配FlashDuty则可以很好的解决这个问题。告警的样例效果如下: 下面我们来看看如何实现。 1.下载catpaw 最新版本是0.6.0,下载地址是:https://download.flashcat.cloud/catpaw-v0.6.0-linu...

  wzFl6rDubusz   2023年11月02日   61   0   0 catpawFlashDuty