monit

监控

后端

prometheus vs zabbix

先对两者的各自特点进行一下对比:

Zabbix Prometheus
后端用 C 开发,界面用 PHP 开发,定制化难度很高。 后端用 golang 开发,前端是 Grafana,JSON 编辑即可解决。定制化难度较低。
集群规模上限为 10000 个节点。 支持更大的集群规模,速度也更快。
更适合监控物理机环境。 更适合云环境的监控,对 OpenStack,Kubernetes 有更好的集成。
监控数据存储在关系型数据库内,如 MySQL,很难从现有数据中扩展维度。 监控数据存储在基于时间序列(TSDB)的数据库内,便于对已有数据进行新的聚合。
安装简单,zabbix-server 一个软件包中包括了所有的服务端功能。 安装相对复杂,监控、告警和界面都分属于不同的组件。
图形化界面比较成熟,界面上基本上能完成全部的配置操作。 界面相对较弱,很多配置需要修改配置文件。
发展时间更长,对于很多监控场景,都有现成的解决方案。 2015 年后开始快速发展,但发展时间较短,成熟度不及 Zabbix。

由于最后敲定了Prometheus方案,对于zabbix就云评测了,欢迎指正

  • 虽然图形化界面弱化,很多配置走yml文件,但图形化界面真的没有必要
  • 时序数据库,高并发下好于mysql(不然干嘛开发tsdb应对监控场景)
  • prom支持pull和push模型,可以支持k8s,swarm等服务发现

前端

Performance?webVitals?以后用到再补充

主要关注性能,pv,redirect,err等问题

页面是否可用

阿里云-云监控控制台

可提供网址监控,包括cookie, headers 等自定义的简单配置,进行电话,邮件,短信,旺旺等报警