服务器或者某项服务、业务的可用率,不懂技术的上级领导会过问最近服务器可用率如何、所有API的状况怎么样?通常一些技术人员会说负载怎么样,哪些CPU使用率怎么样,硬盘使用情况,API的响应速度都保持在多少、响应时间都在多少?还没等说完,领导就打断了。他们不关心这些细节,更不懂这些技术。他们要的是一个结果。比如说服务器的故障率在0.001,api的响应率在99.99%。这就是IT Services功能。

IT服务能体现宏观量和管理基础设施的总体情况的可用性,从而体现总体的趋势,发现并解决IT基础设施暴露的问题。

IT服务的添加

2.1 IT服务

IT 服务是一个分层级的数据展示结构,在该结构中,每个节点具有属性状态,状态根据所选择的算法计算并传播上上层。

因此,根可以不添加Trigger,子节点必须添加,否则没有意义。

1
2
3
4
5
6
7
8
9
IT Service
| |
-Workstations
| |
| |-Workstation1
| |
| |-Workstation2
| |
-Servers

属性 属性 说明
名称 name 名称
上层服务 Parent service 上级节点,这边是 root
状态计算算法 Status calculation algorithm 计算付费,共有三个选项: Do not calculate – 不加入计算 Problem, if at least one child has a problem – 子项至少一个发生故障(一般用这个) Problem, if all children have problems – 所有子项都发生故障,才加入计算
计算SLA,可接受的SAL Acceptable SLA (in %) 可接受的可用率百分比,如果在大于这个百分比那么现实绿色,如果小于那么就是红色显示
触发器 Trigger 触发器,可以选触发器也可以不选,不过大家要记住,可用率计算的就是这些触发器的可用 率,如果没有触发器根本无法计算。最上级的可以不选触发器,子项一定记得选择触发器, 否则就失去意义了。

2.2 IT服务–时间

Time各参数说明

属性 属性 描述
服务次数 Service times 定义好的工作时间
新的服务时间 New service time 一共有三个选项 Downtime – 在这个时间段,不计入 SLA One-time downtime – 在这个时间段,不计入 SLA,指定一个时间(只有一次) Uptime :工作时间,在这个时间内出现故障都计入 SLA

如VMware-CentOS计划每周一凌晨00:00-01:00进入系统维护时间,此时间的中断为正常计划内维护 ,不计入设备在线率统计。

2.3 IT依赖关系

分为硬件依赖和软件依赖,例如我们增加一个C服务器,他需要依赖其他IT树下的services,首先它不能链接触发器, 在依赖那边选择其他树下依赖即可,可以添加多个,软依赖是灰色的标识,硬件依赖则是直接把整个service挪过来。如果C服务器使用软依赖,那么可以直接删除C服务器Service,如果是硬依赖,需要先移除依赖,才能删除。

好了,zabbix IT SERVICES就到这里了,可以给领导开个权限,这样他也可以了解到服务器整体状况了。运维们也需要经常看!

下面看下效果图。