Вы находитесь на странице: 1из 2

Мониторинг осуществляется системой Zabbix.

 
Все основные материалы по данной системе можно найти на официальном сайте
Zabbix - http://www.zabbix.com/ , а так же на сайте документации
- https://www.zabbix.com/documentation/start
Текущая версия Zabbix 2.2.
Все агенты работают в активном режиме.

На какие ключевые компоненты мы смотрим:

1. Процессор.
2. Оперативная память.
3. Жесткий диск.
4. Сетевой интерфейс.

Какие параметры по каждой компоненте мы собираем:

1. Процессор:
1. Утилизация ЦПУ в процентах, 15-минутное усреднение -
system.cpu.util[,,avg15].
2. Утилизация ЦПУ в процентах, 1-минутное усреднение
- system.cpu.util[,,avg1].
3. Количество ЦПУ - System.cpu.num.
2. Оперативная память:
1. Размер файла подкачки - system.swap.size[,total].
2. Размер памяти всего - vm.memory.size[total].
3. Размер памяти свободной - vm.memory.size[free].
3. Жесткий диск:
1. Размер диска свободно - vfs.fs.size[{#FSNAME},free].
2. Размер диска свободно в процентах - vfs.fs.size[{#FSNAME},pfree].
3. Размер диска всего - vfs.fs.size[{#FSNAME},total].
4. Размер диска занято - vfs.fs.size[{#FSNAME},used].
5. Средняя длина очереди на запись - Average disk write queue length -
perf_counter[\234(_Total)\1404]
6. Средняя длина очереди на чтение - Average disk read queue length -
perf_counter[\234(_Total)\1402]
7. Средняя длина очереди общая - Average Disk Queue Length -
perf_counter[\234(_Total)\1400]
8. Latency - описание этого параметра еще не готово
4. Сетевой интерфейс
1. Статистика по загрузке сетевых интерфесов
2. Проверка доступности агента. agent.ping
 

Триггеры.

1. Agent Ping Lost – Триггер срабатывает в случае отсутствия информации от


агента о его доступности в течении 60 секунд.
2. Average CPU Load over 90% last 90 sec – Триггер срабатывает в случае
значения загрузки ЦПУ более 90% на протяжении последних 90 секунд.
3. Free disk space is less than 5% on volume – Триггер срабатывает в случае
если на диске менее 5% свободного места.
4. High Disk Queue on {HOSTNAME} – Триггер срабатывает в случае если
средняя длинна очереди (общая) превышает 5 в текущий момент времени.
5. Lack of free memory on server {HOSTNAME} – Триггер срабатывает в случае
если кол-во занятой оперативной памяти более 90% на текущий момент
времени.