
Ilya
15.06.2017
13:41:10
СЫРЫЕ ДАННЫЕ – ЧТО В LATEST DATA?

Alex
15.06.2017
13:41:30
Зачем же так кричать-то, ну
Я аж проснулся

Ilya
15.06.2017
13:43:46
Засыпай

Google

Andrey
15.06.2017
13:44:11

Igor
15.06.2017
13:44:39
а как часто опрашивается этот итем??

Ilya
15.06.2017
13:44:44
Надо, видимо, всё же открыть lastet data

Andrey
15.06.2017
13:44:52

Ilya
15.06.2017
13:44:54
Иначе – это гадание на кофейной гуще
Может у него время постоянно меняется?

Andrey
15.06.2017
13:45:18

diamon
15.06.2017
13:45:33
триггер из коробки

Ilya
15.06.2017
13:45:36
Будет проигнорен

Aleksandr
15.06.2017
13:45:57

Andrey
15.06.2017
13:46:10

Igor
15.06.2017
13:46:27
триггер из коробки
ты ответишь хоть на один вопрос из тех что писали выше?? или тебе помощь совсем не нужна?

diamon
15.06.2017
13:46:50
отвечу

Google

Andrey
15.06.2017
13:46:57
Как часто итем опрашивается?

diamon
15.06.2017
13:48:37
в последних данных
System uptime 15.06.2017 16:47:24 86 дней, 06:24:17 +00:01:00

Aleksandr
15.06.2017
13:49:42
в latest data у айтема есть выкидушка "500 latest values"
посмотри, там нет резких скачков?

diamon
15.06.2017
13:50:05
Интервал обновления (в сек)
60

Aleksandr
15.06.2017
13:50:05

Ilya
15.06.2017
13:50:27
И нужно не самые последние
Нужно дойти до времени, когда триггер сработал
И посмотреть, что было ДО и ПОСЛЕ этого времени

diamon
15.06.2017
13:51:15
500 последних не вижу
на графике провал
провал где-то в 15:59, а триггер сработал в 16:30

Andrey
15.06.2017
13:52:32
справа вверху
выпадающая менюшка

Andrey
15.06.2017
13:52:38
на графике провал
Во, что за провал? Нет данных или другое значение? Какое? Кинь график

Aleksandr
15.06.2017
13:52:49
открой выкидушку справа у айтема при просмотре графика

diamon
15.06.2017
13:53:16

Aleksandr
15.06.2017
13:53:28
или просто Values и открути за нужный интервал во время провала

Google

Aleksandr
15.06.2017
13:54:15
всем чятиком выясняем, что было две ноды с одним хостнеймом =)

diamon
15.06.2017
13:54:33
точно нет двух нод

Aleksandr
15.06.2017
13:54:40
ну покажи тогда данные за этот период
в values

Andrey
15.06.2017
13:54:44
А тригер по недоступности агента не срабатывает? Есть такой вообще?

diamon
15.06.2017
13:54:50
пролазил все три сотни виртуалок

Aleksandr
15.06.2017
13:55:05
хорошо, но лучше давай посмотрим values за этот промежуток времени

diamon
15.06.2017
13:55:06
не срабатывает
и это не с одним хостом так
они в случайном порядке любые из

Andrey
15.06.2017
13:56:27
Нужен интервал 15:58-16:06

diamon
15.06.2017
13:56:58

Andrey
15.06.2017
13:57:30
на графике провал, соответсвенно данных нет, это не может быть причиной триггера

Andrey
15.06.2017
13:57:49
А, ну ясн. Вот данных не было с 15:59 и в 16:03 только пошли
Там разница больше 20 сек

Evgeniy
15.06.2017
13:58:14
там дальше тоже по 2 минуты интервал

Ilya
15.06.2017
13:58:20
Триггер надо переделать по уму

diamon
15.06.2017
13:58:43
а почему такой провал вдруг?
с сетью вроде нет проблем

Google

Evgeniy
15.06.2017
13:58:59
а интервал опроса на одну настроен

Andrey
15.06.2017
13:59:05
А он точно "<20" из поставки идет? По хорошему должно быть <0

Andrey
15.06.2017
13:59:20

Evgeniy
15.06.2017
13:59:39
или виртуалка тупо долго отвечает
такое бывает, когда сторадж медленный

diamon
15.06.2017
14:00:23
сторевайз с двумя 10гб ))

Evgeniy
15.06.2017
14:00:25
и внутри виртуалки все ок. и даже по логам. только делается все дольше, чем записано в логах

diamon
15.06.2017
14:00:29
не медленный

Andrey
15.06.2017
14:00:31
Причину провалов лучше начать искать в логах агента

Andrey
15.06.2017
14:01:16

diamon
15.06.2017
14:01:31
ставил дебаглевел максимальный. ничего подозрительного

Andrey
15.06.2017
14:05:41
ну хз, у меня на 3лвл пишет, что не может достучаться до сервера, не может зарезолвить имя

Andrey
15.06.2017
14:06:14
Может 0 в скобочках у change - дефолтное значение при отсутствии поступления данных?

Andrey
15.06.2017
14:06:52
Илья выше написал, что игнорируется значение

Evgeniy
15.06.2017
14:07:49

Andrey
15.06.2017
14:07:56
А блин
нашел, 16:29 значение на скрине и следующее
разница 10 секунд, вот триггер и сработал

Alex
15.06.2017
14:08:46
Коллеги, кто как мониторит кластеры pacemaker? Есть возможность поделиться шаблонами\скриптами? В гугле из интересного нашлось только https://github.com/H-Software/Zabbix-Template-Linux-Pacemaker

Google

Andrey
15.06.2017
14:08:58
@diamon_zero триггер переделай <0 и все ок будет

diamon
15.06.2017
14:10:03
а почему он из коробки тогда неправильный?

Andrey
15.06.2017
14:11:20
а хз )

diamon
15.06.2017
14:11:37
да. в линуксовом триггере стоит <0

Andrey
15.06.2017
14:12:09
а этот откуда?

diamon
15.06.2017
14:12:22
спасибо за помощь, мужики

Andrey
15.06.2017
14:12:26

diamon
15.06.2017
14:13:25
вообще должно быть из коробки

Andrey
15.06.2017
14:14:43
Другой вопрос на самом деле, почему разница в 10сек между значениями, заместо положенных ~60. Есть подозрение, что где-то что-то не справляется

diamon
15.06.2017
14:16:21
раньше у нас всё было на хайперви. и всё работало норм. потом всё мигрировали на более крутое железо и на вмварю. и тут эта проблема всплыла

Andrey
15.06.2017
14:17:17
Особенно трапперы, поллеры, очереди

diamon
15.06.2017
14:19:27
агентов?

Andrey
15.06.2017
14:19:58
Zabbix Server внутренние метрики

diamon
15.06.2017
14:20:05
часто вылазит, что сервер сильно загружен

Andrey
15.06.2017
14:20:20
А что именно?

diamon
15.06.2017
14:22:30
вообще сколько надо ресурсов (ядер/памяти) заббикс серверу под 300 клиентов?

Andrey
15.06.2017
14:22:39
Неизвестно

diamon
15.06.2017
14:22:56
сейчас 6 ядер и 4гб

Andrey
15.06.2017
14:22:58
Давай графики загрузки внутреннихпроцессов