@ZabbixPro

Страница 281 из 1183
Ilya
15.06.2017
13:41:10
СЫРЫЕ ДАННЫЕ – ЧТО В LATEST DATA?

Alex
15.06.2017
13:41:30
Зачем же так кричать-то, ну

Я аж проснулся

Ilya
15.06.2017
13:43:46
Засыпай

Google
Andrey
15.06.2017
13:44:11
какого хрена постоянно срабатывает триггер? сервер работает себе Trigger: FSITE03 has just been restarted 1. System uptime (FSITE03:system.uptime): 86 days, 06:06:16
Вероятно есть другой сервер с агентом заббикс, у которого в конфиге задан такой же hostname

Igor
15.06.2017
13:44:39
а как часто опрашивается этот итем??

Ilya
15.06.2017
13:44:44
Надо, видимо, всё же открыть lastet data

Ilya
15.06.2017
13:44:54
Иначе – это гадание на кофейной гуще

Может у него время постоянно меняется?

Andrey
15.06.2017
13:45:18
{FSITE03:system.uptime.change(0)}<20
Вообще, если верить документации, change не принимает параметры, не знаю насколько корректно туда 0 вставлять

diamon
15.06.2017
13:45:33
триггер из коробки

Ilya
15.06.2017
13:45:36
Будет проигнорен

Aleksandr
15.06.2017
13:45:57
триггер из коробки
а покажешь raw data?

Andrey
15.06.2017
13:46:10
триггер из коробки
FSITE03 - кластерное имя?

Igor
15.06.2017
13:46:27
триггер из коробки
ты ответишь хоть на один вопрос из тех что писали выше?? или тебе помощь совсем не нужна?

diamon
15.06.2017
13:46:50
отвечу

Google
Andrey
15.06.2017
13:46:57
Как часто итем опрашивается?

diamon
15.06.2017
13:48:37
в последних данных System uptime 15.06.2017 16:47:24 86 дней, 06:24:17 +00:01:00

Aleksandr
15.06.2017
13:49:42
в latest data у айтема есть выкидушка "500 latest values"

посмотри, там нет резких скачков?

diamon
15.06.2017
13:50:05
Интервал обновления (в сек) 60

Aleksandr
15.06.2017
13:50:05


Ilya
15.06.2017
13:50:27
И нужно не самые последние

Нужно дойти до времени, когда триггер сработал

И посмотреть, что было ДО и ПОСЛЕ этого времени

diamon
15.06.2017
13:51:15
500 последних не вижу

на графике провал

провал где-то в 15:59, а триггер сработал в 16:30

Andrey
15.06.2017
13:52:32
справа вверху

выпадающая менюшка

Andrey
15.06.2017
13:52:38
на графике провал
Во, что за провал? Нет данных или другое значение? Какое? Кинь график

Aleksandr
15.06.2017
13:52:49
500 последних не вижу
всмысле не видишь?

открой выкидушку справа у айтема при просмотре графика

diamon
15.06.2017
13:53:16


Aleksandr
15.06.2017
13:53:28


или просто Values и открути за нужный интервал во время провала

Google
Aleksandr
15.06.2017
13:54:15
всем чятиком выясняем, что было две ноды с одним хостнеймом =)

diamon
15.06.2017
13:54:33
точно нет двух нод

Aleksandr
15.06.2017
13:54:40
ну покажи тогда данные за этот период

в values

Andrey
15.06.2017
13:54:44
А тригер по недоступности агента не срабатывает? Есть такой вообще?

diamon
15.06.2017
13:54:50
пролазил все три сотни виртуалок

Aleksandr
15.06.2017
13:55:05
хорошо, но лучше давай посмотрим values за этот промежуток времени

diamon
15.06.2017
13:55:06
не срабатывает



и это не с одним хостом так

они в случайном порядке любые из

Andrey
15.06.2017
13:56:27
Нужен интервал 15:58-16:06

diamon
15.06.2017
13:56:58


Andrey
15.06.2017
13:57:30
на графике провал, соответсвенно данных нет, это не может быть причиной триггера

Andrey
15.06.2017
13:57:49
А, ну ясн. Вот данных не было с 15:59 и в 16:03 только пошли

Там разница больше 20 сек

Evgeniy
15.06.2017
13:58:14
там дальше тоже по 2 минуты интервал

Ilya
15.06.2017
13:58:20
Триггер надо переделать по уму

diamon
15.06.2017
13:58:43
а почему такой провал вдруг?

с сетью вроде нет проблем

Google
Evgeniy
15.06.2017
13:58:59
а интервал опроса на одну настроен

Andrey
15.06.2017
13:59:05
А он точно "<20" из поставки идет? По хорошему должно быть <0

Andrey
15.06.2017
13:59:20
а почему такой провал вдруг?
Может у вас поллеры или трапперы перегружены на заббикс сервере

Evgeniy
15.06.2017
13:59:39
или виртуалка тупо долго отвечает

такое бывает, когда сторадж медленный

diamon
15.06.2017
14:00:23
сторевайз с двумя 10гб ))

Evgeniy
15.06.2017
14:00:25
и внутри виртуалки все ок. и даже по логам. только делается все дольше, чем записано в логах

diamon
15.06.2017
14:00:29
не медленный

Andrey
15.06.2017
14:00:31
Там разница больше 20 сек
Триггер сработает только если следущее значение меньше предыдущего, а на скринах такого не видно

Причину провалов лучше начать искать в логах агента

Andrey
15.06.2017
14:01:16
Триггер сработает только если следущее значение меньше предыдущего, а на скринах такого не видно
Да. Был не прав. Скорее всего, провал интерпретируется как 0 значение

diamon
15.06.2017
14:01:31
ставил дебаглевел максимальный. ничего подозрительного

Andrey
15.06.2017
14:05:41
ну хз, у меня на 3лвл пишет, что не может достучаться до сервера, не может зарезолвить имя

Andrey
15.06.2017
14:06:14
Может 0 в скобочках у change - дефолтное значение при отсутствии поступления данных?

Andrey
15.06.2017
14:06:52
Илья выше написал, что игнорируется значение

Evgeniy
15.06.2017
14:07:49
ставил дебаглевел максимальный. ничего подозрительного
можно в сеть на клиенте посмотреть, когда идет обмен с сервером

Andrey
15.06.2017
14:07:56
А блин

нашел, 16:29 значение на скрине и следующее

разница 10 секунд, вот триггер и сработал

Alex
15.06.2017
14:08:46
Коллеги, кто как мониторит кластеры pacemaker? Есть возможность поделиться шаблонами\скриптами? В гугле из интересного нашлось только https://github.com/H-Software/Zabbix-Template-Linux-Pacemaker

Google
Andrey
15.06.2017
14:08:58
@diamon_zero триггер переделай <0 и все ок будет

diamon
15.06.2017
14:10:03
а почему он из коробки тогда неправильный?

Andrey
15.06.2017
14:11:20
а хз )

diamon
15.06.2017
14:11:37
да. в линуксовом триггере стоит <0

Andrey
15.06.2017
14:12:09
а этот откуда?

diamon
15.06.2017
14:12:22
спасибо за помощь, мужики

Andrey
15.06.2017
14:12:26
diamon
15.06.2017
14:13:25
а этот откуда?
может кто-то из коллег поразвлекался

вообще должно быть из коробки

Andrey
15.06.2017
14:14:43
Другой вопрос на самом деле, почему разница в 10сек между значениями, заместо положенных ~60. Есть подозрение, что где-то что-то не справляется

diamon
15.06.2017
14:16:21
раньше у нас всё было на хайперви. и всё работало норм. потом всё мигрировали на более крутое железо и на вмварю. и тут эта проблема всплыла

diamon
15.06.2017
14:19:27
агентов?

Andrey
15.06.2017
14:19:58
Zabbix Server внутренние метрики

diamon
15.06.2017
14:20:05
часто вылазит, что сервер сильно загружен

Andrey
15.06.2017
14:20:20
А что именно?

diamon
15.06.2017
14:22:30
вообще сколько надо ресурсов (ядер/памяти) заббикс серверу под 300 клиентов?

Andrey
15.06.2017
14:22:39
Неизвестно

diamon
15.06.2017
14:22:56
сейчас 6 ядер и 4гб

Andrey
15.06.2017
14:22:58
Давай графики загрузки внутреннихпроцессов

Страница 281 из 1183