
Kamil
10.05.2017
13:10:17
zabbix_server —runtime-control log_level_increase

Aleksej
10.05.2017
13:11:48
не было в логах ни чего, даже с 5 уровнем
общем сделал apt-get install zabbix-server-mysql
как то поломалось :)
но повторюсь в логах было "тихо"

Google

Alseg
10.05.2017
13:40:25
Вчера 3 видоса смотрел, то ли с хайлоада то ли с баду, и Илью @ableev увидел
там еще "а мы не используем" и ржач в зале))

Kamil
10.05.2017
13:41:10

Alseg
10.05.2017
13:41:54
Подскажите как вы обычно делаете, вот создаем хост и его нужно мониторить только на предмет веб. Ну грубо говоря это сайт. Но нельзя оставить пустой интерфейс, всё равно нужно что то выбрать.
Что вы туда пишете? Что то фейковое?

Ilya
10.05.2017
13:59:15

Kamil
10.05.2017
14:00:29
Я ещё просто создавал тригеры привязанные к хосту забикса

Alseg
10.05.2017
19:28:22
Ещё вопрос, возможно кому то он покажется странным, но на мой взгляд мы в процессе знакомства с заббиксом дублируем некоторые сущности. Например - хост который что то отдаёт по снмп ещё и подвергается симпл чек (пинговалке). Так вопрос в чем, как избавиться от лишней сущности в виде этого пинга на снмп клиентах? Наиболее правильно и красиво
Например не получили температуру цпу в течение 5 минут - считать умершим?

SS
10.05.2017
19:35:36
а вариант что snmp не настроено а хост жив не рассматриваем?
Или snmp отвалилос (бывает и такое), но хост жив тоже?

Andrey
10.05.2017
19:36:19

Alseg
10.05.2017
19:36:59

Александр
10.05.2017
19:37:19
комбинируй

Google

Andrey
10.05.2017
19:37:25
Тебе ничего не мешает делать все так, как тебе вздумается)

Alseg
10.05.2017
19:37:59

Александр
10.05.2017
19:38:29
ну представь отвалился snmp но все остальное работает
хост умер или жив?

Alseg
10.05.2017
19:39:08
А как иначе то?

Andrey
10.05.2017
19:39:27
Тебе ничего не мешает делать все так, как тебе вздумается)

Александр
10.05.2017
19:39:39
Тебе ничего не мешает делать все так, как тебе вздумается)
Вопрос закрыт :)

Alseg
10.05.2017
19:40:02

Александр
10.05.2017
19:40:02
ставишь nodata и все

Andrey
10.05.2017
19:40:04
Если тебе эта логика кажется правильной, жги
Я делаю nodata и пинги
Еще делаю зависимости триггеров недоступности агентов за роутером от пинга роутера

SS
10.05.2017
19:41:17
А как иначе то?
Крайне не верно, тупой админ навесил кривой ацл на снмп и хост пашет, это другой уровень реакции аварии в отличии от пропадания icmp

Александр
10.05.2017
19:41:59

Alseg
10.05.2017
19:42:04
Надо идти решать

Andrey
10.05.2017
19:42:22

Google

Alseg
10.05.2017
19:42:26
Ацл или нет, неважно

Александр
10.05.2017
19:42:30

SS
10.05.2017
19:42:31
А как будет определяться что произошло?

Alseg
10.05.2017
19:42:44

Александр
10.05.2017
19:42:58
ответственному за что?
за то что упал сервер целиком или за падение snmp?

Alseg
10.05.2017
19:43:39

Евгений
10.05.2017
19:43:43
Мониторинга много не бывает

SS
10.05.2017
19:44:18
Извиняюсь за свой французский, но каждый е@$$ся как ему нравится. И я не помощник в изобретении велосипеда с костылями

Alseg
10.05.2017
19:45:36
Не нужно вот этого

Alseg
10.05.2017
19:45:41
Я все слышу

SS
10.05.2017
19:46:00
Но это отражает то что получится

Alseg
10.05.2017
19:46:07
Спасибо за ответы

SS
10.05.2017
19:47:12
Тут один товарищ пытается up/down интерфейса ловить по дельте счётчиков октетов, тоже не хочет плодить

Alseg
10.05.2017
19:48:51
Я лишь могу выразить как у нас обстоит с ответственными, и мне откровенно удивительно когда спрашивают а кто ответственный? Дежурный как минимум, а что именно упало и по чьей вине это уже другой вопрос
Лампочка должна загорется имхо
Конечно же не нужно плодить сущности
Если оно работало и умерло снмп но хост работает - это же ничего не меняет, нужно решать

Google

Alseg
10.05.2017
19:53:30
А по этой логике мне пинг будет слабым утешением
Ладно, понял, спс за ответы

Александр
10.05.2017
19:56:07
в твоем же случае ты сразу поднимаешь всех потому что сервер упал

Alseg
10.05.2017
19:57:19
Если там ацл прописали - это тут же будет определено
Обращаясь к терминологии - есть инцидент а есть проблема
У инцидента четкое понимание что конкретно а проблема носит плавающий или неизвестный характер, часто периодический

Admin
ERROR: S client not available

Alseg
10.05.2017
19:59:55
И инструкции разные соответственно
Но я про собственный опыт исключительно

Евгений
10.05.2017
21:11:15
сделай одну метрику - работает твоё приложение или нет, если нет, пусть все идут разбираться, чё, зачем тебе snmp , если приложение не работает
Я это для себя вообще описал как "Факап N1" , но можешь сам наступить на эти грабли, если уж так хочется https://habrahabr.ru/post/306272/

Alseg
10.05.2017
21:32:53
ну и плюс не всегда там мониторится само приложение, например
у меня крайне простой кейс, мне нужно понимать живо оно или нет, мы сейчас даже всё что там высоко типа сервисы или бизнес-логику не берем в расчет

Евгений
10.05.2017
21:34:40
это был сарказм, кажется ты спросил совета, но не слышышь его

Alseg
10.05.2017
21:35:04
Использовал
{хост:cpu.load.nodata(3)}=1
но никаким образом не работает. Возможно ли что для nodata необходимо чтобы хост сам трапал значение? Ну т.е. если там проверка от заббикса то это почему то не работает

Google

Alseg
10.05.2017
23:10:15
ну т.е. триггер не срабатывает никаким образом если я выключаю snmp на хосте

Vitalii
11.05.2017
04:16:53
У меня в 3.2.5 версии nodata вообще не работал. С обновлением до 3.2.6 - вылечилось

Alseg
11.05.2017
04:42:44
полночи сидел ковырял триггер)))

Vitalii
11.05.2017
05:24:59
?
Я и на 3.2.1 откатывал. Не помогло.
?

Alseg
11.05.2017
05:27:42
хотя по снмп всё забирается, коннективити отличное

Сергей
11.05.2017
05:36:40

Alseg
11.05.2017
05:36:47
я так понимаю что nodata(n), где n это секунды

Сергей
11.05.2017
05:36:55
Да

Alseg
11.05.2017
05:37:07
и даже где то в документации нашел пример с кол-вом последних раз
а сейчас смотрю https://www.zabbix.com/documentation/3.2/manual/appendix/triggers/functions и тут только секунды уже
как отвязаться от времени и привязаться к 3 последним чекам?
как обходное пока воткну .nodata(5m)}=1
примет ли nodata аргументом такое?