@ZabbixPro

Страница 240 из 1183
Kamil
10.05.2017
13:10:17
DebugLevel=4 и глянуть лог
дебуг левел можно через команды поменять

zabbix_server —runtime-control log_level_increase

Aleksej
10.05.2017
13:11:48
не было в логах ни чего, даже с 5 уровнем общем сделал apt-get install zabbix-server-mysql как то поломалось :)

но повторюсь в логах было "тихо"

Google
Alseg
10.05.2017
13:40:25
Вчера 3 видоса смотрел, то ли с хайлоада то ли с баду, и Илью @ableev увидел

там еще "а мы не используем" и ржач в зале))

Alseg
10.05.2017
13:41:54
че за видос?
https://www.youtube.com/watch?v=ZfZL39By0cw

Подскажите как вы обычно делаете, вот создаем хост и его нужно мониторить только на предмет веб. Ну грубо говоря это сайт. Но нельзя оставить пустой интерфейс, всё равно нужно что то выбрать. Что вы туда пишете? Что то фейковое?

Kamil
10.05.2017
14:00:29
Я ещё просто создавал тригеры привязанные к хосту забикса

Alseg
10.05.2017
19:28:22
Ещё вопрос, возможно кому то он покажется странным, но на мой взгляд мы в процессе знакомства с заббиксом дублируем некоторые сущности. Например - хост который что то отдаёт по снмп ещё и подвергается симпл чек (пинговалке). Так вопрос в чем, как избавиться от лишней сущности в виде этого пинга на снмп клиентах? Наиболее правильно и красиво

Например не получили температуру цпу в течение 5 минут - считать умершим?

SS
10.05.2017
19:35:36
а вариант что snmp не настроено а хост жив не рассматриваем? Или snmp отвалилос (бывает и такое), но хост жив тоже?

Andrey
10.05.2017
19:36:19
Например не получили температуру цпу в течение 5 минут - считать умершим?
Не получать данные и получать 0 в результате пинга - глобально разные вещи

Александр
10.05.2017
19:37:19
комбинируй

Google
Andrey
10.05.2017
19:37:25
Тебе ничего не мешает делать все так, как тебе вздумается)

Alseg
10.05.2017
19:37:59
Тебе ничего не мешает делать все так, как тебе вздумается)
Ну то есть чистым снмп эта задача не имеет решения?

Александр
10.05.2017
19:38:29
ну представь отвалился snmp но все остальное работает

хост умер или жив?

Alseg
10.05.2017
19:39:08
ну представь отвалился snmp но все остальное работает
Это уже повод бить Алерт и идти разбираться

хост умер или жив?
Считаем что умер

А как иначе то?

Andrey
10.05.2017
19:39:27
Тебе ничего не мешает делать все так, как тебе вздумается)

Александр
10.05.2017
19:39:39
Тебе ничего не мешает делать все так, как тебе вздумается)

Вопрос закрыт :)

Alseg
10.05.2017
19:40:02
Тебе ничего не мешает делать все так, как тебе вздумается)
Ок, просто иногда проще посмотреть чужой опыт

Александр
10.05.2017
19:40:02
ставишь nodata и все

Andrey
10.05.2017
19:40:04
Если тебе эта логика кажется правильной, жги

Я делаю nodata и пинги

Еще делаю зависимости триггеров недоступности агентов за роутером от пинга роутера

SS
10.05.2017
19:41:17
А как иначе то?
Крайне не верно, тупой админ навесил кривой ацл на снмп и хост пашет, это другой уровень реакции аварии в отличии от пропадания icmp

Александр
10.05.2017
19:41:59
Еще делаю зависимости триггеров недоступности агентов за роутером от пинга роутера
печально что нельзя сделать зависимость триггеров группы хостов от одного триггера

Alseg
10.05.2017
19:42:04
Крайне не верно, тупой админ навесил кривой ацл на снмп и хост пашет, это другой уровень реакции аварии в отличии от пропадания icmp
На мой взгляд тут вопрос не в степени идиотизма а в том что в любом случае это внештатная ситуация

Надо идти решать

Andrey
10.05.2017
19:42:22
Google
Alseg
10.05.2017
19:42:26
Ацл или нет, неважно

Александр
10.05.2017
19:42:30
SS
10.05.2017
19:42:31
А как будет определяться что произошло?

кому?
Бинго блядь

Alseg
10.05.2017
19:42:44
кому?
Ответственному

Александр
10.05.2017
19:42:58
ответственному за что?

за то что упал сервер целиком или за падение snmp?

Alseg
10.05.2017
19:43:39
ответственному за что?
Всмысле за что? Зачем мониторинг если нет ответственного?

Евгений
10.05.2017
19:43:43
Мониторинга много не бывает

SS
10.05.2017
19:44:18
Извиняюсь за свой французский, но каждый е@$$ся как ему нравится. И я не помощник в изобретении велосипеда с костылями

Alseg
10.05.2017
19:45:36
Не нужно вот этого

Alseg
10.05.2017
19:45:41
Я все слышу

SS
10.05.2017
19:46:00
Но это отражает то что получится

Alseg
10.05.2017
19:46:07
Спасибо за ответы

SS
10.05.2017
19:47:12
Тут один товарищ пытается up/down интерфейса ловить по дельте счётчиков октетов, тоже не хочет плодить

Alseg
10.05.2017
19:48:51
Я лишь могу выразить как у нас обстоит с ответственными, и мне откровенно удивительно когда спрашивают а кто ответственный? Дежурный как минимум, а что именно упало и по чьей вине это уже другой вопрос

Лампочка должна загорется имхо

Конечно же не нужно плодить сущности

Если оно работало и умерло снмп но хост работает - это же ничего не меняет, нужно решать

Google
Alseg
10.05.2017
19:53:30
А по этой логике мне пинг будет слабым утешением

Ладно, понял, спс за ответы

Александр
10.05.2017
19:56:07
Если оно работало и умерло снмп но хост работает - это же ничего не меняет, нужно решать
Но ты отправляешь админа проверить snmp или поднимаешь всех потому что сервер упал

в твоем же случае ты сразу поднимаешь всех потому что сервер упал

Alseg
10.05.2017
19:57:19
Но ты отправляешь админа проверить snmp или поднимаешь всех потому что сервер упал
Проблема как минимум должна быть диагностирована дежурной сменой, зачем всех то поднимать?

Если там ацл прописали - это тут же будет определено

Обращаясь к терминологии - есть инцидент а есть проблема

У инцидента четкое понимание что конкретно а проблема носит плавающий или неизвестный характер, часто периодический

Admin
ERROR: S client not available

Alseg
10.05.2017
19:59:55
И инструкции разные соответственно

Но я про собственный опыт исключительно

Евгений
10.05.2017
21:11:15
Конечно же не нужно плодить сущности
не соглашусь с тобой, мониторинга много не бывает

сделай одну метрику - работает твоё приложение или нет, если нет, пусть все идут разбираться, чё, зачем тебе snmp , если приложение не работает

Я это для себя вообще описал как "Факап N1" , но можешь сам наступить на эти грабли, если уж так хочется https://habrahabr.ru/post/306272/

Alseg
10.05.2017
21:32:53
ну и плюс не всегда там мониторится само приложение, например

у меня крайне простой кейс, мне нужно понимать живо оно или нет, мы сейчас даже всё что там высоко типа сервисы или бизнес-логику не берем в расчет

Евгений
10.05.2017
21:34:40
это был сарказм, кажется ты спросил совета, но не слышышь его

Alseg
10.05.2017
21:35:04
Использовал {хост:cpu.load.nodata(3)}=1 но никаким образом не работает. Возможно ли что для nodata необходимо чтобы хост сам трапал значение? Ну т.е. если там проверка от заббикса то это почему то не работает

Google
Alseg
10.05.2017
23:10:15
ну т.е. триггер не срабатывает никаким образом если я выключаю snmp на хосте

Vitalii
11.05.2017
04:16:53
У меня в 3.2.5 версии nodata вообще не работал. С обновлением до 3.2.6 - вылечилось

Vitalii
11.05.2017
05:24:59
?

Я и на 3.2.1 откатывал. Не помогло.

?

Alseg
11.05.2017
05:27:42
Я и на 3.2.1 откатывал. Не помогло.
а сейчас странно, спамит как автомат, флапает, то работает то не работает

хотя по снмп всё забирается, коннективити отличное

Сергей
11.05.2017
05:36:40
а сейчас странно, спамит как автомат, флапает, то работает то не работает
МБ у тебя нодата в триггере стоит меньше чем время опроса в элементе данных?

Alseg
11.05.2017
05:36:47
я так понимаю что nodata(n), где n это секунды

Сергей
11.05.2017
05:36:55
Да

Alseg
11.05.2017
05:37:07
МБ у тебя нодата в триггере стоит меньше чем время опроса в элементе данных?
ну вот я пытался кол-во опросов туда запихать чтобы не зависеть от времени

и даже где то в документации нашел пример с кол-вом последних раз

а сейчас смотрю https://www.zabbix.com/documentation/3.2/manual/appendix/triggers/functions и тут только секунды уже

как отвязаться от времени и привязаться к 3 последним чекам?

как обходное пока воткну .nodata(5m)}=1

примет ли nodata аргументом такое?

Страница 240 из 1183