@ZabbixPro

Страница 588 из 1183
Ванько
09.01.2018
12:36:30
Вообще заббикс же умеет в вебчеки

Alexander
09.01.2018
12:36:32
Спасибо. пока решил через vnstat
Что-нибудь типа sum(dayofmonth() * 24 * 60 * 60 ...)

Alexander
09.01.2018
12:36:33
Возможно, это даже проще
ИМХО, это же наверное единственное решение, разве нет? Нужно же где-то накопить данные, прежде чем отдать в Zabbix.

Google
No
09.01.2018
12:37:08
При условии того, что там могут быть ошибки типо нерезолвится dns или connection refused

Я что-то задолбался уже искать

Пробовал через attemps, но это не то

и timeout-ы к степам сценария настраивал

Alexander
09.01.2018
12:38:37
данные уже все есть - скорость траффика
Угу. Вот мы отправляем в Zabbix, условно, 1, 2, 3... 50, сервер перезагружается и мы снова будем отправлять 1, 2, 3 ... Нужно делать вычисляемый элемент?

No
09.01.2018
12:38:50
Там просто проверка на код 200 главной страницы

Иногда связь глючит и приходят алерты

Alexander
09.01.2018
12:39:21
Там просто проверка на код 200 главной страницы
Т.е. если != 200 больше N раз - слать аллерт?

Alexander
09.01.2018
12:40:08
Угу. Вот мы отправляем в Zabbix, условно, 1, 2, 3... 50, сервер перезагружается и мы снова будем отправлять 1, 2, 3 ... Нужно делать вычисляемый элемент?
Скорость устойчива к сбросу счетчика (там спец. функция для этого, не просто дельта). Да, нужен вычисляемый элемент, я написал примерно какой.

No
09.01.2018
12:40:13
Т.е. если != 200 больше N раз - слать аллерт?
Например сервис проверятся раз в 10 минут, нужен алерт если !=200 в течении 5 минут

Как то так

Google
Дмитрий
09.01.2018
12:40:48
но пока vnstat

Alexander
09.01.2018
12:41:31
Например сервис проверятся раз в 10 минут, нужен алерт если !=200 в течении 5 минут
Эмм, считать триггер чаще, чем данные собираются - как-то странно.

Но в целом, есть функция .count(): {item}.count(10,200,ne) > N

No
09.01.2018
12:45:32
{vc.net:web.test.error[Main].strlen()}>0 and {vc.net:web.test.fail[Main].min(#1)}>0

Сейчас вот так. Проверяю зафэйленые шаги сценария и последнее сообщение об ошибке

Эмм, считать триггер чаще, чем данные собираются - как-то странно.
Ты предлагаешь проверять статус код раз в минуту, и уже дальше гибко настраивать условия

Считая, сколько раз !=200

Alexander
09.01.2018
12:59:25
Ты предлагаешь проверять статус код раз в минуту, и уже дальше гибко настраивать условия
Типа того. Если раз в минуту - сильно часто, можно снимать раз в 5 минут и, скажем, считать count от последних 2х проверок. если зафейлились обе - поднимать аллерт. Как-то так.

Alexander
09.01.2018
13:05:24
Сильно часто, это для кого плохо?
Да фиг знает, я так просто предположил. )

No
09.01.2018
13:06:00
{vc.net:web.test.error[Main].strlen()}>0 and {vc.net:web.test.fail[Main].min(#1)}>0 and {vc.net:web.test.rspcode[Main,vc.labs.intellij.net].count(5m,200,ne)}

@asand3r Я сделал вот так, пошел по легкому пути. Просто добавил условие

Меня не покидает ощущение, что это должно делаться проще

Я уже голову сломал, на банальной проверке веб сервиса

count(5m,200,ne)}=5 блин, наверное так нужно сделать? @asand3r

Alexander
09.01.2018
13:16:30
count(5m,200,ne)=5 значит, что за последние 5 минут тех проверок, что не вернули 200, ровно 5 штук.

No
09.01.2018
13:17:49
count(5m,200,ne)=5 значит, что за последние 5 минут тех проверок, что не вернули 200, ровно 5 штук.
Если проверяется раз в минуту, значит в течении 5 минут сервис не возвращает 200

Alexander
09.01.2018
13:18:46
Ну да. Там можно вместо времени указать количество. count(#5,200,ne). #5 - последние 5 проверок.

No
09.01.2018
13:19:58
Вроде похоже на то, что мне нужно. Буду проверять

Google
Rinat
10.01.2018
03:32:47
Я чё-то перестал суть проблемы улавливать. Логи от агента, скрины ссылаются на не работающий сервер, перезапускается тоже агент.
Всем привет! Попробую на свежую голову заново объяснить. В общем произошла ситуация что у нас упали некоторые сервисы, пришлось потушить сервер заббикс на пару недель. Вчера я включил сервер Zabbix. Теперь по порядку: до того, как потушить сервер, я на нем пытался настроить мониторинг срока действия сертификатов с наших сайтов. До этого такой монитроинг уже был настроен, также sh скриптами, но значения отдава неверные. Все это добавлялось в UserParameters/ Что-то не взлетело, и я удалил все конфиги( строки из UserParameters и .sh скрипты) , и заббикс работал нормально. Теперь же сам сервак заббикс поднимается, в веб-морду пускает, но постоянно пишет это сообщение(Скриншот). Служба service zabbix-server restart стартует. Служба service zabbix-agent restart не стартует, и пишет что *\\\\\[root@zabbix ~]# service zabbix-agent restart Redirecting to /bin/systemctl restart zabbix-agent.service Job for zabbix-agent.service failed because the control process exited with error code. See "systemctl status zabbix-agent.service" and "journalctl -xe" for details. ///**

Делаю journalctl -xe и вот что пишет



Evgeniy
10.01.2018
03:51:42
> invalid entry "Default:yes" (

Смотри строку ниже

Откуда она? Почему раскомментированна?

invalid entry "Default:yes" (not following "parameter=value" notation) in config file

Rinat
10.01.2018
03:52:54
Шас

Oleg
10.01.2018
04:33:51
А не легче создать конфиг для агента только с нужным минимумом строк? Кто как делает? Я вот для сервера каменты оставляю, а для агента, что бы не путаться как в примере выше, оставляю строчек так 10-15.

Evgeniy
10.01.2018
04:37:03
У меня тоже дефолтный почти)

Alexey
10.01.2018
05:18:30
Добрейший денёчек! Подскажите, можно ли сделать прототип триггера (или триггер) который бы срабатывал при обнаружении нового элемента? Новый элемент появился, и - возникла "авария", которыя только вручную закрывается.

Дмитрий
10.01.2018
05:19:13
я бы с радостью внял мыслям как сделать тригер который срабатывает на - элемент не поддерживается.

Alexey
10.01.2018
05:27:04
Но как тогда показывать, какой item появился? Надо сравнивать старые и новые. Как?

Alexey
10.01.2018
05:35:32
смысл простой: мы находим параметры, которые установлены не по умолчанию. Если появляется новый такй параметр, мы хотели ыбы это видеть, не заморачиваясь с поиском. На изменение параметра триггер есть. Но он срабатывает тогда, когда 1. Параметр определился, как "со значением не по умопчанию" 2. Он - изменился.

Некто
10.01.2018
05:39:37
можете скинуть ваш конфиг? я в своем убрал эту строку Default:yes, все равно проблемка имеет место быть.
Посмотрите внимательно - у вас # в строке #Default уехала на строчку выше. Верните ее на место.

Oleg
10.01.2018
05:40:12
В обед, когда на работу приду. Вангую у вас еще где то раскоммиентирован комментарий.

Google
Rinat
10.01.2018
05:41:10
Так я и UserParameter закомментил

Alexander
10.01.2018
05:41:14
можете скинуть ваш конфиг? я в своем убрал эту строку Default:yes, все равно проблемка имеет место быть.
Давайте лучше вы скинете свой конфиг и вам сразу скажут где проблема. )

Rinat
10.01.2018
05:41:21
Ок, щас скину

Некто
10.01.2018
05:41:54
Лучше научите самостоятельно анализировать, иначе толку не будет

Alexander
10.01.2018
05:42:11
Но как тогда показывать, какой item появился? Надо сравнивать старые и новые. Как?
Хрен знает. Два элемента данных? Один считает количество, второй хранит последний добавленный элемент.

Admin
ERROR: S client not available

Alexey
10.01.2018
05:45:50
https://t.me/ZabbixPro/58766 ? А если не один новый появился, а - 10?

Некто
10.01.2018
05:46:49
В чем основная-то задача? может ее решать надо не на Zabbix

Alexey
10.01.2018
05:47:55
основная задача - монитонг БД. Мы хотим видеть параметры, установленны не по умолчанию (в том чсле, там ещё более сотни метри)

Alexander
10.01.2018
05:53:48
https://t.me/ZabbixPro/58766 ? А если не один новый появился, а - 10?
Если элемент хранящий последние добавленные элементы не будут использоваться для вычислений - хранить как строку в удобном вам формате.

Alexey
10.01.2018
05:57:53
https://t.me/ZabbixPro/58771 да, это - идея. Спасибо Вам!

Alexander
10.01.2018
06:12:45
Hostname правильно указан?



В zabbix_agent.d ничего лишнего нет? Zabbix-server принимает соединения на 127.0.0.1?

Rinat
10.01.2018
06:17:02


Alexander
10.01.2018
06:17:56
Ну а внутри файлов? Для mysql - это дефолтный, можно не смотреть.

Rinat
10.01.2018
06:18:26
Там два UserParameter, указывают на .sh файлы провереки сертификатов

В принципе проблем с заббиксом то нет, кроме той делтой строки в веб-интерфейсе

не шлет алерты в телегу

Google
Alexander
10.01.2018
06:19:59
Alexey
10.01.2018
06:20:05
Сделаю так: при lld создаётся триггер, безусловно срабатывающий. Потом его вручную отключим.

Лишь бы на помогло )

Rinat
10.01.2018
06:20:33
Alexander
10.01.2018
06:22:39
выходит что да, что-то с ним не то
Ну и запустите агента с чистым конфигом чтобы исключить его.

Дмитрий
10.01.2018
06:24:13
может кто поделиться ?

Alexander
10.01.2018
06:24:30
Прям вот с минимальными строками: PidFile=/var/run/zabbix/zabbix_agentd.pid LogFile=/var/log/zabbix/zabbix_agentd.log LogFileSize=0 Server=127.0.0.1 Hostname=Zabbix server

Rinat
10.01.2018
06:25:05
момент

Alexander
10.01.2018
06:25:39
может кто поделиться ?
Я что-то пропустил? Чем поделиться? )

Некто
10.01.2018
06:26:01
Битками ;)

Дмитрий
10.01.2018
06:26:02
тригер на неподерживаемые элементы в шаблоне (на узле)

Alexander
10.01.2018
06:26:50
Битками ;)
Хм, я не жадный, звони: 8 800 555 35 35

Shuhrat
10.01.2018
06:37:47
kkendzhaev

Igor
10.01.2018
06:39:35
тригер на неподерживаемые элементы в шаблоне (на узле)
создай айтем на "Number of unsupported items on the host" для каждого хоста и потом на него настрави триггер на изменение количества - как-то так )

можно через шаблоны

Страница 588 из 1183