Alexey
Если сервера подготовить то перенести БД и прочее дело на пару часов максимум
Alexey
При этом старый можно не отключать, пока отлаживаешь
rene
Хм, щас докачу до работы, начнем с коллегой пробовать, спасибо за совет
Alexey
У вас это очень критический сервис?
Alexey
у нас да например. Поэтому я можно сказать безшовно переезжал
rene
Ну, не совсем, есть в системе и в разы более критичный
Alexey
у меня есть несколько фронтов, перед ними балансировщик на nginx
rene
Есть кстати вариант сделать образ акронисом, осталось только агент в центосе накатить, как думаешь, норм решение?
Alexey
Я подготовил полную рабочую версию, т.е. отдельно поднял БД, новый заббикс, новые фронты. Все на отдельных вируталках + баре метал под БД. У нас большая нагрузка, вируталки такое не потянут. Но все разнес по разным, ибо устраивать кашу на 1-2 серверах это бред. Отлаживать тяжело изза разного профиля нагрузки и потребилей ресурсов
Alexey
Затем в балансировщике просто заменил старые апстримы на новые... далее nginx -s reload и вуаля все на новом заббиксе
Alexey
снять бэкап бд, можно без остановки через percona xtrabackup если mysql или на postgre через start base backup
Alexey
вообщем ))) вариантов масса, все зависит от прямизны рук
Alexei
Вышли в свет Zabbix 3.4.2rc1, 3.2.8rc1, 3.0.11rc1 и 2.2.20rc1. Линк для скачивания: https://www.zabbix.com/download#rc
Danil
Коллеги , приветствую! Подскажите . Ситуация - произошла авария , заббикс нагенерировал ну очень много сообщений , авария уже устранена а рассылка ещё идет. Как можно почистить очередь вручную? отменить рассылку или удалить очередь?
SS
для MySQL запрос в бд
SS
update alerts set status=2,error='' where status=0 and alerttype=0;
SS
для psql похоже
Danil
а нет ли API под это дело?
Roman
Никто не подскажет, есть calculated item: last(item1) / last(item2) Возможно ли сдесь использовать проверку? Типа если item2=0 то деление не выполнять
Дмитрий
Roman
Именно так. Сам озадачен
Sergey
Прибавлять к айтем2 0.00000001?)
Roman
Похоже да.
Roman
Спасибо, буду тестить
SS
а нет ли API под это дело?
Наверное можно написать, но явно не одной строчкой
Sergey 'dreik'
@demeliorator
Alexey
@aftertime
Dmitry
Вечер добрый
Dmitry
Подскажите, есть заббикс и несколько темплейтов с триггерами. Нужно для некоторых хостов выделить уровни алерта на триггере
Dmitry
Как это сделать максимально эффективно?
Dmitry
Создавать ещё один темплейт с другим уровнем алертов не хочется
Dmitry
У триггера?
Kamil
да
Dmitry
Сделать ещё один триггер с зависимостью но нужным уровнем?
Dmitry
Спс
Kamil
единственно, например, если проблема дойдет до 5%, и потом будет решена до более 20%, придет сразу 4 отлупа, по очереди,а не один
Dmitry
Ммм
Dmitry
Это не совсем то что нужно
Kamil
Это не совсем то что нужно
тогда я не понял че к чему
Dmitry
Мне просто надо часть алертов от триггеров сделать более низкими по уровню важности
Dmitry
Для определенных хостов
Andrey
А тебе прям именно важность нужна? Какая конечная цель? Всмесле, где хочешь это использовать?
Dmitry
Один триггер - разные группы с разным severity
Kamil
Один триггер - разные группы с разным severity
привязать первый шаблон ко второму и в нем поменять уровень, и уже этот измененный щаблон привязать к хосту
Dmitry
Блин как в Прометее удобно с лейблами все таки
Kamil
Блин как в Прометее удобно с лейблами все таки
ну так прометей поновее, учли все нюансы...
Alexei
ну так прометей поновее, учли все нюансы...
Поменял лейбл, появилась новая метрика, пропала история. Не уверен, что это всегда удобно.
Danila
шалом. у меня тут странный кейс, на самом деле - не создаётся пид на 7ом центосе, заббикс 3.4 с постгре. фронт настроил, а сервер упал и не встаёт: -- Unit zabbix-server.service has begun starting up. Sep 20 17:52:13 vm-b060c99e systemd[1]: PID file /run/zabbix/zabbix_server.pid not readable (yet?) after start. Sep 20 17:52:13 vm-b060c99e systemd[1]: zabbix-server.service never wrote its PID file. Failing. Sep 20 17:52:13 vm-b060c99e systemd[1]: Failed to start Zabbix Server. -- Subject: Unit zabbix-server.service has failed -- Defined-By: systemd -- Support: http://lists.freedesktop.org/mailman/listinfo/systemd-devel -- -- Unit zabbix-server.service has failed. -- -- The result is failed. Sep 20 17:52:13 vm-b060c99e systemd[1]: Unit zabbix-server.service entered failed state. Sep 20 17:52:13 vm-b060c99e systemd[1]: zabbix-server.service failed. в конфиге пид должен быть PidFile=run/zabbix/zabbix_server.pid, права на него: [root@vm-b060c99e ~]# ls -ld /run/zabbix/ drwxrwxrwx 2 zabbix zabbix 40 Sep 20 18:12 /run/zabbix/ в systemd указан юзер zabbix
Danila
selinux ?
отключен [root@vm-b060c99e ~]# setenforce 0 setenforce: SELinux is disabled [root@vm-b060c99e ~]#
Alexey
у тебя в /var/run каталог zabbix есть?
Alexei
Встречаем 3.4.2rc2: https://www.zabbix.com/rn3.4.2rc2
Ķ₳ℝḾ₳
Добрый вечер! Подскажите по триггеру утилизации канала; {icmpping.max(2)}<>2 and (({ifHCInOctets[{#IFNAME},{#IFALIAS}].last(5m)} + {ifHCOutOctets[{#IFNAME},{#IFALIAS}].last(5m)}) > ({ifHighSpeed[{#IFNAME},{#IFALIAS}].last()}*{$UPLINK_WARN_UTIL}*0.01))
Ķ₳ℝḾ₳
беда заключается в неадекватном поведении триггера после выключения - включения порта т.е. со значением ifHighSpeed которое будет ровно нулю... и триггер радостно скажет что любой трафик > 0
Цесарев
ребят привет . кто сталкивался с оповещением в телеграмм?
Цесарев
есть такой код #!/bin/bash wget -a "/tmp/alert.log" "http://crierbot.appspot.com/$1/send?message=$2" ну никак не приходят сообщения
Duce
Посмотрите, чем я поделился: Zabbix-in-Telegram/README.md at master · ableev/Zabbix-in-Telegram · GitHub @MIUI| https://github.com/ableev/Zabbix-in-Telegram/blob/master/README.md
Duce
Это точно работает!!!
Цесарев
Спасибо.сейчас попробую. По забиксу если вопросы есть , могу обращаться?
Alexei
Новая интересная статья на Хабре! Zabbix 3.4: Массовый сбор данных на примерах счетчика Меркурий и smartmontools: https://habrahabr.ru/company/zabbix/blog/337856/
VIKTOR
Добрый вечер! Подскажите по триггеру утилизации канала; {icmpping.max(2)}<>2 and (({ifHCInOctets[{#IFNAME},{#IFALIAS}].last(5m)} + {ifHCOutOctets[{#IFNAME},{#IFALIAS}].last(5m)}) > ({ifHighSpeed[{#IFNAME},{#IFALIAS}].last()}*{$UPLINK_WARN_UTIL}*0.01))
можно сделать так: {Template Module Interfaces SNMPv2:net.if.speed[ifHighSpeed.{#SNMPINDEX}].last()}=100000000 and ({Template Module Interfaces SNMPv2:net.if.in[ifHCInOctets.{#SNMPINDEX}].avg(300)})😠{Template Module Interfaces SNMPv2:net.if.speed[ifHighSpeed.{#SNMPINDEX}].last(0)})*0.8
VIKTOR
триггер включится если канал нагружен входщим трафиком более 80%
VIKTOR
можно через выражение or или and добавить исходящий трафик, пофантазировать
VIKTOR
https://pastebin.com/xdfjZNTn без смайлов
Ķ₳ℝḾ₳
VIKTOR
$UPLINK_WARN_UTIL отвечает за эти самые проценты
ifHighSpeed по какому oid опрашивается? и какая модель оборудования?
Ķ₳ℝḾ₳
D-Link если порт тухнет то видим просто 0
Ķ₳ℝḾ₳
а потом когда этот last получается в виде 0 ...
VIKTOR
может быть добавить в триггер проверку ifOperStatus ?
Vladimir
есть вопрос про параметр timeout - который стандартное значение имеет 3 секунды. это 3 секунды по каждой метрике?