
Ilya
12.03.2018
08:59:00
Имхо траппер эффективнее на большом числе узлов
мы ушли от нативного zabbix-agent вообще
Соглашусь.
У нас 99% конфигурации каждого сервера хранится в паппете, крон джобы управляются им же.
Чтобы разложить новую строчку в крон, и завернуть статистику на новый заббикс сервер или перестать её отправлять, а просто складывать временно в файл, а потом запулить одним махом в сервер – нужно пару минут. Да любые сценарии.
Но чтобы сделать то же через агента – нужно ломать голову, тыкать кнопульки и прочее и прочее.

Anton
12.03.2018
08:59:08
есть два типа доступа к данным с точки зрения мониторинга, push и pull
pull как минимум требует доступа с узлов мониторинга до боевых узлов (что как бы ФУ)
push же нужно только c боя до TCP 10051 (напирмер) на мониторинге
мы написали нужные нам плагины для траппер-агента mamonsu
изначально он задумывался разработчиками для мониторинга PG, но оказалось что на нём удобно и любые другие компоненты мониторить

Google

Anton
12.03.2018
09:00:46
оно быстрее и удобнее shell-скриптов

Alex
12.03.2018
09:01:05


Ilya
12.03.2018
09:01:28
Можно даже начать использовать @monitoring для этого ?

Alex
12.03.2018
09:04:04
Давайте закончим и сделаем ещё что нибудь крутое. Костылики на кроне это наши хаки, я их не поддерживаю, но они у нас у всех есть. Может в будущем у нас будет больше комфорта если каждый внесёт небольшой вклад в сообщество.

Alexander
12.03.2018
09:35:03
он просто посмотрит в acl кому можно отдать а кому нет

Некто
12.03.2018
10:18:01
Давайте сделаем BolgenMonitoring, да.

Alexander
12.03.2018
10:19:32
ну можно иногда и просто подискутировать
я к тому что тут еще не очень понятно что проще - читать с урла метрики или пихать на сервер агент мониторинга (заббикс-агент), в дополнение к нему ставить заббикс-сендер. в дополнение к нему ставить скрипт. в дополнение к ним поднимать крон джоб. в случае паппета мы еще и агента управления ставим
это не страшно и у многих так работает
просто вот так вот со стороны посмотреть и немного призадуматься...

Александр
12.03.2018
10:22:00

Некто
12.03.2018
10:22:08
По-моему тут уже эта тем звучала - научить приложения отчитываться самостоятельно. Как там... мониторинг как код... или типа того.

Google

Alexander
12.03.2018
10:23:40
ну тут вопрос по сути в пуш-пул споре
не так ли?

Некто
12.03.2018
10:25:41
Вот что странно - почему-то предложений вживить плотнику в руку рубанок не звучит, а вот забацать какую-то мегасистему, которая догадалась бы что брать, куда слать и при этом сама бы разворачивалась и генерировала код для доступа к любому софту (как существующему, так и еще несозданному) - периодически кто-то предлагает

Ilya
12.03.2018
10:26:08
И кто-то делает
И с докладами выступает
И как готовое решение продаёт


Alexander
12.03.2018
10:26:36
Встряну в дискуссию с другим вопросом ?
Кто-нибудь находил проблему в расчете SLA?
Есть сервис, по которому горит, что он ОК, но SLA падает и падает, как-будто какой-то компонент не OK.
В БД такая картина:
select * from services where serviceid=29;
+-----------+--------+--------+-----------+-----------+---------+---------+-----------+
| serviceid | name | status | algorithm | triggerid | showsla | goodsla | sortorder |
+-----------+--------+--------+-----------+-----------+---------+---------+-----------+
| 29 | OurLab | 0 | 1 | NULL | 1 | 95.0000 | 0 |
+-----------+--------+--------+-----------+-----------+---------+---------+-----------+
Статус сервиса - ОК
select servicealarmid, serviceid, clock, value from service_alarms where serviceid=29 order by clock;
+----------------+-----------+------------+-------+
| servicealarmid | serviceid | clock | value |
+----------------+-----------+------------+-------+
| 17485 | 29 | 1520617206 | 3 |
| 17501 | 29 | 1520619150 | 4 |
| 17524 | 29 | 1520619301 | 0 |
| 17518 | 29 | 1520619426 | 3 |
Если посмотреть на ID и Clock, то у последних двух видно, что криво проставилось время и из-за этого вот такое.


Alexander
12.03.2018
10:26:40
я считаю что забрать по урлу метрики на сегодня очень хорошее решение
а еще лучше, если приложение умеет регистрироваться где-то

Некто
12.03.2018
10:28:21
Да вообще нет хороших решений в принципе. Когда-то хорошим решением было всем иметь хвост и шерсть.

Андрей
12.03.2018
12:49:18
Такая беда .. спустя дней 7 сервер начинает трудно отрабатывать запросы. Главная страница может грузиться около 2 минут. Глядя на картину ресурсов видно что часть процессов находятся в ожидании .. хотя на первых днях работы где то до 4 дня таких проблем нет. При этом память наростили. Свервер на гипервизоре.

Ilya
12.03.2018
12:49:44
Спустя 7 дней после чего?

Андрей
12.03.2018
12:49:55
после рестарта

Ilya
12.03.2018
12:50:14
После рестарта чего? Заббикса или мускуля? Или сервера? Или ноутбука?

Андрей
12.03.2018
12:50:37
целиком сервера
пару раз замечал что как раз через 4 дня начинает расти своп почему то

Ilya
12.03.2018
12:51:36
innotop в помощь, чтобы посмотреть, какие запросы виноваты
Ну и параметры MySQL тоже важны. Сколько памяти, и тд и тп. Какая нагрузка.

Андрей
12.03.2018
12:57:14
ок попробую с конфигом поколдовать

Google

Александр
12.03.2018
13:30:41
По APC, нашел хороший шаблон для мониторинга https://wiki.soulruins.info/docs/zabbix/templates/smartups

Alexey
12.03.2018
14:45:16
подскажите, в чем может быть причина проблемы отправки оповещений? оповещение отправляется на группу, в группе 2 пользователя. способ и настройки оповещения в профилях идентичные, только номер телефона другой. единственное отличие - один пользователь еще в группе администраторов. ему вот приходят, а простому юзеру нет.

Alexander
12.03.2018
14:46:01
добавьте второго в администраторы - приходит сообщение? там и ответ близко

Некто
12.03.2018
14:46:49
(намекает на недостаток прав)

Alexey
12.03.2018
16:38:02
т.е. я не могу отправлять никому кроме себя оповещения не давая учетке админских прав на заббикс? что то бред какой то

Ilya
12.03.2018
16:38:42
Выдай ему read only – будет тебе счастье

Alexander
12.03.2018
16:42:51

Aleksandr
12.03.2018
16:43:48
Нашел. У пользователя в настройках были тригеры только черезввычайно важные

Alexey
12.03.2018
16:46:45

Alexander
12.03.2018
16:47:33
я выше смотрю на твою проблему - ты можешь настрогать сколько угодно групп и сколько угодно вариантов оповещений

Alexey
12.03.2018
16:48:58
я кажется понял

Alexey
12.03.2018
16:49:46
юзеру надо дать права на тот шаблон, в котором находится триггер. так?

Михаил
12.03.2018
16:50:52
оповещения приходят не о шаблонах вроде

Ilya
12.03.2018
16:58:53

Alexey
12.03.2018
17:00:27
ну вобщем ситуация такая. у меня на микротике висит впн соединение аутсорса. периодически они лезут без предупреждения и что то там ломают. настроен триггер, на больше, чем 20кбит/с на интерфейсе в течении 2 минут. на пинги не реагирует, но если полезут по ssh, то срабатывает и приходит смс. хочу вот сделать, что бы оповещение приходило еще манагеру и он звонил им самостоятельно и вставлял пиздянок
создал юзера, в настройках ему вбил его телефон. добавил в группу на которую настроено действие. мне приходит, манагеру нет

Ilya
12.03.2018
17:18:38
ээ... а хосты зачем?
Ну что зачем? Мне рассказывать теорию, как работают уведомления в заббиксе?
Что неясно во фразе "выдай рид онли на те хосты, по которым срабатывают триггеры".
Зачем? Ну так если тебе непонятно зачем – открой документацию. Ты спросил, что сделать – тебе ответили уже, и не один человек.

Alexander
12.03.2018
17:19:48
+ про документацию. и после просто поэкспериментировать. оно в голове устаканится и наступит дзен

Google

Alexander
12.03.2018
17:27:20


Aleksandr
12.03.2018
17:27:44
ээ... а хосты зачем?
Например затем, что у тебя может быть настроен мониторинг для разных клиентов, зачем клиенту а, получить алерты от клиента б, и наоборот? вот и нужно второму пользователю выдать права на те хосты с которых ему должны приходить алерты.

Alexey
12.03.2018
17:48:58
Ну что зачем? Мне рассказывать теорию, как работают уведомления в заббиксе?
Что неясно во фразе "выдай рид онли на те хосты, по которым срабатывают триггеры".
Зачем? Ну так если тебе непонятно зачем – открой документацию. Ты спросил, что сделать – тебе ответили уже, и не один человек.
спасибо, завтра попробую.
ну ты прав, логику работы алертов я пока не совсем понимаю. я думал, срабатывает триггер, по нему выполняется действие. а в действии рулится уже, кому отправлять. доки обязательно прочту, самому интересно. сейчас просто нужно оперативно решить задачу.

Ilya
12.03.2018
17:57:36

Alexey
12.03.2018
17:58:46
хост в группе routers даю право на группу, алерт улетает, так?

Admin
ERROR: S client not available

Ilya
12.03.2018
18:02:36
Ну я не в курсе, какие там группы

Alexander
12.03.2018
18:03:10

Alexey
12.03.2018
18:03:28

Alexander
12.03.2018
18:04:56

Александр
12.03.2018
18:04:58
А манагер боту в приват гадил?

Alexander
12.03.2018
18:05:09
только через группу пользюков

Ilya
12.03.2018
18:11:52

Alexey
12.03.2018
18:31:08

Alexander
12.03.2018
18:41:13

Alexey
12.03.2018
18:45:07

Alexander
12.03.2018
18:49:00
хм... точно. Попутал, извините

Google

Kendrick
12.03.2018
20:02:27
Привет

Ilya
12.03.2018
20:22:46

Александр
12.03.2018
20:26:32

Alexander
12.03.2018
20:31:47
без всяких вопросов там
так принято

Александр
12.03.2018
20:32:10

Alexander
12.03.2018
20:32:30
поэтому отета непривет - херня как по мне

Александр
12.03.2018
20:36:47
Одно дело когда ты в чатике с камрадами, другое общий, относительно профильный чат.

Ilya
12.03.2018
20:37:25
Солидарен с Алексадром

Дмитрий
12.03.2018
20:38:06
С каким из?

Александр
12.03.2018
20:38:09

Dmai
12.03.2018
22:20:06
по поводу задавания вопросов, тему о которой недавно говорили. по линку перевод старой статьи на эту тему
http://hpc.name/thread/5582/p1.html

Некто
13.03.2018
05:23:53
Хакеры пьют чай разве?

Семен
13.03.2018
05:43:58
Давно чай не пил?

Некто
13.03.2018
05:44:34
С вечера. Строчу вот с утра ответы в имейлы, не могу оторваться.