@metrics_ru

Страница 660 из 681
M
07.10.2018
23:28:40
Ребята а у prometheus есть возможность изменить scrape interval если alert сработал ? или в каких то случаях , проверка раз в пять минут , но хочется если проблема то он стал бы чаще проверять

Deep Sea
07.10.2018
23:31:18
Нет

Mikhail
08.10.2018
07:24:35
/stat@combot

Combot
08.10.2018
07:24:35
combot.org/c/-1001068522817

Google
Andor
08.10.2018
07:25:59
Mikhail
08.10.2018
07:26:12
/leave

Anton
08.10.2018
07:27:16
Ребята а у prometheus есть возможность изменить scrape interval если alert сработал ? или в каких то случаях , проверка раз в пять минут , но хочется если проблема то он стал бы чаще проверять
пишешь нечто, принимающее вебхук из алертменеджера, чтобы оно меняло конфиг прометея для конкретной точки и дергало прометей перечитать конфиг

Andor
08.10.2018
07:27:38
Ну то есть scrape у тебя останется тот же, но алерты можно чтобы зависимые были

И например чтобы считались чаще-реже

Но это странное

M
08.10.2018
07:29:53
Andor
08.10.2018
07:30:20
По меркам костыльности он очень хорош

Anton
08.10.2018
07:30:36
ну мы так self-healing делали

чтобы ночью не вставать из-за фигни

Google
Andor
08.10.2018
07:31:14
Звучит как self-ignoring

M
08.10.2018
07:31:33
ага

Anton
08.10.2018
07:34:26
ignoring это заглушить алерт. а собрать всю диагностическую информацию и правильно перезапустить приложение это немного другое

Дмитрий
08.10.2018
07:37:46
специалисты по исинге и nsp++ клиенту есть? не могу, блин, мониторить сетевой интерейс на венде (

Алексей
08.10.2018
07:53:19
Evgeny, почитывая парней из m3 встретил мнение что remote_read в проме сделан не лучшим образом. помню что ты тоже ругался. поделись подробностями ?

Evgeny
08.10.2018
07:55:42
remote_read не умеет в агрегацию, он просто говорит - дай мне данные за такой-то интервал, даже если в этом интервале миллиарды точек

т.е. адаптер должен заранее знать как даунсэмплить данные, это не очень реалистично

Алексей
08.10.2018
08:01:21
ага. спасибо.

Andor
08.10.2018
08:10:59
Ну альтернатива этому - адаптер должен уметь интерпретировать пром

Алексей
08.10.2018
08:11:38
парни из m3 умеют заглядывать в разные namespace для разных данных.

через namespece у них реализованы retention policies к примеру

Evgeny
08.10.2018
08:19:01
Ну альтернатива этому - адаптер должен уметь интерпретировать пром
могли бы просто передавать step и функцию, чтобы адаптер смог сделать правильный запрос к базе адаптеру неоткуда узнать, какие серии как нужно даунсэмплить, где-то нужно использовать max, где-то avg, где-то вообще бессмысленно даунсэмплить, эта информация обычно есть в дашборде, дашборд отправляет эту информацию в пром, а вот пром ее дальше не передает

Denys ??
08.10.2018
08:35:44
Ну альтернатива этому - адаптер должен уметь интерпретировать пром
Ну так работают все вменяемые решения для апскейла прома - и Thanos, и M3 и Cortex – в каждый мучительно впиливается пром...

Andor
08.10.2018
08:37:33
Танос шлёт запросы ваще во все сайдкары

Свои минусы есть

Roman
08.10.2018
08:38:12
Мне еще не понравилось в remote read следующее - оно запрашивает все точки, а потом как-то их сжимет до меньшего количества внутри прома. В результате при просмотре графика за длительный период рисуется не линия, а отдельные редкие точки. Я так и не понял по какому принципу он это делает

Sergey
08.10.2018
08:40:32
Адепты, подскажите, в пром в аннотации алерта такую конструкцию поместить нельзя? {{ reReplaceAll "slave_(.*)" "${1}" .Labels.id }}. У метрики есть лейблы вида id="slave_1".

Хочу эту самую единичку вырезать и подставить в сообщении. Но пром ругается.

Evgeny
08.10.2018
08:47:17
Передавать функцию и есть то что я сказал
функцию он и отправляет, но не функцию для даунсэмплинга, а то что было в запросе (например rate или deriv), т.е. получается, что TSDB должна повторять семантику прома, чтобы это использовать, но хинт для даунсэмплинга оно не отправляет, поэтому для даунсэмплинга это совсем бесполезно

Google
Evgeny
08.10.2018
08:47:43
т.е. это явно делалось для федерации прома, но не для интеграции с TSDB

Алексей
08.10.2018
08:57:15
Ребят подскажите можно ли мониторить systemd сервисы с помощью prometheus? инфы не могу найти на уту тему

Алексей
08.10.2018
09:01:08
Встроенный? То есть мне нужно только алертинг настроить

Artem
08.10.2018
09:02:34
да

а

Disabled by default

https://github.com/prometheus/node_exporter

Andrey
08.10.2018
09:04:05
Disabled by default
ну там ключик запуска есть.

запусти с ключиком

Terminator
08.10.2018
10:52:27
Слава Ибрагимов будет жить. Поприветствуем!

Alexey
08.10.2018
11:46:52
Всем привет! Посоветуйте как быть. Есть условное приложение, у которого 10-18 тредов с custom names. В зависимости от конфигурации количество тредов может меняться. Есть TICK, которым хочется мониторить каждый тред в плане потребления CPU time & RAM. Есть ли хороший способо решить подобную задачу без костылей? OS = Linux

Terminator
08.10.2018
13:10:58
Aleksandr Bagaev будет жить. Поприветствуем!

@lAionl будет жить. Поприветствуем!

@AlAnisimov будет жить. Поприветствуем!

Дмитрий
08.10.2018
16:02:46
1111 members

Admin
ERROR: S client not available

Google
Paul
08.10.2018
16:02:57
можно поднять бокалы

Serg
08.10.2018
16:36:01
А кто и как мониторит постгрю? Что надо мониторить? Какой лучше экспортер использовать?

Paul
08.10.2018
16:36:54
экспортер использую тот, что на оффсайте. мониторю пока минимум. Если кто-то выложит свой файл с метриками - будет здорово

Serg
08.10.2018
16:44:25
У меня вот вопрос по этому экспортеру, он воспринимает параметры подключения через переменные окружения... И как с этим жить? Как секретные данные не использовать... (((

И если создавать отдельного юзера, какие ему права надо накинуть?

Serg
08.10.2018
16:46:10
Вот в том то и дело, что я запускаю как обычный сервис системд (((

Не в контейнере

Andor
08.10.2018
16:48:13
а без энв ты бы как сикрет передал?

Алексей
08.10.2018
16:48:55
А с чего вдруг env стал пригоден для секретов больше чем файл?

cat /proc/333/environ и всё

Так даже проще

Andor
08.10.2018
16:49:42
да ни с чего, так же слабо пригоден

Алексей
08.10.2018
16:50:41
Тут можно сделать подпорку в виде изоляции но там шаредхостинг начинается и я туда не ходил

Serg
08.10.2018
17:00:15
Мне тут подсказали немного другой выход, я все равно на локалхосте запускаю экспортер и можно спокойно коннектиться через юникс сокет... Завтра попробую.

Serg
08.10.2018
21:03:30
А файлик же тоже должен быть plaintext и ничего не мешает его посмотреть?

Алексей
09.10.2018
06:19:53
ну там ключик запуска есть.
C таким? ExecStart=/usr/local/bin/node_exporter --collectors.enabled systemd

Andor
09.10.2018
06:22:41
Остальные отключатся

Надо указывать все какие надо

Google
Алексей
09.10.2018
06:23:09
У меня и этот не включился

Есть пример у когонибудь как запустить node_exporter с systemd

Deep Sea
09.10.2018
06:27:10
У меня и этот не включился
Потому что флаг --collector.systemd

Алексей
09.10.2018
06:29:02
Потому что флаг --collector.systemd
Спасибо вот так запустился

Страница 660 из 681