
Terminator
16.07.2018
17:26:56
@ProdElbars будет жить. Поприветствуем!

Boris
16.07.2018
17:28:12
всем привет, кто использует prometheus мониторинг? Подскажите, какой опцией в правилах алертов можно задать единоразовый алерт. а не постоянный? .Т.е чтоб один раз оповещение пришло за сутки и всё.
кейс такой. Ночью снимаю бэкап и мониторию его на экзит код, соотвенственно мне не хотелось бы получать алерт ночью, а один раз днем, когда код отличный от нуля.. Т.е алерт может быть до следующего снятия бэкапа
правило алерта в данный момент выглядит так
ALERT create_devdb_backup_failed
IF cb_common_code{instance="<myhostname>:9991",job="devdb_backup"} > 0 and ON() (hour() >= 11 and hour() <= 23)
FOR 10m
ANNOTATIONS {
summary= "Create devdb backup failed.",
description= "Exit code is not equal to 0. {{ $labels.instance }} .",
}

Andor
16.07.2018
17:29:23
отключи для него автоповтор в алертменеджере да и всё

Boris
16.07.2018
17:31:15

Google

Andor
16.07.2018
17:33:06
ну всегда для таких алертов можно вешать специальный лейбл и уже по лейблу ловить в алертменеджере

Boris
16.07.2018
17:34:08

Terminator
16.07.2018
17:36:33
@inish777 будет жить. Поприветствуем!
@godbless0success будет жить. Поприветствуем!

Boris
16.07.2018
17:43:00
т.е , не только по лейблам

Andor
16.07.2018
17:43:27
job это тоже лейбл

Boris
16.07.2018
17:44:05
понял, хорошо. благодарю

Terminator
16.07.2018
17:53:52
@ermilov1988 будет жить. Поприветствуем!
Oleg будет жить. Поприветствуем!
@saladar будет жить. Поприветствуем!

Alexander
16.07.2018
18:52:47
Я думаю, здесь несколько другое имеется ввиду (что они будут окрашены в зависимости от настроек цвета и трешхолдов)

Terminator
16.07.2018
18:53:03
@abcooper будет жить. Поприветствуем!

Google

Alexander
16.07.2018
18:55:38

Vladislav
16.07.2018
19:04:28

Alexander
16.07.2018
19:08:19
Ну такое...
https://github.com/grafana/grafana/issues/8679

Sergey
16.07.2018
21:00:07
Всем доброго вечера!
Возможно, кто-нибудь сталкивался с такой проблемой и может подсказать.
Alertmanager 0.15.0, настроены уведомления в slack. При создании вебхука был указан дефолтный канал, который переопределен в slack_configs. Если включить send_resolved: true, тогда уведомления приходят в дефолтный и переопределенный канал. Отключаешь send_resolved: true - уведомления начинают приходить как и положено в переопределенный канал.

Andor
16.07.2018
21:06:56
прикольно, похоже на баг
посмотри в трекере

Sergey
16.07.2018
21:07:25
Я единственное что нашел, что в 15 версии как раз правили в этом направлении
https://github.com/prometheus/alertmanager/pull/1408

Andor
16.07.2018
21:07:51
откати :)

Sergey
16.07.2018
21:15:21
Спасиб)

Andor
16.07.2018
21:17:55
если откат поможет, то пожалуйста напиши им issue

Sergey
16.07.2018
21:18:25
Да, конечно
Хм, а на 14 версии также =)


Andrey Zakharov
17.07.2018
14:29:45
всем привет , подскажите пожалуйста кто федерацию у прометеуса настраивал , я сделал 2 инстанса slave1 и slave2 , перед ними поставил master , в конфигах у мастера указал :
global:
evaluation_interval: 15s
external_labels:
prometheus_location: global1
scrape_interval: 15s
scrape_configs:
- job_name: datacenter_federation
honor_labels: true
metrics_path: /federate
params:
match[]:
- '{__name__=~"^job:.*"}'
# - '{job="prometheus"}'
# - '{__name__=~"job:.*"}'
static_configs:
- targets:
- prometheus-slave1:9090
- prometheus-slave2:9090
как правильно запрашивать метрики с тех слейвов ?
пробовал "up" выдавало только что эти прометеусы доступны
нашёл в документации на https://www.robustperception.io/federation-what-is-it-good-for/ что нужно некие "правила" на slave серверах создавать , вида :
job:node_memory_MemTotal:sum = sum without(instance)(node_memory_MemTotal{job="node"})
но с этими записями они (слейвы) не стартуют
на официальной странице документации достаточно поверхностно описано , не смог найти примеров конфигов для "слейвов"


Alexey
17.07.2018
14:32:38

Andor
17.07.2018
14:33:08
по ссылке устаревший формат правил аггрегации
почитай доку про новый формат, который начиная с 2.0 используется
yaml-based

Google

Andrey Zakharov
17.07.2018
14:33:31
ок понял , благодарю

Andor
17.07.2018
14:34:22
можно и без правил аггрегации

Andrey Zakharov
17.07.2018
14:35:12
вот например как выглядит мой конфиг у слейва1 :
global:
evaluation_interval: 15s
external_labels:
prometheus_location: dc1
scrape_interval: 15s
#rule_files:
# - node.rules
scrape_configs:
- job_name: node
scrape_interval: 60s
# metrics_path defaults to '/metrics'
# scheme defaults to 'http'.
static_configs:
- targets: ['10.0.0.2:9100']
labels:
nodename: app1.com
project: someproject
просто я не совсем понял - как на мастере запрашивать эти метрики , я думал что они просто с разными лейблами появятся

Andor
17.07.2018
14:36:02
это не мастер и слейв

Andrey Zakharov
17.07.2018
14:36:12
да , я просто условно так их назвал

Alexey
17.07.2018
14:36:15

Andor
17.07.2018
14:36:22
запрашивать селектором метрик который ты указываешь
match[]:
- '{__name__=~"^job:.*"}'
# - '{job="prometheus"}'
# - '{__name__=~"job:.*"}'

Andrey Zakharov
17.07.2018
14:37:04
вот как раз с селектором не совсем разобрался (наверное надо ещё доку почитать ...)

Andor
17.07.2018
14:37:08
вот это тебе вернёт все метрики которые имеют имя совпадающее с регэкспом ^job:.*

Admin
ERROR: S client not available

Andor
17.07.2018
14:37:21
но у тебя таких нет, потому что они по ссылке создаются правилами аггрегации

Andrey Zakharov
17.07.2018
14:37:39

Alexey
17.07.2018
14:37:47

Andor
17.07.2018
14:38:16
мне пора деньги брать за подсказки по прометею лол

Andrey Zakharov
17.07.2018
14:38:47
тоесть например если я хочу "аггрегировать" метрики например "up"
то в match [] нужно запихнуть чтото вида :
match[]:
- '{__name__=~"^up:.*"}'

Andor
17.07.2018
14:39:15
не
если ты хочешь _собирать_ метрики с именем up

Google

Andor
17.07.2018
14:39:38
то тебе достаточно вписать {__name__="up"}

Andrey Zakharov
17.07.2018
14:39:57
ок понял , спасибо большое, сейчас буду пробовать

Andor
17.07.2018
14:40:04
и это будет работать без каких-либо дополнительных правил аггрегации

Andrey Zakharov
17.07.2018
14:41:05
получилось , спасибо
правильно ли я понимаю - что для того чтобы вобще всё забирать нужно использовать конструкцию вида :
match[]:
- '{__name__=~".*"}'

Andor
17.07.2018
14:46:40
Ага
Но лучше агрегировать и собирать агрегирваные

Andrey Zakharov
17.07.2018
14:51:51
```
match[]:
- '{__name__=~".+"}'
```
вот так вот надо было )
разобрался , спасибо большое

Andor
17.07.2018
14:53:17
Да, точно

GithubReleases
17.07.2018
16:22:54
yandex/ClickHouse was tagged: v1.1.54394-stable
Link: https://github.com/yandex/ClickHouse/releases/tag/v1.1.54394-stable
Release notes:
Auto version update to [54394]

George
17.07.2018
17:32:39
Я за телеграф топлю как за самое универсальное средство передачи метрик

Andor
17.07.2018
17:33:14
и самое проблемное

George
17.07.2018
17:33:26
Ну, расскажи чем?
Он тупой как бревно
И написан на гошке - что еще нужно?

Andor
17.07.2018
17:33:52
у нас он регулярно зависал

George
17.07.2018
17:34:10
Ну, расскажи в каком ключе