@metrics_ru

Страница 590 из 681
Terminator
16.07.2018
17:26:56
@ProdElbars будет жить. Поприветствуем!

Boris
16.07.2018
17:28:12
всем привет, кто использует prometheus мониторинг? Подскажите, какой опцией в правилах алертов можно задать единоразовый алерт. а не постоянный? .Т.е чтоб один раз оповещение пришло за сутки и всё. кейс такой. Ночью снимаю бэкап и мониторию его на экзит код, соотвенственно мне не хотелось бы получать алерт ночью, а один раз днем, когда код отличный от нуля.. Т.е алерт может быть до следующего снятия бэкапа правило алерта в данный момент выглядит так ALERT create_devdb_backup_failed IF cb_common_code{instance="<myhostname>:9991",job="devdb_backup"} > 0 and ON() (hour() >= 11 and hour() <= 23) FOR 10m ANNOTATIONS { summary= "Create devdb backup failed.", description= "Exit code is not equal to 0. {{ $labels.instance }} .", }

Andor
16.07.2018
17:29:23
отключи для него автоповтор в алертменеджере да и всё

Boris
16.07.2018
17:31:15
отключи для него автоповтор в алертменеджере да и всё
а что в алертмэнеджер не лазить? такой нет опции? сейчас поищу, конечно, спасибо

Google
Andor
16.07.2018
17:33:06
ну всегда для таких алертов можно вешать специальный лейбл и уже по лейблу ловить в алертменеджере

Terminator
16.07.2018
17:36:33
@inish777 будет жить. Поприветствуем!

@godbless0success будет жить. Поприветствуем!

Boris
16.07.2018
17:43:00
т.е , не только по лейблам

Andor
16.07.2018
17:43:27
job это тоже лейбл

Boris
16.07.2018
17:44:05
понял, хорошо. благодарю

Terminator
16.07.2018
17:53:52
@ermilov1988 будет жить. Поприветствуем!

Oleg будет жить. Поприветствуем!

@saladar будет жить. Поприветствуем!

Alexander
16.07.2018
18:52:47
Я думаю, здесь несколько другое имеется ввиду (что они будут окрашены в зависимости от настроек цвета и трешхолдов)

Terminator
16.07.2018
18:53:03
@abcooper будет жить. Поприветствуем!

Google
Alexander
16.07.2018
18:55:38
почему трешхолд, если трешолд (trashold)?
Зависит от акцента, американское произношение - трэшхолд

Alexander
16.07.2018
19:08:19
Ну такое...
https://github.com/grafana/grafana/issues/8679

Sergey
16.07.2018
21:00:07
Всем доброго вечера! Возможно, кто-нибудь сталкивался с такой проблемой и может подсказать. Alertmanager 0.15.0, настроены уведомления в slack. При создании вебхука был указан дефолтный канал, который переопределен в slack_configs. Если включить send_resolved: true, тогда уведомления приходят в дефолтный и переопределенный канал. Отключаешь send_resolved: true - уведомления начинают приходить как и положено в переопределенный канал.

Andor
16.07.2018
21:06:56
прикольно, похоже на баг

посмотри в трекере

Sergey
16.07.2018
21:07:25
Я единственное что нашел, что в 15 версии как раз правили в этом направлении

https://github.com/prometheus/alertmanager/pull/1408

Andor
16.07.2018
21:07:51
откати :)

Sergey
16.07.2018
21:15:21
Спасиб)

Andor
16.07.2018
21:17:55
если откат поможет, то пожалуйста напиши им issue

Sergey
16.07.2018
21:18:25
Да, конечно

Хм, а на 14 версии также =)

Andrey Zakharov
17.07.2018
14:29:45
всем привет , подскажите пожалуйста кто федерацию у прометеуса настраивал , я сделал 2 инстанса slave1 и slave2 , перед ними поставил master , в конфигах у мастера указал : global: evaluation_interval: 15s external_labels: prometheus_location: global1 scrape_interval: 15s scrape_configs: - job_name: datacenter_federation honor_labels: true metrics_path: /federate params: match[]: - '{__name__=~"^job:.*"}' # - '{job="prometheus"}' # - '{__name__=~"job:.*"}' static_configs: - targets: - prometheus-slave1:9090 - prometheus-slave2:9090 как правильно запрашивать метрики с тех слейвов ? пробовал "up" выдавало только что эти прометеусы доступны

нашёл в документации на https://www.robustperception.io/federation-what-is-it-good-for/ что нужно некие "правила" на slave серверах создавать , вида : job:node_memory_MemTotal:sum = sum without(instance)(node_memory_MemTotal{job="node"}) но с этими записями они (слейвы) не стартуют

на официальной странице документации достаточно поверхностно описано , не смог найти примеров конфигов для "слейвов"

Andor
17.07.2018
14:33:08
по ссылке устаревший формат правил аггрегации

почитай доку про новый формат, который начиная с 2.0 используется

yaml-based

Google
Andrey Zakharov
17.07.2018
14:33:31
ок понял , благодарю

Andor
17.07.2018
14:34:22
можно и без правил аггрегации

Andrey Zakharov
17.07.2018
14:35:12
вот например как выглядит мой конфиг у слейва1 : global: evaluation_interval: 15s external_labels: prometheus_location: dc1 scrape_interval: 15s #rule_files: # - node.rules scrape_configs: - job_name: node scrape_interval: 60s # metrics_path defaults to '/metrics' # scheme defaults to 'http'. static_configs: - targets: ['10.0.0.2:9100'] labels: nodename: app1.com project: someproject

просто я не совсем понял - как на мастере запрашивать эти метрики , я думал что они просто с разными лейблами появятся

Andor
17.07.2018
14:36:02
это не мастер и слейв

Andrey Zakharov
17.07.2018
14:36:12
да , я просто условно так их назвал

Alexey
17.07.2018
14:36:15
по ссылке устаревший формат правил аггрегации
погоди, там у него вроде все правильно. Это синтаксис для федерации, у меня такой же.

Andor
17.07.2018
14:36:22
запрашивать селектором метрик который ты указываешь

match[]: - '{__name__=~"^job:.*"}' # - '{job="prometheus"}' # - '{__name__=~"job:.*"}'

Andrey Zakharov
17.07.2018
14:37:04
вот как раз с селектором не совсем разобрался (наверное надо ещё доку почитать ...)

Andor
17.07.2018
14:37:08
вот это тебе вернёт все метрики которые имеют имя совпадающее с регэкспом ^job:.*

Admin
ERROR: S client not available

Andor
17.07.2018
14:37:21
но у тебя таких нет, потому что они по ссылке создаются правилами аггрегации

Andrey Zakharov
17.07.2018
14:37:39


Alexey
17.07.2018
14:37:47
но у тебя таких нет, потому что они по ссылке создаются правилами аггрегации
ааа да. все заметил. Ухх глазастый. Да я тупо забираю все

Andor
17.07.2018
14:38:16
мне пора деньги брать за подсказки по прометею лол

Andrey Zakharov
17.07.2018
14:38:47
тоесть например если я хочу "аггрегировать" метрики например "up" то в match [] нужно запихнуть чтото вида : match[]: - '{__name__=~"^up:.*"}'

Andor
17.07.2018
14:39:15
не

если ты хочешь _собирать_ метрики с именем up

Google
Andor
17.07.2018
14:39:38
то тебе достаточно вписать {__name__="up"}

Andrey Zakharov
17.07.2018
14:39:57
ок понял , спасибо большое, сейчас буду пробовать

Andor
17.07.2018
14:40:04
и это будет работать без каких-либо дополнительных правил аггрегации

Andrey Zakharov
17.07.2018
14:41:05
получилось , спасибо

правильно ли я понимаю - что для того чтобы вобще всё забирать нужно использовать конструкцию вида : match[]: - '{__name__=~".*"}'

Andor
17.07.2018
14:46:40
Ага

Но лучше агрегировать и собирать агрегирваные

Andrey Zakharov
17.07.2018
14:51:51
``` match[]: - '{__name__=~".+"}' ``` вот так вот надо было ) разобрался , спасибо большое

Andor
17.07.2018
14:53:17
Да, точно

GithubReleases
17.07.2018
16:22:54
yandex/ClickHouse was tagged: v1.1.54394-stable Link: https://github.com/yandex/ClickHouse/releases/tag/v1.1.54394-stable Release notes: Auto version update to [54394]

George
17.07.2018
17:32:39
Я за телеграф топлю как за самое универсальное средство передачи метрик

Andor
17.07.2018
17:33:14
и самое проблемное

George
17.07.2018
17:33:26
Ну, расскажи чем?

Он тупой как бревно

И написан на гошке - что еще нужно?

Andor
17.07.2018
17:33:52
у нас он регулярно зависал

George
17.07.2018
17:34:10
Ну, расскажи в каком ключе

Страница 590 из 681