@metrics_ru

« Назад

Страница 590 из 681

Далее »

Terminator

16.07.2018
17:26:56

@ProdElbars будет жить. Поприветствуем!

Boris

16.07.2018
17:28:12

всем привет, кто использует prometheus мониторинг? Подскажите, какой опцией в правилах алертов можно задать единоразовый алерт. а не постоянный? .Т.е чтоб один раз оповещение пришло за сутки и всё. кейс такой. Ночью снимаю бэкап и мониторию его на экзит код, соотвенственно мне не хотелось бы получать алерт ночью, а один раз днем, когда код отличный от нуля.. Т.е алерт может быть до следующего снятия бэкапа правило алерта в данный момент выглядит так ALERT create_devdb_backup_failed IF cb_common_code{instance="<myhostname>:9991",job="devdb_backup"} > 0 and ON() (hour() >= 11 and hour() <= 23) FOR 10m ANNOTATIONS { summary= "Create devdb backup failed.", description= "Exit code is not equal to 0. {{ $labels.instance }} .", }

Andor

16.07.2018
17:29:23

отключи для него автоповтор в алертменеджере да и всё

Boris

16.07.2018
17:31:15

отключи для него автоповтор в алертменеджере да и всё

а что в алертмэнеджер не лазить? такой нет опции? сейчас поищу, конечно, спасибо

Google

Andor

16.07.2018
17:33:06

ну всегда для таких алертов можно вешать специальный лейбл и уже по лейблу ловить в алертменеджере

Boris

16.07.2018
17:34:08

ну всегда для таких алертов можно вешать специальный лейбл и уже по лейблу ловить в алертменеджере

понял, благодарю за ответ

Terminator

16.07.2018
17:36:33

@inish777 будет жить. Поприветствуем!

@godbless0success будет жить. Поприветствуем!

Boris

16.07.2018
17:43:00

ну всегда для таких алертов можно вешать специальный лейбл и уже по лейблу ловить в алертменеджере

а по job , так понимаю, тоже можно отключить репит

т.е , не только по лейблам

Andor

16.07.2018
17:43:27

job это тоже лейбл

Boris

16.07.2018
17:44:05

понял, хорошо. благодарю

Terminator

16.07.2018
17:53:52

@ermilov1988 будет жить. Поприветствуем!

Oleg будет жить. Поприветствуем!

@saladar будет жить. Поприветствуем!

Alexander

16.07.2018
18:52:47

Я думаю, здесь несколько другое имеется ввиду (что они будут окрашены в зависимости от настроек цвета и трешхолдов)

Terminator

16.07.2018
18:53:03

@abcooper будет жить. Поприветствуем!

Google

Alexander

16.07.2018
18:55:38

почему трешхолд, если трешолд (trashold)?

Зависит от акцента, американское произношение - трэшхолд

Vladislav

16.07.2018
19:04:28

Я думаю, здесь несколько другое имеется ввиду (что они будут окрашены в зависимости от настроек цвета и трешхолдов)

Ну такое...

Alexander

16.07.2018
19:08:19

Ну такое...

https://github.com/grafana/grafana/issues/8679

Sergey

16.07.2018
21:00:07

Всем доброго вечера! Возможно, кто-нибудь сталкивался с такой проблемой и может подсказать. Alertmanager 0.15.0, настроены уведомления в slack. При создании вебхука был указан дефолтный канал, который переопределен в slack_configs. Если включить send_resolved: true, тогда уведомления приходят в дефолтный и переопределенный канал. Отключаешь send_resolved: true - уведомления начинают приходить как и положено в переопределенный канал.

Andor

16.07.2018
21:06:56

прикольно, похоже на баг

посмотри в трекере

Sergey

16.07.2018
21:07:25

Я единственное что нашел, что в 15 версии как раз правили в этом направлении

https://github.com/prometheus/alertmanager/pull/1408

Andor

16.07.2018
21:07:51

откати :)

Sergey

16.07.2018
21:15:21

Спасиб)

Andor

16.07.2018
21:17:55

если откат поможет, то пожалуйста напиши им issue

Sergey

16.07.2018
21:18:25

Да, конечно

Хм, а на 14 версии также =)

Andrey Zakharov

17.07.2018
14:29:45

всем привет , подскажите пожалуйста кто федерацию у прометеуса настраивал , я сделал 2 инстанса slave1 и slave2 , перед ними поставил master , в конфигах у мастера указал : global: evaluation_interval: 15s external_labels: prometheus_location: global1 scrape_interval: 15s scrape_configs: - job_name: datacenter_federation honor_labels: true metrics_path: /federate params: match[]: - '{__name__=~"^job:.*"}' # - '{job="prometheus"}' # - '{__name__=~"job:.*"}' static_configs: - targets: - prometheus-slave1:9090 - prometheus-slave2:9090 как правильно запрашивать метрики с тех слейвов ? пробовал "up" выдавало только что эти прометеусы доступны

нашёл в документации на https://www.robustperception.io/federation-what-is-it-good-for/ что нужно некие "правила" на slave серверах создавать , вида : job:node_memory_MemTotal:sum = sum without(instance)(node_memory_MemTotal{job="node"}) но с этими записями они (слейвы) не стартуют

на официальной странице документации достаточно поверхностно описано , не смог найти примеров конфигов для "слейвов"

Alexey

17.07.2018
14:32:38

нашёл в документации на https://www.robustperception.io/federation-what-is-it-good-for/ что нужно некие "правила" на slave серверах создавать , вида : job:node_memory_MemTotal:sum = sum without(instance)(node_memory_MemTotal{job="node"}) но с этими записями они (слейвы) не стартуют

на «коллекторах» просто делаешь сбор метрик, на «мастер» создаешь правило федерации

Andor

17.07.2018
14:33:08

по ссылке устаревший формат правил аггрегации

почитай доку про новый формат, который начиная с 2.0 используется

yaml-based

Google

Andrey Zakharov

17.07.2018
14:33:31

ок понял , благодарю

на «коллекторах» просто делаешь сбор метрик, на «мастер» создаешь правило федерации

тоесть "правила" создавать не нужно ?

Andor

17.07.2018
14:34:22

можно и без правил аггрегации

Andrey Zakharov

17.07.2018
14:35:12

вот например как выглядит мой конфиг у слейва1 : global: evaluation_interval: 15s external_labels: prometheus_location: dc1 scrape_interval: 15s #rule_files: # - node.rules scrape_configs: - job_name: node scrape_interval: 60s # metrics_path defaults to '/metrics' # scheme defaults to 'http'. static_configs: - targets: ['10.0.0.2:9100'] labels: nodename: app1.com project: someproject

просто я не совсем понял - как на мастере запрашивать эти метрики , я думал что они просто с разными лейблами появятся

Andor

17.07.2018
14:36:02

это не мастер и слейв

Andrey Zakharov

17.07.2018
14:36:12

да , я просто условно так их назвал

Alexey

17.07.2018
14:36:15

по ссылке устаревший формат правил аггрегации

погоди, там у него вроде все правильно. Это синтаксис для федерации, у меня такой же.

Andor

17.07.2018
14:36:22

запрашивать селектором метрик который ты указываешь

match[]: - '{__name__=~"^job:.*"}' # - '{job="prometheus"}' # - '{__name__=~"job:.*"}'

Andrey Zakharov

17.07.2018
14:37:04

вот как раз с селектором не совсем разобрался (наверное надо ещё доку почитать ...)

Andor

17.07.2018
14:37:08

вот это тебе вернёт все метрики которые имеют имя совпадающее с регэкспом ^job:.*

Admin

ERROR: S client not available

Andor

17.07.2018
14:37:21

но у тебя таких нет, потому что они по ссылке создаются правилами аггрегации

Andrey Zakharov

17.07.2018
14:37:39

Alexey

17.07.2018
14:37:47

но у тебя таких нет, потому что они по ссылке создаются правилами аггрегации

ааа да. все заметил. Ухх глазастый. Да я тупо забираю все

Andor

17.07.2018
14:38:16

мне пора деньги брать за подсказки по прометею лол

Andrey Zakharov

17.07.2018
14:38:47

тоесть например если я хочу "аггрегировать" метрики например "up" то в match [] нужно запихнуть чтото вида : match[]: - '{__name__=~"^up:.*"}'

Andor

17.07.2018
14:39:15

не

если ты хочешь _собирать_ метрики с именем up

Google

Andor

17.07.2018
14:39:38

то тебе достаточно вписать {__name__="up"}

Andrey Zakharov

17.07.2018
14:39:57

ок понял , спасибо большое, сейчас буду пробовать

Andor

17.07.2018
14:40:04

и это будет работать без каких-либо дополнительных правил аггрегации

Andrey Zakharov

17.07.2018
14:41:05

получилось , спасибо

правильно ли я понимаю - что для того чтобы вобще всё забирать нужно использовать конструкцию вида : match[]: - '{__name__=~".*"}'

Andor

17.07.2018
14:46:40

Ага

Но лучше агрегировать и собирать агрегирваные

Andrey Zakharov

17.07.2018
14:51:51

``` match[]: - '{__name__=~".+"}' ``` вот так вот надо было ) разобрался , спасибо большое

Andor

17.07.2018
14:53:17

Да, точно

GithubReleases

17.07.2018
16:22:54

yandex/ClickHouse was tagged: v1.1.54394-stable Link: https://github.com/yandex/ClickHouse/releases/tag/v1.1.54394-stable Release notes: Auto version update to [54394]

George