@metrics_ru

Страница 419 из 681
evix
17.01.2018
08:25:27
11 января

Sergey
17.01.2018
08:59:51
* отрицание * гнев * торг * депрессия * принятие (заббикса)

отделение
17.01.2018
09:03:47
Sergey
17.01.2018
09:03:58
Google
Nklya
17.01.2018
09:05:07
Заббикс зеленый - все ок))

Oleg ?
17.01.2018
09:15:11
Ребят, уже спрашивал, но ответа как такового не услышал есть графана, есть сурс-графит. настроены около 6 графиков, на каждом настроен алерты графановские. на одном из них переодически падает алерт NO DATA. тоесть как будто не получил данных. но при этом остальные графики с того же сурса не ругаются. в чем может быть трабла ?



Pablo
17.01.2018
09:16:06
может что-то типа гонки "получение данных vs проверка алерта" ?

Oleg ?
17.01.2018
09:16:21
вот так примерно это выглядит, тоесть вроде бы данные на серых линиях есть

Pablo
17.01.2018
09:17:28
какое условие алерта

Oleg ?
17.01.2018
09:17:42
тоесть предлагаешь увеличить time range ?

WHEN last () OF query (A, 10s, now) IS ABOVE 150

metaclass
17.01.2018
09:18:36
xxx-109 же вроде выложили давно

terry
17.01.2018
09:19:17
xxx-109 же вроде выложили давно
ну там баг самой убунты был, потому и спрашиваю получилось патч, на баг но сам с багом

Oleg ?
17.01.2018
09:22:05
еще стоит такая штука If no data or all values are null SET STATE TO NO DATA

Pablo
17.01.2018
09:22:13
WHEN last () OF query (A, 10s, now) IS ABOVE 150
ну да, думаю last от 10s дает NoData

Или range увеличить или и last заменить на avg

Google
Pablo
17.01.2018
09:22:45
частота сбора в графит тоже 10с?

Oleg ?
17.01.2018
09:23:05
вот тут не скажу, надо у разрабов уточнить

как часто пулят в графит

Pablo
17.01.2018
09:23:17
почему в алерте тогда 10с стоит?

Oleg ?
17.01.2018
09:23:56
ты загнал меня в угол)))

Pablo
17.01.2018
09:24:02
вообще там вроде можно на alerting логи включить вербозные и типа все понятно должно стать

M
17.01.2018
09:47:31
Ребята подскажите, вот у меня прлметеус проверяет контейнеры, и как должно выглядит правило, expr, которое алертит только в случае если метрика исчезла

ну или какой способ следить за контейнерами?

а то я запутался, Тк когда контейнер падает исчезает и метрика

Admin
ERROR: S client not available

M
17.01.2018
09:49:57
и получается и уведомления нет

Bogdan (SirEdvin)
17.01.2018
10:11:12
Можно написать сервис чеки, например, при помощи consul

Или же написать кастомный экспортер (или взять мой на python :) ), который будет давать в метриках еще статус контейнера.

M
17.01.2018
10:28:47
я с консул ещё не работал, он может как то чекать контейнеры?

Bogdan (SirEdvin)
17.01.2018
10:39:39
это как?
https://www.consul.io/intro/getting-started/checks.html

А потом с него можно собирать результаты через consul_exporter

Andor
17.01.2018
11:03:35
а то я запутался, Тк когда контейнер падает исчезает и метрика
ты можешь проверять исчезание метрики, например

M
17.01.2018
11:04:25
ты можешь проверять исчезание метрики, например
не особо получается, это надо её как-то сохранить или записать в alert а контейнеров сотни

Google
Evgeny
17.01.2018
12:21:41
В графане можно добавить на график больше 26 метрик, но они будут уже без букв, но на графике значения будут - вопрос а как на эти безымянные метрики теперь сослаться в выражении divideSeries например ?



Страница 419 из 681