@metrics_ru

Страница 538 из 681
Bogdan (SirEdvin)
20.05.2018
10:34:08
А по аптайму? В логах не очень может быть видно

Andrey Zakharov
20.05.2018
10:34:17
Да , возможно действительно стоит пересмотреть подход
Просто он прям ровно через 5 суток повторяется

Попробую обновится , и там посмотрим , спасибо

Google
Bogdan (SirEdvin)
20.05.2018
10:35:28
Тогда кроме ресолва идей нет. Если что, то ресолв по умолчанию не приходит

Fd
20.05.2018
19:13:02
люди, а кто-нибудь видел вменяемую реализацию а-ля lxc_sd_config для prometheus?

Andor
20.05.2018
20:45:37
как ты себе это представляешь?

lxc не предоставляет апи для дискавери

но ты можешь сделать руками через file_sd_configs

Fd
20.05.2018
20:46:08
ну вот я сейчас прихожу к мысли, что придётся костыли через file_sd, да

а хотелось бы не костыли, ведь lxd полноценный есть.

там вон пишут: https://prometheus.io/docs/operating/integrations/#file-service-discovery

мол, делайте через костыли с file_sd, если нет нативной интеграции.

Andor
20.05.2018
20:47:20
и что тебе lxd выдаст?

адреса всех хостов какие тебе нужны?

хотя если демоны между друг другом соединены, то выдаст

Fd
20.05.2018
20:48:10
выдаст, конечно.

Google
Andor
20.05.2018
21:18:23
ну тогда напиши фич-реквест

Fd
20.05.2018
21:36:38
Возможно, да.

Или сразу pull, насколько времени найдется

Artem
21.05.2018
07:38:02
парни, как такое может быть? добавил в prometheus новую жертву (на node_exporter’е) - в самом прометеусе вижу метрики, и curl’ом тоже, а в графане не вижу, при всем этом data source тот же и "ничего не менялось"?

Andor
21.05.2018
07:38:37
значит либо датасорс не тот, либо временной интервал не тот либо запрос не тот

Artem
21.05.2018
07:40:37
тот датасурс, он единственный)

Bogdan (SirEdvin)
21.05.2018
07:54:38
А не видишь где? В переменной шаблона?

У них надо логику обновления ставить, может в этом проблема?

Andrey Zakharov
21.05.2018
07:55:24
если есть переменные , советую попробовать просто график без переменных сделать (за последние минут 15) и там просто метрику добавить без указания лейблов

Bogdan (SirEdvin)
21.05.2018
08:03:16
просто графиками работает, а в переменной не видит… бред какой-то
У переменной есть поле Refresh, оно отвечает за то, как часто перечитываются переменные. По умолчанию, вроде, никогда

Artem
21.05.2018
08:03:29
о_0

Andor
21.05.2018
08:03:53
F5

Artem
21.05.2018
08:04:13
on dashboard load (стоит такое), есть еще Never и On time range change

Bogdan (SirEdvin)
21.05.2018
08:05:00
Значит F5 должен помочь. Если нет, может быть еще такяа фигня, что запрос почему-то отсекает значение, можно тогда запрос продебажить

Bogdan (SirEdvin)
21.05.2018
08:05:21
Всмысле, разобрать, глянуть на то, что выдает пром и то, что графана внизу, в поле редактирования запроса.

Artem
21.05.2018
08:05:26
ну вот не помогает refresh...

Andor
21.05.2018
08:05:48
ты выполни в прометее тот же запрос что графана выполняет сначала

Google
Artem
21.05.2018
08:06:51
который в темплейте, имеешь в виду?

Andor
21.05.2018
08:07:14
нет, который тебе график рисует

Andrey Zakharov
21.05.2018
08:08:24
просто графиками работает, а в переменной не видит… бред какой-то
советую тогда использовать для дебага если в лейблах переменную указывать соответвие регулярке , наприм metric_name{my_custom_label=~"$grafana_variable"}

Artem
21.05.2018
08:09:09


ну вот взять например

странно, оно уже и тут не видит instance… если вручную прописать

Andrey Zakharov
21.05.2018
08:09:45
попробуй без агрегаций

просто метрика для начала , с переменной в лейбле

Andor
21.05.2018
08:10:03
нажми кнопку "перейти в прометей"

Andrey Zakharov
21.05.2018
08:10:32
node_cpu{instance=~"$node"}

Artem
21.05.2018
08:10:47
да, нет его

count(node_cpu{instance=~".......", mode="system"})

Andor
21.05.2018
08:10:59
ну значит его нет в прометее

Artem
21.05.2018
08:11:26
node_cpu нет в centos 6? :D

Andor
21.05.2018
08:11:44
centos6?

Artem
21.05.2018
08:12:02
centos 6 -> node_exporter 0.16.0 -> prometheus

Deep Sea
21.05.2018
08:18:19
centos 6 -> node_exporter 0.16.0 -> prometheus
читайте чейнжлог Many metrics have been renamed/modified to include base units, for example node_cpu is now node_cpu_seconds_total.

Artem
21.05.2018
08:19:19
благодарю)

понадобавляли _bytes ?

Deep Sea
21.05.2018
08:29:53
не обновляйтесь без чтения чейнжлогов :)

Google
Psy
21.05.2018
10:50:30
почему прометеус может так отображать метрику?



таже самая метрика через графану выглядит норм



опрос стоит раз в секунду

Bogdan (SirEdvin)
21.05.2018
10:54:12
В графане может быть включено сглаживание

Дмитрий
21.05.2018
10:56:30
Колеги, требуется помощ. Использую icinga2 и nscp для снятия данных с win hosts. Интересует вопрос с сheck_uptime ( https://docs.nsclient.org/reference/windows/CheckSystem/#check_uptime) в частности не могу понять как изменить дефолтные алерты warning uptime < 2d critical uptime < 1d

Psy
21.05.2018
10:56:35
Похоже

Andor
21.05.2018
10:56:36
это у тебя в графане выставлено "null as connected" прост

Psy
21.05.2018
11:24:45
Andor
21.05.2018
11:25:39
хз, у меня старая графана

у меня называется "Null Value" и там дропдаун со значением "null"

и варианты "connected" и "null as zero"

Psy
21.05.2018
11:26:18
оно

но что-то он не порвал мне график

хотя если Bars включить, более наглядно разрывы видно

Alexey
21.05.2018
11:38:21
хотя если Bars включить, более наглядно разрывы видно
какой смысл собирать посекундно и отображать 14 часов?

Psy
21.05.2018
11:38:59
Ну как правило час отображаю

И ли 30 мин

Alexey
21.05.2018
11:39:11
у вас экран 4К?

Google
Psy
21.05.2018
11:39:43
Нет. Я зумирую)

Alexey
21.05.2018
11:41:28
3600 точек не влезет на экран, при посекундных данных более 20 минут не особо имеет смысл отображать. Графана ставит maxDataPoints в запросе и бэкенд проведет аггрегацию (по умолчанию average) превращая ваши данные в кашу

Psy
21.05.2018
11:42:22
Ну да не суть, просто не замечал что у меня данные не собираются пока не полез проверять

Sergey
21.05.2018
11:47:39
для таких рваных данных можно оставить connected, но включить точки (размер только поменьше поставить)

Psy
21.05.2018
11:48:53
В нормальном режиме они не рваные. Оказалось клиент тупил

Sergey
21.05.2018
11:48:58
вот интересно когда в телеге запилят треды по аналогии со слаком, а то мозг ломается когда 3-4 разговора по разным темам одним потоком идут

ну вот у меня все быстрые метрики коннектед, но хоть в 1 месте на дашбордах хоть одна с мааахонькими точками - чтобы если что быстро понимать что начались "разрывы", но при этом не смущать пользователей дырками в графиках

Psy
21.05.2018
11:51:47
Кстати, для быстрых метрик на сколько правильней не опрашивать, а пушить?

Sergey
21.05.2018
11:52:43
у меня не пром... пушить или пуллить это как тупоконечники и остроконечники

и там и там можно ловить грабли или сделать относительно норм

ну и сильно зависит от внутреннего ТЗ

Sergey
21.05.2018
12:20:58
ну мало кто из пушеров умеет в перепосылку и проверку что оно долетело, а без этого + пуша только в том что проще сетевые дырки до системы записи метрик делать

у меня вот одним из тихих условий в ТЗ было что мы низафто и никада не должны потерять метрику (а то потом непонятно куда смотреть) в итоге по этой + еще ряду причин я воткнул в стек кафку

Pablo
21.05.2018
12:22:45
Кафка это пуш же?

Страница 538 из 681