Bogdan (SirEdvin)
20.05.2018
10:34:08
А по аптайму? В логах не очень может быть видно
Andrey Zakharov
20.05.2018
10:34:17
Попробую обновится , и там посмотрим , спасибо
Google
Bogdan (SirEdvin)
20.05.2018
10:35:28
Тогда кроме ресолва идей нет. Если что, то ресолв по умолчанию не приходит
Fd
20.05.2018
19:13:02
люди, а кто-нибудь видел вменяемую реализацию а-ля lxc_sd_config для prometheus?
Andor
20.05.2018
20:45:37
как ты себе это представляешь?
lxc не предоставляет апи для дискавери
но ты можешь сделать руками через file_sd_configs
Fd
20.05.2018
20:46:08
ну вот я сейчас прихожу к мысли, что придётся костыли через file_sd, да
а хотелось бы не костыли, ведь lxd полноценный есть.
там вон пишут: https://prometheus.io/docs/operating/integrations/#file-service-discovery
мол, делайте через костыли с file_sd, если нет нативной интеграции.
Andor
20.05.2018
20:47:20
и что тебе lxd выдаст?
адреса всех хостов какие тебе нужны?
хотя если демоны между друг другом соединены, то выдаст
Fd
20.05.2018
20:48:10
выдаст, конечно.
Google
Andor
20.05.2018
21:18:23
ну тогда напиши фич-реквест
Fd
20.05.2018
21:36:38
Возможно, да.
Или сразу pull, насколько времени найдется
Artem
21.05.2018
07:38:02
парни, как такое может быть? добавил в prometheus новую жертву (на node_exporter’е) - в самом прометеусе вижу метрики, и curl’ом тоже, а в графане не вижу, при всем этом data source тот же и "ничего не менялось"?
Andor
21.05.2018
07:38:37
значит либо датасорс не тот, либо временной интервал не тот либо запрос не тот
Artem
21.05.2018
07:40:37
тот датасурс, он единственный)
Bogdan (SirEdvin)
21.05.2018
07:54:38
А не видишь где? В переменной шаблона?
У них надо логику обновления ставить, может в этом проблема?
Andrey Zakharov
21.05.2018
07:55:24
если есть переменные , советую попробовать просто график без переменных сделать (за последние минут 15) и там просто метрику добавить без указания лейблов
Artem
21.05.2018
08:02:01
Bogdan (SirEdvin)
21.05.2018
08:03:16
Artem
21.05.2018
08:03:29
о_0
Andor
21.05.2018
08:03:53
F5
Artem
21.05.2018
08:04:13
on dashboard load (стоит такое), есть еще Never и On time range change
Bogdan (SirEdvin)
21.05.2018
08:05:00
Значит F5 должен помочь. Если нет, может быть еще такяа фигня, что запрос почему-то отсекает значение, можно тогда запрос продебажить
Andor
21.05.2018
08:05:18
Bogdan (SirEdvin)
21.05.2018
08:05:21
Всмысле, разобрать, глянуть на то, что выдает пром и то, что графана внизу, в поле редактирования запроса.
Artem
21.05.2018
08:05:26
ну вот не помогает refresh...
Andor
21.05.2018
08:05:48
ты выполни в прометее тот же запрос что графана выполняет сначала
Google
Artem
21.05.2018
08:06:51
который в темплейте, имеешь в виду?
Andor
21.05.2018
08:07:14
нет, который тебе график рисует
Andrey Zakharov
21.05.2018
08:08:24
Artem
21.05.2018
08:09:09
ну вот взять например
странно, оно уже и тут не видит instance… если вручную прописать
Andrey Zakharov
21.05.2018
08:09:45
попробуй без агрегаций
просто метрика для начала , с переменной в лейбле
Andor
21.05.2018
08:10:03
нажми кнопку "перейти в прометей"
Andrey Zakharov
21.05.2018
08:10:32
node_cpu{instance=~"$node"}
Artem
21.05.2018
08:10:47
да, нет его
count(node_cpu{instance=~".......", mode="system"})
Andor
21.05.2018
08:10:59
ну значит его нет в прометее
Artem
21.05.2018
08:11:26
node_cpu нет в centos 6? :D
Andor
21.05.2018
08:11:44
centos6?
Artem
21.05.2018
08:12:02
centos 6 -> node_exporter 0.16.0 -> prometheus
Deep Sea
21.05.2018
08:18:19
Artem
21.05.2018
08:19:19
благодарю)
понадобавляли _bytes ?
Deep Sea
21.05.2018
08:29:53
не обновляйтесь без чтения чейнжлогов :)
Google
Psy
21.05.2018
10:50:30
почему прометеус может так отображать метрику?
таже самая метрика через графану выглядит норм
опрос стоит раз в секунду
Bogdan (SirEdvin)
21.05.2018
10:54:12
В графане может быть включено сглаживание
Дмитрий
21.05.2018
10:56:30
Колеги, требуется помощ.
Использую icinga2 и nscp для снятия данных с win hosts.
Интересует вопрос с сheck_uptime ( https://docs.nsclient.org/reference/windows/CheckSystem/#check_uptime)
в частности не могу понять как изменить дефолтные алерты
warning uptime < 2d
critical uptime < 1d
Psy
21.05.2018
10:56:35
Похоже
Andor
21.05.2018
10:56:36
это у тебя в графане выставлено "null as connected" прост
Psy
21.05.2018
11:24:45
Andor
21.05.2018
11:25:39
хз, у меня старая графана
у меня называется "Null Value" и там дропдаун со значением "null"
и варианты "connected" и "null as zero"
Psy
21.05.2018
11:26:18
оно
но что-то он не порвал мне график
хотя если Bars включить, более наглядно разрывы видно
Alexey
21.05.2018
11:38:21
Psy
21.05.2018
11:38:59
Ну как правило час отображаю
И ли 30 мин
Alexey
21.05.2018
11:39:11
у вас экран 4К?
Google
Psy
21.05.2018
11:39:43
Нет. Я зумирую)
Alexey
21.05.2018
11:41:28
3600 точек не влезет на экран, при посекундных данных более 20 минут не особо имеет смысл отображать. Графана ставит maxDataPoints в запросе и бэкенд проведет аггрегацию (по умолчанию average) превращая ваши данные в кашу
Psy
21.05.2018
11:42:22
Ну да не суть, просто не замечал что у меня данные не собираются пока не полез проверять
Sergey
21.05.2018
11:47:39
для таких рваных данных можно оставить connected, но включить точки (размер только поменьше поставить)
Psy
21.05.2018
11:48:53
В нормальном режиме они не рваные. Оказалось клиент тупил
Sergey
21.05.2018
11:48:58
вот интересно когда в телеге запилят треды по аналогии со слаком, а то мозг ломается когда 3-4 разговора по разным темам одним потоком идут
ну вот у меня все быстрые метрики коннектед, но хоть в 1 месте на дашбордах хоть одна с мааахонькими точками - чтобы если что быстро понимать что начались "разрывы", но при этом не смущать пользователей дырками в графиках
Psy
21.05.2018
11:51:47
Кстати, для быстрых метрик на сколько правильней не опрашивать, а пушить?
Sergey
21.05.2018
11:52:43
у меня не пром... пушить или пуллить это как тупоконечники и остроконечники
и там и там можно ловить грабли или сделать относительно норм
ну и сильно зависит от внутреннего ТЗ
Pablo
21.05.2018
12:19:50
Sergey
21.05.2018
12:20:58
ну мало кто из пушеров умеет в перепосылку и проверку что оно долетело, а без этого + пуша только в том что проще сетевые дырки до системы записи метрик делать
у меня вот одним из тихих условий в ТЗ было что мы низафто и никада не должны потерять метрику (а то потом непонятно куда смотреть) в итоге по этой + еще ряду причин я воткнул в стек кафку
Pablo
21.05.2018
12:22:45
Кафка это пуш же?