
Katulos
05.07.2018
13:55:35
Ручная проверка заработала
Но, я так понял, сам прометеус туда с моим конфигом не ходит

Sergey
05.07.2018
13:59:07
на самом деле я не знаю, можно ли file_sd_configs юзать для экспортера
в доке статичный конфиг указан

Google

Katulos
05.07.2018
14:00:40
Статичный конфиг устанешь править

V
05.07.2018
14:01:11
графики "клонированы" настройки граифков идентичны, скорее всего на ноде надо смотреть, но н езнаю что и где

Andor
05.07.2018
14:03:45
потому что у тебя стоит автомасштаб
в какой влезает такой и ставится

V
05.07.2018
14:26:06
этот график - отображает IO диска, так вот я захожу на 1 и начинаю поиск по дисковой системе find . -name *
и оно не поднимается по разному

Dmitry
05.07.2018
15:55:49
у кого прометеем куб мониторится, подскажите - пром способен увидеть какие-то аннотации кроме "своих"? потому что я добавил в деплоймент аннотацию, а она не дисковерится в "before relabeling"

Andor
05.07.2018
15:58:18
каких "своих"?

Dmitry
05.07.2018
16:08:48
каких "своих"?
prometheus.io/scrape
prometheus.io/path
prometheus.io/port

Andor
05.07.2018
16:10:15
он видит такие какие у тебя в конфиге указаны
можешь открыть /targets в гуе прометея?

Google

Dmitry
05.07.2018
16:32:27
В гуях как раз

Andor
05.07.2018
16:35:29
он там "металейблы" не показывает

Dmitry
05.07.2018
16:50:11
Т.е. ты думаешь что она есть, просто не показывает?

Эдуард
05.07.2018
17:43:43
Товарищи
Как прометею БД чистить?

Dmitry
05.07.2018
18:18:23

Alexey
05.07.2018
18:34:03
Сама почистится, если ретеншн не запредельный)

Эдуард
05.07.2018
19:10:45

Zhenia
06.07.2018
06:38:48

V
06.07.2018
06:44:27
подскажите пжс чем мне заменить 4 в запросе?
sum(node_cpu{mode="user", instance="10.0.2.250:9100"}) by (instance) / 4
у меня сейчас 4 едра, но если будет больше то будет опа

Andor
06.07.2018
06:46:23
у тебя есть метрика про количество ядер

V
06.07.2018
06:46:38
да?
sum(node_cpu{mode="system", instance="10.0.2.250:9100"}) by (instance) / machine_cpu_cores{instance="10.0.2.250:10250"}
вообще все пропало, не строится график
если заменить на 4 товсе ок

Andor
06.07.2018
06:52:25
у тебя справа и слева от / должны быть одинаковые лейблы
идентичный набор лейблов

Google

V
06.07.2018
06:53:09

Andor
06.07.2018
06:53:30
mode="system" - лейбл со значением
метки у метрик

V
06.07.2018
06:54:17
ааа
но справа у меня в метрике нет такого лейбла

Andor
06.07.2018
06:54:41
если ты справа добавишь sum(...) by (instance) то всё сработает
знаю, что неочевидно
у тебя слева делается sum(...) by (instance) и остаётся только лейбл instance
справа надо сделать так же

V
06.07.2018
06:56:40

Andor
06.07.2018
06:57:05
нет
у тебя instance разные

Andor
06.07.2018
06:57:16
разное значение имеют

V
06.07.2018
06:58:45
мне кажется вообще я делаю что-то не то.
мне надо сделать графики cpu - system, user для конкретной ноды

Andor
06.07.2018
07:00:03
а разве node_exporter не возвращает кол-во ядер?

V
06.07.2018
07:00:15
там есть node_cpu, он возвращает метрики по всем ядрам

Andor
06.07.2018
07:00:37
а разбивка по ядрам есть?

V
06.07.2018
07:00:44
но как взять количество непонятно

Google

V
06.07.2018
07:00:53

Andor
06.07.2018
07:00:55
посчитать количество метрик?
count(...) by (instance)

V
06.07.2018
07:01:18
воооо
сек
sum(node_cpu{instance="10.0.2.250:9100", mode="system"}) / count(node_cpu{instance="10.0.2.250:9100"}) by (node_cpu)

Admin
ERROR: S client not available

V
06.07.2018
07:03:59
вроде так
по крайней мере оно делает то же что и 4

Andor
06.07.2018
07:04:24
by (node_cpu)
вообще убери тогда
если ты в обоих вражениях вставляешь instance, то тебе by(..) не надо ни там ни там

V
06.07.2018
07:04:54

Alexander
06.07.2018
07:05:31
Не проще avg by mode или как-то так

Andor
06.07.2018
07:05:33
а если тебе в алерте например надо будет считать для вообще всех нод, то и справа и слева сделай by (instance)

V
06.07.2018
07:07:49

Andor
06.07.2018
07:08:13
никак, у тебя запрос возвращает 0 лейблов

V
06.07.2018
07:08:16
впринципе можно и так упростить
avg(node_cpu{instance="10.0.2.250:9100", mode="idle"})

Google

Alexey
06.07.2018
07:15:57
Господа, никто не знает про какие-либо неявные ограничения у influx_exporter, пропадает гдето треть точек из батча в 16к штук.

Andor
06.07.2018
07:16:23
а что в логе?

Alexey
06.07.2018
07:20:51
Гробовая тишина

V
06.07.2018
07:21:32
Гробовая тишина
либо эти точки не записываются, либо они не создаются, либо не передаются надо везде прочекать

pl
06.07.2018
07:28:44
Возьмите уже https://grafana.com/dashboards/405

Alexander
06.07.2018
07:34:50
Потому что метрика типа counter, надо сверху делать rate()

V
06.07.2018
07:36:10
нашел классную статейку, всем рекомендую кто настраивать будет CPU usage
https://letsclearitup.com.ua/debian/prometheus-razbiraemsya-s-cpu-usage.html

Katulos
06.07.2018
07:44:33
В стандартной поставке графаны есть дашборд Grafana metric
Почти везде там есть job="grafana"

Alexander
06.07.2018
07:44:50
Что только люди не придумают, лишь бы не читать документацию.

Katulos
06.07.2018
07:45:08
Но я не могу нагуглить примеров этого job для прометеуса
Есть у кого этот кусок конфига?

V
06.07.2018
07:45:59

Katulos
06.07.2018
07:46:36
job="grafana" же должен быть описан в конфиге прометеуса?

Alexander
06.07.2018
07:46:38