
Karey
24.11.2017
21:22:59
А порты случайные устанавливаются сервисами?

Zlokot
24.11.2017
21:23:15
{
"targets": ["xx.xx.xx.xx:9100","xx.xx.xx.xx:8888"],
"labels": {
"job": "node1_node",
"instance": "node1:9100"
}
},
у каждого сервиса, что работает в контейнере свой статический порт.
"instance": "node1:9100"
то есть в дашборде я вижу список этих инстансов

Google

Zlokot
24.11.2017
21:24:44
9100 - это node exporter
8888 это cadvisor
таким образом пром "видит" метрики ноды и контейнеров на всех нодах, что есть в env.yml
может можно сделать как-то красивее, но так исторически сложилось, что конфиг такой.
думаю это не оч принципиально.
главное что cadvisor снимает все метрики.
осталось вот разобраться с этой задачкой и мониторинг кухни моей будет готов

Karey
24.11.2017
21:28:39
Вот это не попадалось? https://github.com/ContainerSolutions/prometheus-swarm-discovery

Zlokot
24.11.2017
21:33:42
неа, читаю..
пока чет не пойму как это мне применить
ох, похоже надо раскуривать этот relabeling.. мутная хрень

Karey
24.11.2017
21:54:01
Там в настройках есть интервал обновления
А Prometheus автоматически перечитывает файл, как я понял

Andrey
24.11.2017
21:54:24
А точно сварм нужен, тут кто то на днях говорил что как его там кубернетс вроде побеждает
а не тут, в чятике докера

Karey
24.11.2017
21:55:08
Это отдельный вопрос, но поддерживаю эту мысль

Zlokot
24.11.2017
21:59:43
пока сварм.. даже не сварм, а докер стек.
но про кубер тоже думаем, или даже про опеншифт

Google

Сергей
24.11.2017
22:08:19
С кубером там вообще весело
Они уже и свой рантайм пилят
И проект который отдельно containerd припилили

Andrey
25.11.2017
03:48:55
кстати, а никто не делал мониторилку "протухания" ssl сертификатов, в виде метрик, чтоб оно потом той же графане красивенько скармливать? ну или линк мож попадался? оно конечно ближе к алертам наверное, но вдруг что полезное в виде метрик есть :)

Владислав
25.11.2017
06:36:22
Blackbox exporter у prometheus посмотри, там есть http check. И там может возвращаться время экспирации сертификата.

Dmitry
25.11.2017
06:41:43
С алертами и прочим

Artem
25.11.2017
07:07:20

Karey
25.11.2017
07:08:28
А причём он здесь?

Artem
25.11.2017
07:09:43
sd

Nikita
25.11.2017
08:22:21
Привет. А кто нибудь с прометеусом квест на реверс-прокси прошел? Как эти два web параметра задать, я так и не пробился чтобы нормально работал

Artem
25.11.2017
08:30:10
наверное, все.

Nikita
25.11.2017
09:23:54
это мне ответ?:)

Алексей
25.11.2017
12:36:19
@alexanderzobnin
https://community.grafana.com/t/heatmap-using-prometheus-histogram/1936
не поменялось ?
ага. поменялось.
Time series buckets
Each time series already represents a Y-Axis bucket. The time series name (alias) needs to be a numeric value representing the upper interval for the bucket. Grafana does no bucketing so the bucket size options are hidden.

Alexander
25.11.2017
12:39:21
Пока еще руки не дошли

Алексей
25.11.2017
12:40:38
но пром пока мимо да
я тут mtail раскуриваю. там прикольно можно из логов понаделать гистограм

Alexander
25.11.2017
12:54:45
У прометея, кажктся, похожий на StatsD формат гистограмм, мы с самого начала хотели добавить, но как-то все времени не хватает.

Google

Алексей
25.11.2017
12:55:31
ну я в форматы не лез пока. панелька четко возвращает пустоту.
ладно потыка варианты
вроде ковер умеет

Alexander
25.11.2017
12:56:24
Какой ковер?

Алексей
25.11.2017
12:58:32
https://grafana.com/plugins/petrslavotinek-carpetplot-panel/installation
не
он про другое

yuyu
25.11.2017
13:00:43
вроде ковер умеет
С carpet plot непонятна область применения - у него же по Y только 24 часа вроде. Или что-то поменялось?

Алексей
25.11.2017
13:01:01
да не. я затупил

b0g3r
26.11.2017
14:09:23
https://github.com/influxdata/influxdb/issues/6451 мде :)

Алексей
26.11.2017
14:11:14
thanx gods i'm not using influxdb

Виталий
27.11.2017
04:43:13
бывает похожее, но не из-за инфлюкса. например, в класс политики добавляю еще одну и при этом счетчики класса ведут себя странно. в этом случае non_negative_derivative или non_negative_difference покажут всякое.

Виталий
27.11.2017
04:43:28
не более 2мбит должно было быть..
если на графике ось можно как-то ограничить, то со значениями приходится мириться.

Sergey
27.11.2017
08:40:04
Кстати, не видел, чтобы тут пролетало: вышел collectd 5.8 (https://collectd.org/news.shtml)

Maxim
27.11.2017
08:47:32
а кто-нибудь юзает пром + collectd? как оно?

Алексей
27.11.2017
09:03:20
живые пользователи stackstorm в чате есть ?
ух. морда для прома https://github.com/line/promgen
вдруг надо кому
зачем то

Google

Sergey
27.11.2017
11:16:13
Господа хорошие, у меня вопрос. Если в двух словах - разрабы пишут код на Питоне, хотят мониторит каждый процесс. При этом они отказываются запиливать единый endpoint сбора метрик, предлагая вместо этого опрашивать каждый процесс в отдельности по его личному endpoint-у. Интуитивно я понимаю, что это - полное говно, потому что не масштабируется от слова "совсем".

Алексей
27.11.2017
11:17:03
так и надо
разрабы правы

Admin
ERROR: S client not available

Zlokot
27.11.2017
11:17:12
+

Алексей
27.11.2017
11:17:35
единый ендпоинт решает другую задачу

Sergey
27.11.2017
11:17:35
Накидайте, пожалуйста, ещё аргументов против такого подхода (я у них запрашивал изначально абсолютно другой вариант: один компонент - один ендпойнт, отдаётся список с данными по каждому процессу данного компонента)

Karey
27.11.2017
11:17:56
Да они правы

Алексей
27.11.2017
11:17:59
единый ендпоинт годен для сбора метрик не процесса а системы

Karey
27.11.2017
11:18:44
И как раз-таки отлично масштабируется
С sd конечно

Алексей
27.11.2017
11:19:16
у меня сейчас такая же беда. я с каждого процесса собираю метрики. а вот общесистемные приходится прогонять через башскриптики и телеграф.
а так да. сведи всё в консул, скажи прому забирать процессы из консула.
могу скинуть как у меня такое настроено

Sergey
27.11.2017
11:23:16

Алексей
27.11.2017
11:23:41
ты хочешь странного

Karey
27.11.2017
11:23:51
Мы же в два голоса мотивировали)

Zhenia
27.11.2017
11:24:12

Google

Sergey
27.11.2017
11:24:29
Причём тут нафиг консул? Это k-v хранилка, сами процессы ничего никуда не отдают и не собираются.

Karey
27.11.2017
11:25:05
Консул это service discovery, чтобы пром знал куда ходить собирать.

Алексей
27.11.2017
11:25:07

Karey
27.11.2017
11:25:15
А, ведь там может быть не пром)

Алексей
27.11.2017
11:25:41

Sergey
27.11.2017
11:29:16
А, ведь там может быть не пром)
Потому что тут не пром, да. Сервис дискавери нет, и масштабирования, и работает всё на железках. Я не спрашиваю, как надо делать, я спрашиваю, может ли кто набросить аргументов _против_ 1 ендпойнт=1 процесс. У меня в одном компоненте имеет место до десятка приложений, и каждое приложение через supervisord запускается в несколько процессов.

Алексей
27.11.2017
11:30:13
сергей, аргументов нет. разрабы правы. но ты к их правоте не готов. увы грусть.

Sergey
27.11.2017
11:30:55
То есть это нормально - видеть в конфигах сотню ендпойнтов и занимать этим две сотни портов?

Алексей
27.11.2017
11:31:26
да. вполне.
но у меня например порты динамические
и их можно только дискаверить

Zhenia
27.11.2017
11:32:04
главное конфиги руками не писать, в остальном - почему нет?

Алексей
27.11.2017
11:32:22
так что ты разрабам скажи что готов к их схеме. но надо что бы они писали факт сервиса в консул

Sergey
27.11.2017
11:32:55
Архитектура на данный момент не предполагает консула.