@metrics_ru

Страница 353 из 681
Karey
24.11.2017
21:22:59
А порты случайные устанавливаются сервисами?

Zlokot
24.11.2017
21:23:15
{ "targets": ["xx.xx.xx.xx:9100","xx.xx.xx.xx:8888"], "labels": { "job": "node1_node", "instance": "node1:9100" } },

у каждого сервиса, что работает в контейнере свой статический порт.

"instance": "node1:9100" то есть в дашборде я вижу список этих инстансов

Google
Zlokot
24.11.2017
21:24:44
9100 - это node exporter 8888 это cadvisor

таким образом пром "видит" метрики ноды и контейнеров на всех нодах, что есть в env.yml

может можно сделать как-то красивее, но так исторически сложилось, что конфиг такой. думаю это не оч принципиально. главное что cadvisor снимает все метрики. осталось вот разобраться с этой задачкой и мониторинг кухни моей будет готов

Karey
24.11.2017
21:28:39
Вот это не попадалось? https://github.com/ContainerSolutions/prometheus-swarm-discovery

Zlokot
24.11.2017
21:33:42
неа, читаю.. пока чет не пойму как это мне применить

ох, похоже надо раскуривать этот relabeling.. мутная хрень

Вот это не попадалось? https://github.com/ContainerSolutions/prometheus-swarm-discovery
тут не очень понятно как часто будет обновляться этот конфиг для прометея..

Karey
24.11.2017
21:54:01
Там в настройках есть интервал обновления

А Prometheus автоматически перечитывает файл, как я понял

Andrey
24.11.2017
21:54:24
А точно сварм нужен, тут кто то на днях говорил что как его там кубернетс вроде побеждает

а не тут, в чятике докера

Karey
24.11.2017
21:55:08
Это отдельный вопрос, но поддерживаю эту мысль

Zlokot
24.11.2017
21:59:43
пока сварм.. даже не сварм, а докер стек. но про кубер тоже думаем, или даже про опеншифт

Google
Сергей
24.11.2017
22:08:19
С кубером там вообще весело

Они уже и свой рантайм пилят

И проект который отдельно containerd припилили

Andrey
25.11.2017
03:48:55
кстати, а никто не делал мониторилку "протухания" ssl сертификатов, в виде метрик, чтоб оно потом той же графане красивенько скармливать? ну или линк мож попадался? оно конечно ближе к алертам наверное, но вдруг что полезное в виде метрик есть :)

Владислав
25.11.2017
06:36:22
Blackbox exporter у prometheus посмотри, там есть http check. И там может возвращаться время экспирации сертификата.

Karey
25.11.2017
07:08:28
А причём он здесь?

Artem
25.11.2017
07:09:43
sd

Nikita
25.11.2017
08:22:21
Привет. А кто нибудь с прометеусом квест на реверс-прокси прошел? Как эти два web параметра задать, я так и не пробился чтобы нормально работал

Artem
25.11.2017
08:30:10
наверное, все.

Nikita
25.11.2017
09:23:54
это мне ответ?:)

Алексей
25.11.2017
12:36:19
@alexanderzobnin https://community.grafana.com/t/heatmap-using-prometheus-histogram/1936 не поменялось ?

ага. поменялось.

Time series buckets Each time series already represents a Y-Axis bucket. The time series name (alias) needs to be a numeric value representing the upper interval for the bucket. Grafana does no bucketing so the bucket size options are hidden.

Alexander
25.11.2017
12:39:21
Пока еще руки не дошли

Алексей
25.11.2017
12:40:38
но пром пока мимо да

я тут mtail раскуриваю. там прикольно можно из логов понаделать гистограм

Alexander
25.11.2017
12:54:45
У прометея, кажктся, похожий на StatsD формат гистограмм, мы с самого начала хотели добавить, но как-то все времени не хватает.

Google
Алексей
25.11.2017
12:55:31
ну я в форматы не лез пока. панелька четко возвращает пустоту.

ладно потыка варианты

вроде ковер умеет

Alexander
25.11.2017
12:56:24
Какой ковер?

Алексей
25.11.2017
12:58:32
https://grafana.com/plugins/petrslavotinek-carpetplot-panel/installation

не

он про другое

yuyu
25.11.2017
13:00:43
вроде ковер умеет
С carpet plot непонятна область применения - у него же по Y только 24 часа вроде. Или что-то поменялось?

Алексей
25.11.2017
13:01:01
да не. я затупил

b0g3r
26.11.2017
14:09:23
https://github.com/influxdata/influxdb/issues/6451 мде :)

Алексей
26.11.2017
14:11:14
thanx gods i'm not using influxdb

Виталий
27.11.2017
04:43:13
бывает похожее, но не из-за инфлюкса. например, в класс политики добавляю еще одну и при этом счетчики класса ведут себя странно. в этом случае non_negative_derivative или non_negative_difference покажут всякое.

Виталий
27.11.2017
04:43:28
не более 2мбит должно было быть..

если на графике ось можно как-то ограничить, то со значениями приходится мириться.

Sergey
27.11.2017
08:40:04
Кстати, не видел, чтобы тут пролетало: вышел collectd 5.8 (https://collectd.org/news.shtml)

Maxim
27.11.2017
08:47:32
а кто-нибудь юзает пром + collectd? как оно?

Алексей
27.11.2017
09:03:20
живые пользователи stackstorm в чате есть ?

ух. морда для прома https://github.com/line/promgen

вдруг надо кому

зачем то

Google
Sergey
27.11.2017
11:16:13
Господа хорошие, у меня вопрос. Если в двух словах - разрабы пишут код на Питоне, хотят мониторит каждый процесс. При этом они отказываются запиливать единый endpoint сбора метрик, предлагая вместо этого опрашивать каждый процесс в отдельности по его личному endpoint-у. Интуитивно я понимаю, что это - полное говно, потому что не масштабируется от слова "совсем".

Алексей
27.11.2017
11:17:03
так и надо

разрабы правы

Admin
ERROR: S client not available

Zlokot
27.11.2017
11:17:12
+

Алексей
27.11.2017
11:17:35
единый ендпоинт решает другую задачу

Sergey
27.11.2017
11:17:35
Накидайте, пожалуйста, ещё аргументов против такого подхода (я у них запрашивал изначально абсолютно другой вариант: один компонент - один ендпойнт, отдаётся список с данными по каждому процессу данного компонента)

Karey
27.11.2017
11:17:56
Да они правы

Алексей
27.11.2017
11:17:59
единый ендпоинт годен для сбора метрик не процесса а системы

Karey
27.11.2017
11:18:44
И как раз-таки отлично масштабируется

С sd конечно

Алексей
27.11.2017
11:19:16
у меня сейчас такая же беда. я с каждого процесса собираю метрики. а вот общесистемные приходится прогонять через башскриптики и телеграф.

а так да. сведи всё в консул, скажи прому забирать процессы из консула.

могу скинуть как у меня такое настроено

Алексей
27.11.2017
11:23:41
ты хочешь странного

Karey
27.11.2017
11:23:51
Мы же в два голоса мотивировали)

Zhenia
27.11.2017
11:24:12
Google
Sergey
27.11.2017
11:24:29
Причём тут нафиг консул? Это k-v хранилка, сами процессы ничего никуда не отдают и не собираются.

Karey
27.11.2017
11:25:05
Консул это service discovery, чтобы пром знал куда ходить собирать.

Karey
27.11.2017
11:25:15
А, ведь там может быть не пром)

Алексей
27.11.2017
11:25:41
а покажи пожайлуста
https://kb.nocproject.org/pages/viewpage.action?pageId=29982977

Sergey
27.11.2017
11:29:16
А, ведь там может быть не пром)
Потому что тут не пром, да. Сервис дискавери нет, и масштабирования, и работает всё на железках. Я не спрашиваю, как надо делать, я спрашиваю, может ли кто набросить аргументов _против_ 1 ендпойнт=1 процесс. У меня в одном компоненте имеет место до десятка приложений, и каждое приложение через supervisord запускается в несколько процессов.

Алексей
27.11.2017
11:30:13
сергей, аргументов нет. разрабы правы. но ты к их правоте не готов. увы грусть.

Sergey
27.11.2017
11:30:55
То есть это нормально - видеть в конфигах сотню ендпойнтов и занимать этим две сотни портов?

Алексей
27.11.2017
11:31:26
да. вполне.

но у меня например порты динамические

и их можно только дискаверить

Zhenia
27.11.2017
11:32:04
главное конфиги руками не писать, в остальном - почему нет?

Алексей
27.11.2017
11:32:22
так что ты разрабам скажи что готов к их схеме. но надо что бы они писали факт сервиса в консул

Sergey
27.11.2017
11:32:55
Архитектура на данный момент не предполагает консула.

Страница 353 из 681