@metrics_ru

Страница 356 из 681
Karey
27.11.2017
15:04:23
В случае если нод много

Alexey
27.11.2017
15:04:29
если докер - то и для DNS

Алексей
27.11.2017
15:04:37
зачем тогда агент вообще нужен..
масштабирование чтения

Alexey
27.11.2017
15:04:49
базу удобно искать, только докеру нужно сказать что бы DNS запросы уходили в агента

Google
Alexey
27.11.2017
15:06:14
Можно и на прямую регистрироватся, но поверьте там агент консула вообще ничего не весит.

Алексей
27.11.2017
15:06:42
после дня истового гугления и нескольких дней пассивного гугления я уже немного сомневаюсь, гавно ли забикс ? мне начинает вкрадываться в душу сомнение.

Alexey
27.11.2017
15:07:32
Если нет заморочек с партишингом и хватает производительности и не планируется овер 1к хостов - то заббикс норм

Алексей
27.11.2017
15:08:08
нет.

Alexey
27.11.2017
15:08:17
Но вся эта система несколько больше, разрабы используя либы делают мониторинг приложения изнутри

Очень много значений нужных для них отдают

В заббиксе тоже можно это делать ))) Но там этот LLD и все остальное. Ну не знаю, прометей реально круче

Алексей
27.11.2017
15:09:55
прометей круче да.

но я не могу понять как чинить аварии.

Alexey
27.11.2017
15:10:45
в смысле ? там алертманагер - вполне обладает заббиксовым функционалом. А КНОПКА ТИШИНЫ

вообще респект !

Alexey
27.11.2017
15:11:17
sum(nginx_http_response_count_total[1h])
sum_over_time нужен тут

Google
Алексей
27.11.2017
15:12:01
чинить это взять и запустить что то что сходит и починит

Alexey
27.11.2017
15:12:02
sum_over_time нужен тут
Это понятно, но я не пойму как это чинить

Alexey
27.11.2017
15:12:35
Это имя функции. Вместо sum

sum по измерениям суммирует, а не по рядам

Alexey
27.11.2017
15:14:41
нужно именно ряд сложить

Но за час

Потому что изменения в нуль уходят

то есть значения там вот так прилетают 0 0 0 2 5 6 0 2 0 5

Alexey
27.11.2017
15:15:43
sum_over_time должен сложить все элементы в ряду(рядах)

Alexey
27.11.2017
15:16:59
Там я так понял ересь начинается если именно нули есть

К счастью проблема не у меня

{"status":"error","errorType":"bad_data","error":"parse error at char 30: expected type vector in aggregation expression, got matrix"}

Alexey
27.11.2017
15:35:00
Мм, значит, там несколько серий попадает под выражение. Прометей умеет либо агрегировать по одной серии, либо агрегировать серии, но не оба сразу.

Alexander
27.11.2017
15:53:21
sum_over_time должен сложить все элементы в ряду(рядах)
sum_over_time это для range-vector, а не для instant vector

Dmitry
27.11.2017
15:56:19
Короче мы сваливаем в бОльшей степени с Influx

Alexander
27.11.2017
16:04:26
как tsdb идеи у influx правильные

на сама реализация коенчно уг

Zlokot
27.11.2017
16:57:54
так, объясните плиз еще раз - как Consul на хосте узнает о контейнерах и сервисах в них?

Алексей
27.11.2017
16:58:24
например так https://github.com/gliderlabs/registrator

Google
Zlokot
27.11.2017
16:58:30
я могу запустить бинарник Consul и откуда он будет знать об оверлейно сети, которая из host сtти просто недоступна

то есть cadvisor для снятия метрик самого контейнера, а кegistrator - для снятия инфы о сервисах в контейнерах? и то и то нужно для мониторинга получается

Алексей
27.11.2017
17:00:45
а зачем катвисор ?

Zlokot
27.11.2017
17:00:47
и Consul для оркестрации этой инфы, чтобы прометей ее скрапил и графана для отображения

Алексей
27.11.2017
17:01:02
катвизор был нужен покадокердемон сам не умел отдавать

сейчас сам умеет он всё еще нужен разве ?

Zlokot
27.11.2017
17:01:12
ну а как мониторить состояние контейнеров?

омг.. что я пропустил

Алексей
27.11.2017
17:01:20
там что то уникальное есть ?

докер с 17,05 имеет ендпоинт для прома

Zlokot
27.11.2017
17:01:55
а как в прометей скормить то, что отдает докер демон? я видимо читал какието старые мануалы

Алексей
27.11.2017
17:02:13
старые

Алексей
27.11.2017
17:02:24
сказать докер демону слушать порт

и порегать демона в консуле

Zlokot
27.11.2017
17:05:39
у меня счас так: в конфиге прома есть только одна job - job_name: 'all' scrape_interval: 5s file_sd_configs: - files: - /opt/prom/config.yml и в этом конфиге я перечисляю руками все свои ноды, так: { "targets": ["192.168.1.12:9100","192.168.1.12:8888"], "labels": { "job": "srv1_node", "instance": "srv1:9100" } }, { "targets": ["192.168.1.17:9100","192.168.1.17:8888"], "labels": { "job": "srv2_node", "instance": "srv2:9100" } },

9100 - это node exporter 8888 - это cadvisor

ну и в графане уже дашборд настроен на это все

получается надо убирать cadvisor и переделывать дашборд..

Dmitry
27.11.2017
17:07:12
как tsdb идеи у influx правильные
Вообще исключаем/минимизируем пока TSDB в пайплайне метрик

Алексей
27.11.2017
17:09:41
получается надо убирать cadvisor и переделывать дашборд..
да. я выше кидал как делать дискавери через consul что бы тоже один джоб остался

Google
Zlokot
27.11.2017
17:11:10
это об этом? https://docs.docker.com/engine/admin/prometheus/#use-prometheus

тут же написано, что Currently, you can only monitor Docker itself. You cannot currently monitor your application using the Docker target. разве это значит что это аналог cadvisor, который умеет измерять все, что относится к конкретному контейнеру?

yuyu
27.11.2017
17:26:34
Как бы вот это https://github.com/otm/networkmap.js к графане прикрутить как panel plugin с меппингом значений, полученных от датасорса на цвета и лейблы линков и узлов на weathermap. Получилась бы супер-пупер крутая статустная панель. Просто через Text Panel этот weathermap c заранее сгенерённым json файлом с данными легко присобачить, но хочется большего ? - не всё же на кактус смотреть...

Zlokot
27.11.2017
17:33:07
If the file is currently empty, paste the following: { "metrics-addr" : "127.0.0.1:9323", "experimental" : true } смущает это experimental

yuyu
27.11.2017
17:33:31
оно слегка мертвым выглядит
Ну и что? Лишь бы работало. Да и написано, на первый взгляд, достаточно культурно. Diagram panel плагин такого простора не даёт.

Алексей
27.11.2017
17:34:30
Ну и что? Лишь бы работало. Да и написано, на первый взгляд, достаточно культурно. Diagram panel плагин такого простора не даёт.
ну обидно запилить будет и понять что на 30 объектах оно работает так что ест весь браузер

yuyu
27.11.2017
17:36:12
ну обидно запилить будет и понять что на 30 объектах оно работает так что ест весь браузер
Согласен. Хочу на досуге его сначала в чистом виде погонять, проверить на вшивость с картой-пустышкой, но достаточно большой.

Admin
ERROR: S client not available

Andrey
27.11.2017
17:36:51
Zlokot
27.11.2017
17:37:42
да. я выше кидал как делать дискавери через consul что бы тоже один джоб остался
не нашел. счас надо отлучиться, вернусь - продолжу тиранить опять..

Алексей
27.11.2017
17:38:29
Bogdan (SirEdvin)
27.11.2017
17:49:52
тут же написано, что Currently, you can only monitor Docker itself. You cannot currently monitor your application using the Docker target. разве это значит что это аналог cadvisor, который умеет измерять все, что относится к конкретному контейнеру?
Аналога cadvisor нет, и вроде как и не будет, потому что куб и сварм вроде умеют отдавать метрики и так. А чисто докер мало кому из крупных нужен.

Sergey
27.11.2017
18:48:49
@Zlokot >>проблема в том как опеределить на какой ноде этот сервис, чтобы отдать это имя blackbox exporter для проверки мне кажется что весь велосипед растет из docker-swarm. В кубере сервис дискавери из коробки, соотвественно пром сам все находит, и снимает метрики со всех сервисов, которые обозначены в аннотациях.

Dmitry
27.11.2017
19:34:09
Sergey @Zlokot А вот если пойти по пути активного пуша? типа statsd?

Sergey
27.11.2017
19:35:15
push далеко не для всех задачь. Если есть возможность pull (а в k8s оно есть из коробки) то лучше pull.

Dmitry
27.11.2017
19:36:34
Ну, кроме очевидного - тихой смерти

Zlokot
27.11.2017
19:38:15
так push надо имплементировать значит в сервисы мои? врядли счас девелоперы пойдут на такое

Google
Zlokot
27.11.2017
19:41:15
у меня же swarm - значит ли что это: https://docs.docker.com/engine/admin/prometheus/ мне не подойдет вместо cadvisor?

чет я в чайной ложке счас прям утоплюсь - не пойму разницу

If the file is currently empty, paste the following: { "metrics-addr" : "127.0.0.1:9323", "experimental" : true } смущает это experimental
один фиг похоже прийдется это убрать - мои сервисы не стартуют после добавления

Karey
27.11.2017
19:47:13
А зачем ты вообще начал это добавлять, чем cadvisor-то плох?

Алексей
27.11.2017
19:47:31
а чем хорош ?

Zlokot
27.11.2017
19:50:15
А зачем ты вообще начал это добавлять, чем cadvisor-то плох?
увидел мнение, что он уже не нужен, так как докер "из коробки" отдает метрики уже

Karey
27.11.2017
19:50:40
Он отдает свои метрики, а не контейнеров

Zlokot
27.11.2017
19:51:42
@freeseacher - м?

Алексей
27.11.2017
19:52:17
так и катвизор отдает метрики свои

Zlokot
27.11.2017
19:52:25
Karey
27.11.2017
19:52:31
Docker Engine

А не запущенных в нем контейеров

Currently, you can only monitor Docker itself. You cannot currently monitor your application using the Docker target.

Zlokot
27.11.2017
19:53:37
я блин именно на этом споткнулся еще с месяц назад и просто перестал дальше читать но седня вот усомнился

application - по идее это то, что В контейнере

а не сам контейнер

Karey
27.11.2017
19:55:07
Нет, потому что как бы докер не хотел, он не сможет просто так взять и мониторить приложение внутри контейнера

Алексей
27.11.2017
19:55:11
там нету docker stats ?

Zlokot
27.11.2017
19:56:07
Karey
27.11.2017
19:56:31
Docker itself - Docker Engine

Zlokot
27.11.2017
20:00:31
ну это понятно но вот уже термин application - он же относится не к статсам контейнера все таки.. я вижу три уровня мониторинга: 1 - нода - это сам сервер, OS - тут работает node_exporter 2 - docker layer - это докер и контейнеры в нем - тут нужен cadvisor 3 - service - это то, что крутится внутри контейнера - апликуха. вот тут уже варианты - или blackbox или если у app есть /metrics - то снимать их оттуда

Страница 356 из 681