
Karey
27.11.2017
15:04:23
В случае если нод много

Alexey
27.11.2017
15:04:29
если докер - то и для DNS

Алексей
27.11.2017
15:04:37

Alexey
27.11.2017
15:04:49
базу удобно искать, только докеру нужно сказать что бы DNS запросы уходили в агента

Google

Alexey
27.11.2017
15:06:14
Можно и на прямую регистрироватся, но поверьте там агент консула вообще ничего не весит.

Алексей
27.11.2017
15:06:42
после дня истового гугления и нескольких дней пассивного гугления я уже немного сомневаюсь, гавно ли забикс ?
мне начинает вкрадываться в душу сомнение.

Alexey
27.11.2017
15:07:32
Если нет заморочек с партишингом и хватает производительности и не планируется овер 1к хостов - то заббикс норм

Алексей
27.11.2017
15:08:08
нет.

Alexey
27.11.2017
15:08:17
Но вся эта система несколько больше, разрабы используя либы делают мониторинг приложения изнутри
Очень много значений нужных для них отдают
В заббиксе тоже можно это делать ))) Но там этот LLD и все остальное. Ну не знаю, прометей реально круче

Алексей
27.11.2017
15:09:55
прометей круче да.
но я не могу понять как чинить аварии.

Alexey
27.11.2017
15:10:45
в смысле ? там алертманагер - вполне обладает заббиксовым функционалом. А КНОПКА ТИШИНЫ
вообще респект !

Алексей
27.11.2017
15:11:10

Alexey
27.11.2017
15:11:17

Google

Алексей
27.11.2017
15:12:01
чинить это взять и запустить что то что сходит и починит

Alexey
27.11.2017
15:12:02

Alexey
27.11.2017
15:12:35
Это имя функции. Вместо sum
sum по измерениям суммирует, а не по рядам

Alexey
27.11.2017
15:14:41
нужно именно ряд сложить
Но за час
Потому что изменения в нуль уходят
то есть значения там вот так прилетают 0 0 0 2 5 6 0 2 0 5

Alexey
27.11.2017
15:15:43
sum_over_time должен сложить все элементы в ряду(рядах)

Alexey
27.11.2017
15:16:59
Там я так понял ересь начинается если именно нули есть
К счастью проблема не у меня
{"status":"error","errorType":"bad_data","error":"parse error at char 30: expected type vector in aggregation expression, got matrix"}

Alexey
27.11.2017
15:35:00
Мм, значит, там несколько серий попадает под выражение. Прометей умеет либо агрегировать по одной серии, либо агрегировать серии, но не оба сразу.

Alexander
27.11.2017
15:53:21

Dmitry
27.11.2017
15:56:19
Короче мы сваливаем в бОльшей степени с Influx

Alexander
27.11.2017
16:04:26
как tsdb идеи у influx правильные
на сама реализация коенчно уг

Alexey
27.11.2017
16:31:36

Zlokot
27.11.2017
16:57:54
так, объясните плиз еще раз - как Consul на хосте узнает о контейнерах и сервисах в них?

Алексей
27.11.2017
16:58:24
например так https://github.com/gliderlabs/registrator

Google

Zlokot
27.11.2017
16:58:30
я могу запустить бинарник Consul и откуда он будет знать об оверлейно сети, которая из host сtти просто недоступна
то есть cadvisor для снятия метрик самого контейнера, а кegistrator - для снятия инфы о сервисах в контейнерах?
и то и то нужно для мониторинга получается

Алексей
27.11.2017
17:00:45
а зачем катвисор ?

Zlokot
27.11.2017
17:00:47
и Consul для оркестрации этой инфы, чтобы прометей ее скрапил и графана для отображения

Алексей
27.11.2017
17:01:02
катвизор был нужен покадокердемон сам не умел отдавать
сейчас сам умеет он всё еще нужен разве ?

Zlokot
27.11.2017
17:01:12
ну а как мониторить состояние контейнеров?
омг.. что я пропустил

Алексей
27.11.2017
17:01:20
там что то уникальное есть ?
докер с 17,05 имеет ендпоинт для прома

Zlokot
27.11.2017
17:01:55
а как в прометей скормить то, что отдает докер демон? я видимо читал какието старые мануалы

Алексей
27.11.2017
17:02:13
старые

Алексей
27.11.2017
17:02:24
сказать докер демону слушать порт
и порегать демона в консуле

Zlokot
27.11.2017
17:05:39
у меня счас так:
в конфиге прома есть только одна job
- job_name: 'all'
scrape_interval: 5s
file_sd_configs:
- files:
- /opt/prom/config.yml
и в этом конфиге я перечисляю руками все свои ноды, так:
{
"targets": ["192.168.1.12:9100","192.168.1.12:8888"],
"labels": {
"job": "srv1_node",
"instance": "srv1:9100"
}
},
{
"targets": ["192.168.1.17:9100","192.168.1.17:8888"],
"labels": {
"job": "srv2_node",
"instance": "srv2:9100"
}
},
9100 - это node exporter
8888 - это cadvisor
ну и в графане уже дашборд настроен на это все
получается надо убирать cadvisor и переделывать дашборд..

Dmitry
27.11.2017
17:07:12

Алексей
27.11.2017
17:09:41

Google

Zlokot
27.11.2017
17:11:10
это об этом?
https://docs.docker.com/engine/admin/prometheus/#use-prometheus
тут же написано, что
Currently, you can only monitor Docker itself. You cannot currently monitor your application using the Docker target.
разве это значит что это аналог cadvisor, который умеет измерять все, что относится к конкретному контейнеру?

yuyu
27.11.2017
17:26:34
Как бы вот это https://github.com/otm/networkmap.js к графане прикрутить как panel plugin с меппингом значений, полученных от датасорса на цвета и лейблы линков и узлов на weathermap.
Получилась бы супер-пупер крутая статустная панель.
Просто через Text Panel этот weathermap c заранее сгенерённым json файлом с данными легко присобачить, но хочется большего ? - не всё же на кактус смотреть...

Алексей
27.11.2017
17:31:49

Zlokot
27.11.2017
17:33:07
If the file is currently empty, paste the following:
{
"metrics-addr" : "127.0.0.1:9323",
"experimental" : true
}
смущает это experimental

yuyu
27.11.2017
17:33:31
оно слегка мертвым выглядит
Ну и что? Лишь бы работало. Да и написано, на первый взгляд, достаточно культурно. Diagram panel плагин такого простора не даёт.

Алексей
27.11.2017
17:34:30

yuyu
27.11.2017
17:36:12

Admin
ERROR: S client not available

Andrey
27.11.2017
17:36:51

Zlokot
27.11.2017
17:37:42

Алексей
27.11.2017
17:38:29

Bogdan (SirEdvin)
27.11.2017
17:49:52

Sergey
27.11.2017
18:48:49
@Zlokot
>>проблема в том как опеределить на какой ноде этот сервис, чтобы отдать это имя blackbox exporter для проверки
мне кажется что весь велосипед растет из docker-swarm. В кубере сервис дискавери из коробки, соотвественно пром сам все находит, и снимает метрики со всех сервисов, которые обозначены в аннотациях.

Dmitry
27.11.2017
19:34:09
Sergey @Zlokot А вот если пойти по пути активного пуша? типа statsd?

Sergey
27.11.2017
19:35:15
push далеко не для всех задачь. Если есть возможность pull (а в k8s оно есть из коробки) то лучше pull.

Dmitry
27.11.2017
19:36:34
Ну, кроме очевидного - тихой смерти

Zlokot
27.11.2017
19:38:15
так push надо имплементировать значит в сервисы мои? врядли счас девелоперы пойдут на такое

Google

Zlokot
27.11.2017
19:41:15
у меня же swarm - значит ли что это:
https://docs.docker.com/engine/admin/prometheus/
мне не подойдет вместо cadvisor?
чет я в чайной ложке счас прям утоплюсь - не пойму разницу

Karey
27.11.2017
19:47:13
А зачем ты вообще начал это добавлять, чем cadvisor-то плох?

Алексей
27.11.2017
19:47:31
а чем хорош ?

Zlokot
27.11.2017
19:50:15

Karey
27.11.2017
19:50:40
Он отдает свои метрики, а не контейнеров

Zlokot
27.11.2017
19:51:42
@freeseacher - м?

Алексей
27.11.2017
19:52:17
так и катвизор отдает метрики свои

Zlokot
27.11.2017
19:52:25

Karey
27.11.2017
19:52:31
Docker Engine
А не запущенных в нем контейеров
Currently, you can only monitor Docker itself. You cannot currently monitor your application using the Docker target.

Zlokot
27.11.2017
19:53:37
я блин именно на этом споткнулся еще с месяц назад и просто перестал дальше читать
но седня вот усомнился
application - по идее это то, что В контейнере
а не сам контейнер

Karey
27.11.2017
19:55:07
Нет, потому что как бы докер не хотел, он не сможет просто так взять и мониторить приложение внутри контейнера

Алексей
27.11.2017
19:55:11
там нету docker stats ?

Zlokot
27.11.2017
19:56:07

Karey
27.11.2017
19:56:31
Docker itself - Docker Engine

Zlokot
27.11.2017
20:00:31
ну это понятно
но вот уже термин application - он же относится не к статсам контейнера все таки..
я вижу три уровня мониторинга:
1 - нода - это сам сервер, OS - тут работает node_exporter
2 - docker layer - это докер и контейнеры в нем - тут нужен cadvisor
3 - service - это то, что крутится внутри контейнера - апликуха. вот тут уже варианты - или blackbox или если у app есть /metrics - то снимать их оттуда