@metrics_ru

Страница 648 из 681
Terminator
24.09.2018
14:40:33
@ad0ne будет жить. Поприветствуем!

@a1eXei будет жить. Поприветствуем!

Shamil
24.09.2018
16:25:10
Братья-метряне, есть задача по собиранию логов из stdout контейнеров, которые крутятся в Docker Swarm (про k8s я в курсе, но пока ребята с контейнерами на "вы", не хочу свистопляску разводить). Сейчас собираю через контейнер fluentd запущенный в режиме global на каждой ноде Swarm и отправляю в ElasticSearch, каждый сервис в отдельный индекс, все как полагается. Пока приложений мало и хватает одного общего fluent.conf, для всех служб. Однако есть мысль выкатывать Stack'и, каждый с отдельным контейнером fluentd, чтобы хранить его настройки в одной репе с приложением, которое будет писать журнал. В кубике это реализовано через pod'ы и все более-менее компактно, вот думаю вообще в Docker Swarm так делают, или есть какие-то подводные камни?

evix
24.09.2018
16:28:42
cAdvisor ставят, например

Google
Shamil
24.09.2018
16:30:29
cAdvisor ставят, например
Имеешь в виду, в каждый стек ставят? Зачем?

evix
24.09.2018
16:31:45
не знаю. я с докером не знаком

Shamil
24.09.2018
16:57:28
Да я знаю, что мертв, но мигрировать на кубик, нет ресурсов, вот и выкручиваюсь по-колхозному.

Andor
24.09.2018
16:58:22
Ещё есть номад. Насколько я знаю, он намного проще кубера

Ну и твой вопрос - не про метрики

M
24.09.2018
16:59:41
Да я знаю, что мертв, но мигрировать на кубик, нет ресурсов, вот и выкручиваюсь по-колхозному.
ну а так просто удовстлверься что на каждой ноде запущен fluentd и все.

Ну и твой вопрос - не про метрики
про логи здесь нельзя?

Shamil
24.09.2018
17:00:08
Это ответы в стиле: — "Как мне поставить nginx+lua на CentOS?" — "Ставь Ubuntu"

Логи не метрики?

Andor
24.09.2018
17:00:45
Логи - не метрики, всё верно

Google
.
24.09.2018
17:02:05
метрики это маленькие pesky numbers которые описывают величины

а логи это уже описание событий больше

и подходы к их обработке разные

M
24.09.2018
17:03:15
Логи не метрики?
тебе в церковь логов, это рядом

.
24.09.2018
17:03:27
я правда хз считать ли всякую перфдату метриками

Shamil
24.09.2018
17:03:33
ну а так просто удовстлверься что на каждой ноде запущен fluentd и все.
Это делается, через режим запуска global, но я моя идея в том, чтобы каждому приложению припаять отдельный, крохотный контейнер с fluentd, тогда я смогу в docker-compose.yml просто задать контейнер с ним и вшить в него конфигурацию.

Shamil
24.09.2018
17:05:04
У докера есть встроенный драйвер fluentd

И церкви логов нет, я проверил, прежде чем здесь спросить (-:

M
24.09.2018
17:07:21
не делай так как ты хотел, лучше переосмысли ещё немного и ты все поймёшь.

Shamil
24.09.2018
17:09:14
https://t.me/ru_logs
Спасибо! Буду там людей мучать

Там 35 человек, что то мне подсказывает, что буду долго ждать.

evix
24.09.2018
17:17:48
Да я знаю, что мертв, но мигрировать на кубик, нет ресурсов, вот и выкручиваюсь по-колхозному.
ну вот кадвизор и будет нормальный такой колхоз. он тебе отдаст метрики всех контейнеров на ноде. либо ты ставишь кубер и он уже сам экспозит или отправляет

других примеров не знаю

Shamil
24.09.2018
17:20:31
А вот, тогда по топику вопрос: есть микросервис который крутится в сворме и когда я сделал агрегацию логов, мы заметили, что раз/два в минуту он слишком медленно обрабатывает запросы, начали тестировать сделали простую нагрузку через JMeter и обнаружили что тупит не только он, но и другие сервисы, которые находятся в сворме, потом начали копать дальше и поняли, что-то не так с сетью, но где не так, мы понять не можем. Какими средствами можно проверить узкие места в сети? iperf3, qperf как я понял, не подходят.

evix
24.09.2018
17:21:31
точно не с диском?

.
24.09.2018
17:21:55
а чего айперф не подходит-то

просто выбери эндпоинты с умом

Google
evix
24.09.2018
17:22:40
с вопросом "что-то не так с сетью" к сетевикам лучше вообще не ходить

.
24.09.2018
17:22:55
или стрельни у корешей анализатор трафика

Shamil
24.09.2018
17:25:53
точно не с диском?
Точно не с диском проблемы, уже и так и эдак делали.

Psy
24.09.2018
17:27:06
Вопрос по экспортеру рэбита. Подгружен он плагином, кролик в кластере, плагин светится только на одной какой-то ноде, если одну из нод рестартнуть, то плагины переезжают на неё, соответственно метрики уже по другому адресу. Кто как мониторит кролокластер?

Psy
24.09.2018
17:33:12
Andrey
24.09.2018
17:34:03
В этот момент я понял, что разучился думать об обычной инфраструктуре и растворяюсь в туман в раздумьях.

Psy
24.09.2018
18:19:27
Andor
24.09.2018
18:24:59
Psy
24.09.2018
18:26:13
Почему?
Только на одном даёт поднять. Хотя могу конечно ошибаться, но вроде так

Bogdan (SirEdvin)
24.09.2018
18:30:57
Можно поднять стенд-елоун експортер который на всех нодах

GithubReleases
24.09.2018
18:36:17
influxdata/telegraf was tagged: 1.8.0 Link: https://github.com/influxdata/telegraf/releases/tag/1.8.0 Release notes: ### New Inputs * [activemq](/influxdata/telegraf/blob/1.8.0/plugins/inputs/activemq/README.md) - Contributed by [@mlabouardy](https://github.com/mlabouardy) * [beanstalkd](/influxdata/telegraf/blob/1.8.0/plugins/inputs/beanstalkd/README.md) - Co... More

Psy
24.09.2018
18:42:28
Можно поднять стенд-елоун експортер который на всех нодах
Стэндэлон? А как? От использования планига этож не избавит

Bogdan (SirEdvin)
24.09.2018
18:43:09
Стэндэлон? А как? От использования планига этож не избавит
Там нужен только менеджер агент, его можно запустить на всех узлах

Psy
24.09.2018
18:43:42
Благодарю, попробую

Google
Roman
24.09.2018
19:55:17
Собрал из carbonapi рисовалку PNG для прометея https://github.com/lomik/prometheus-png

Admin
ERROR: S client not available

Alex
24.09.2018
19:56:52
Sergey
24.09.2018
20:00:03
поток логов большой если не секрет? еластик не захлебывается?

Alex
25.09.2018
04:57:39
поток логов большой если не секрет? еластик не захлебывается?
Не очень большой. Около 47 гигов логов в сутки

Метрик собирается на порядок больше

Sergey
25.09.2018
06:11:25
Не очень большой. Около 47 гигов логов в сутки
Ясно, спасибо! А метрики чем храните?

Alex
25.09.2018
06:11:34
Тоже в Эластике

Sergey
25.09.2018
06:12:19
ух...и какая конфигурация кластера еластика нужна, допустим хранить последний месяц метрик и логов ?

на данных обьемах

Andor
25.09.2018
06:12:32
это оффтоп

Sergey
25.09.2018
06:12:57
метрики же

Andor
25.09.2018
06:13:20
лучше в чате эластика спросить

terry
25.09.2018
06:17:19
тебе в церковь логов, это рядом
адрес дайте пожалуйста )

Andor
25.09.2018
06:18:51
https://t.me/ru_logs

terry
25.09.2018
06:35:26
Maxim
25.09.2018
08:59:30
Всем привет! Есть запрос на очень оперативную разработку в Grafana. Кто готов взяться за работу, напишите в ЛС. Необходимо сделать 3 дашборда, Физически есть объект теплица, она разбита на 2 секции в каждой секции стоит несколько датчиков, типов датчиков всего 3 (температура, влажность, фотосинтез) 1. Необходимо собрать агрегирующий дашборд по 2-м секциям, который объединит средние показатели (температура, влажность...) по всем секциям теплицы 2. Дашборд на уровне секции 1 необходимо показать средние показатели по секции, а также графики по каждому из типов датчиков, так как датчиков по одному типу может быть несколько их необходимо сгруппировать 3. Дашборд на уровне секции 2 необходимо показать средние показатели по секции, а также графики по каждому из типов датчиков, так как датчиков по одному типу может быть несколько их необходимо сгруппировать 4. Переход от общего дашборда по вкладкам желательно разбить на вкладки 5. БД источника данных Postgresql 6. Есть временные ограничения на выполнения работы, нужен человек который имеет опыт работы с Grafana и сможет помочь быстро набросать дашборды и подсказать возможности визуализации тех или иных показателей.

Kirill
25.09.2018
09:25:49
тебе в devops_jobs наверное

Google
Maxim
25.09.2018
09:32:30
спс

Konstantin
25.09.2018
09:32:56
Хорошая теплица

Wom
25.09.2018
09:49:24
ppl, есть вопрос. скорее всего от слабого знания документации. есть у меня для хоста posqtgresql cо streaming репликацией. psql01, psql02. postgres_exporter кидает данные мониторинга в прометей. я хочу в графане построить 1 дашбоард, а котором некоторые панели будут с обоих хостов, а некторые - с конкретного. указывать руками psql01, psql02 я не хочу. мастер-хост определяется по pg_replication_lag == NaN. могу ли я как-то это условие использовать, чтобы определять панели? Или я просто не в ту сторону думаю?

Wom
25.09.2018
10:08:30
и разрешить Include All option
пасиб. попробую

Страница 648 из 681