@metrics_ru

Страница 524 из 681
Pablo
27.04.2018
11:41:03
посмотрим через месяцок чо там с утечками
не у всех кстатит течет но у большинства видимо все таки

Google
Fedor
27.04.2018
13:24:57
особенно текло при мсскуле

Vyacheslav
27.04.2018
13:31:51
особенно текло при мсскуле
До версии 1.6 плагин mssql - кошмарный ад, который я бы не рекомендовал использовать вообще. С 1.6 - более менее, пока стабилен.

Alexander
27.04.2018
14:27:53
Telegraf в docker всю неделю занимает 11Мб, в WinServer занимает 20Мб. Возможно от наличия плагинов и зависит.

http://docs.grafana.org/installation/docker/#migration-from-a-previous-version-of-the-docker-container-to-5-1-or-later

Vadim
27.04.2018
15:38:44
Добрый день. У меня есть кластер k8s, и отдельно стоящий prometheus/graphana, мне нужно из prometheus скрапить метрики приложения запущенного внутри k8s. Я вроде бы настроил kubernetes_sd_config, но приложение - воркеры использует внутренние адреса 10.x.x.x и prometheus не может законектится тк он стоит отдельно. Как вообще это обычно решается ?

Deep Sea
27.04.2018
15:51:45
прометеус внутри кластера + федерация

Artem
27.04.2018
15:53:03
обычно это костылится)

Vadim
27.04.2018
15:54:19
? спасибо, сейчас буду пихать prometheus в k8s

yuyu
27.04.2018
16:15:09
Нубовский вопрос: у прометея дефолтный порт 9000 можно только через флаг при запуске назначать или как то ещё? В конфиге его можно задать? Что-то не могу в доках найти про это.

Алексей
27.04.2018
16:15:36
да только с консоли

yuyu
27.04.2018
16:18:30
да только с консоли
Печально и странно. Казалось бы: по любому конфиг читать надо - вот туда бы запрятать...

Google
Алексей
27.04.2018
16:20:02
слкадывается впечателение что логика такая. не может сделать reload параметра на лету значит в ключи запуска

Denys ??
27.04.2018
17:40:36
Она закидывает скрин панели в webDav , получает ссылку, и скидывает эту ссылку в слак. WebDav должен быть расшаренный для слака.
В 5й графане можно добавить токен на бота с правами на аплоад файла - он будет загружать картинку в слак

Kirill
27.04.2018
17:48:10
? спасибо, сейчас буду пихать prometheus в k8s
helm install stable/prometheus Рекоммендую. Сильно упрощает жизнь. Только надо ему аккуратно helm values набрать.

Andor
27.04.2018
17:49:40
prometheus-operator

Andor
27.04.2018
18:00:13
https://github.com/coreos/prometheus-operator

Kirill
27.04.2018
18:02:50
Andor а что, в продакшене пробовал? Я только на миникубе его ставил. Операторы крутая тема, но лично мне как-то спокойнее, когда мониторинг мной лично настроен. @vvatlin зацени тоже ^ может быть тебе понравится.

Andor
27.04.2018
18:03:35
ну никто не мешает тебе лично использовать его же для твоих нужд

Kirill
27.04.2018
18:05:03
Мне показалось, что не очень круто будет, когда у тебя ворох ServiceMonitor нужно еще описать.

Sergey
27.04.2018
20:29:29
чуть запоздало подключусь про агенты, а кто то pcp мучал?

Валерий
27.04.2018
20:44:30
Господа а посоветуйте инструменты для сбора perf counters с windows машин. Сейчас пользуемся Zabbix, но это не очень удобно , приходится руками настраивать каждую метрику отдельно , а потом еще счетчик для нее в заббиксе . Может есть готовые инструменты чтобы экспортировать имеющиеся на системах windows data collections set например в Grafana ?

Paul
27.04.2018
20:46:17
node_exporter для prometeus вам не подойдет?

я не ставил его на винду, но вроде бы там он работает

Alexander
27.04.2018
20:50:40
Подскажите где мапинг значений задается в таблице http://docs.grafana.org/v5.1/features/panels/table_panel/#string

Нашел, надо выбирать тип String

Валерий
27.04.2018
21:07:06
node_exporter для prometeus вам не подойдет?
Спасибо , посмотрю подробней. Беглый взгляд подсказывает что оно умеет только те счетчики которые в него зашиты, мне же надо разные , ту же группу sql сервер.

Paul
27.04.2018
21:13:45
sql-server - самостоятельная система, в идеологии prometeheus ее должен измерять отдельный сервис

Dmitry
27.04.2018
21:42:59
sql-server - самостоятельная система, в идеологии prometeheus ее должен измерять отдельный сервис
То есть если у меня на хосте sql, mongo и slurm мне дополнительно 3 бинаря запускать к ним? (пардон за нубский вопрос)

Google
Paul
27.04.2018
21:45:32
да, именно так. Потому как сервисы независимые и каждый мониторится независимо

Dmitry
27.04.2018
21:53:12
да, именно так. Потому как сервисы независимые и каждый мониторится независимо
а для короткоживущих вещей? типа джобов (ну или докеров)

evix
27.04.2018
23:37:19
пусть сами отправляют

Dmitry
28.04.2018
00:46:02
пусть сами отправляют
Хорошо бы, но не прокатит. Это будут пользовательские джобы в slurm. Пользователям до фени этот мониторинг. Это может древнее говно писаное на фортране.

Andor
28.04.2018
00:46:42
а тебе тогда почему не пофиг?

Dmitry
28.04.2018
00:48:13
а тебе тогда почему не пофиг?
Совестливый очень. На самом деле нет. Но хочется некоторую пользу нанести и причинить радость.

Andor
28.04.2018
00:49:44
ну ты от задачи/проблемы начинай какую задачу/пробелему ты хочешь решить?

Dmitry
28.04.2018
00:49:46
Просто потом эти пользователи приходят и жалуются что у них все считается медленно. Ну вот и тут им бы и показать графики - типа смотрите, у вас все на одном ядре на первой ноде крутится. Даром что вы аллоцировали 100 нод по 48 ядер в каждом

Andor
28.04.2018
00:49:51
ты сказал, что пользователям пофиг на твой мониторинг

Dmitry
28.04.2018
00:55:04
Сейчас мониторинг - это хелсчекинг, типа рейд развалился. PSU отвалился, вентилятор помер. Хочется что-то поинтереснее. Дело в том что мы продаем HPC кластеры по нескольку штук в месяц, Поэтому построить что-то полезное которое поможет продать больше очень хочется. И как бы даже есть место где можно применить, но вот как это сделать пока не очень понятно.

vladimir
28.04.2018
03:59:40
Сейчас мониторинг - это хелсчекинг, типа рейд развалился. PSU отвалился, вентилятор помер. Хочется что-то поинтереснее. Дело в том что мы продаем HPC кластеры по нескольку штук в месяц, Поэтому построить что-то полезное которое поможет продать больше очень хочется. И как бы даже есть место где можно применить, но вот как это сделать пока не очень понятно.
По моему скромному мнению, мониторить кучу кластеров принадлежащих сторонним организациям можно двумя способами: 1. Набирайте отдел мониторинга, с разрабами, админами и тех поддержкой, и развивайте свои компетенции 2. Для каждого вашего клиента покупайте уже готовые решения мониторинга систем у компании которые этим профессионально занимаются, к примеру у okMeter.io

Валерий
28.04.2018
04:18:55
sql-server - самостоятельная система, в идеологии prometeheus ее должен измерять отдельный сервис
Ок, но в список не попало большая часть счетчиков самой windows, а в то де время есть отдельная независимая система Ad ds.

Sergey
28.04.2018
06:46:49
Мучал немного.
как очучения? collectd new age? течет не течет и все такое

Валерий
28.04.2018
07:42:45
Для винды вроде wmi_exporter
Да, спасибо , я его и смотрел.

Телеграф + графана?
Думал над таким вариантом, но насколько я понимаю , для того чтобы telegraf смог читать perf_counter ему в конфигурации нужно их все прописать , т.е. примерно тоже самое что в Zabbix получается.

Nklya
28.04.2018
07:46:52
графана показывает то что ей отдают другие системы

телеграф собирает данные и отправляет в разные системы

В фразе Телеграф + графана что-то потерялось определенно

Google
Вадим
28.04.2018
07:48:15
Буква "о". "Во фразе".

Она и потерялась. ;)

Валерий
28.04.2018
07:50:46
influxdb , но это вроде понятно из конетксат

Моя боль в общем чтобы не писать https://github.com/influxdata/telegraf/tree/master/plugins/inputs/win_perf_counters вот такие конфигурации для telegraf \zabbix а как то генерировать их на базе уже существующих в система data collection set

Admin
ERROR: S client not available

Nklya
28.04.2018
07:52:56
телеграф умеет и в пром например

evix
28.04.2018
07:56:02
флюентд умеет и в пром метрики, и логи в эластик отправлять

Евгений
28.04.2018
07:56:40
телеграф умеет и в пром например
И кликхаус-плагин есть

Deep Sea
28.04.2018
07:58:13
флюентд умеет и в пром метрики, и логи в эластик отправлять
только вот нельзя сделать чтоб каунтер не инкрементировался если определённого ключа нет

yuyu
28.04.2018
08:23:12
И кликхаус-плагин есть
Для телеграфа? Это где такой?

Евгений
28.04.2018
08:25:00
https://github.com/r3nic1e/telegraf-clickhouse-plugin

Evgeny
28.04.2018
08:27:30
Моя боль в общем чтобы не писать https://github.com/influxdata/telegraf/tree/master/plugins/inputs/win_perf_counters вот такие конфигурации для telegraf \zabbix а как то генерировать их на базе уже существующих в система data collection set
Тут я даже соглашусь, что в системе на Z это достаточно удобно реализовано, хочешь добавить счётчиков - вешаешь шаблон через web интерфейс и метрики пошли собираться. В системе с prom, telegraf- зайди на хост и поправь конфиг - это не очень конечно.

Nklya
28.04.2018
08:42:40
Наши деды еще руками все делали))

Evgeny
28.04.2018
08:42:47
Ansible Puppet Chef что там ещё? Зачем руками то?
Да конечно это все можно, я не буду спорить. Но если можно этого не делать, я бы предпочёл этого не делать.

Andrew
28.04.2018
08:44:10
Добрый день друзья подскажите пожалуйста как можно в influxdb получить примерно такой результат %MEASUREMENT% и все теги и поля которые есть в этом MEASUREMENT

Валерий
28.04.2018
08:51:27
Тут я даже соглашусь, что в системе на Z это достаточно удобно реализовано, хочешь добавить счётчиков - вешаешь шаблон через web интерфейс и метрики пошли собираться. В системе с prom, telegraf- зайди на хост и поправь конфиг - это не очень конечно.
Конкретно с perf_counter все не совсем так т.к. они чуть отличаются для каждой версии операционной системы + даже для локализованных ОС . Т.е. шаблоны ограниченно применимы. Короче тоже не все хорошо, никакого автоматического оперделения каунтеров в заббиксе тоже нет . Приходится городить на стороне агента все также как в telegraf

Валерий
28.04.2018
08:54:31
Не совсем, можно же использовать цифровые
Навреное да, вот только будут ли они перенсоимы между системами такие шаблоны ? И как в этом случае с экземплярами ? Например дисков или процессов которые мы мониторим ?

Т.е. шаблон полноценный не сделаешь думаю. Видел пару обсуждений в терекере забикса по LLD для perf_conter но насколько понимаю воз и ныне там. Либо ненужно никому либо

Google
Валерий
28.04.2018
08:58:33
Вполне себе переносимы, discovery никто не отменял
Можно пример такого шаблона ? Именно чтобы учитывались экземпляры ?

Alexander
28.04.2018
09:15:26
как очучения? collectd new age? течет не течет и все такое
Утечек не заметил. Функционально он богаче, чем collectd в плане распределенного сбора метрик, визуализации и реакции на изменения, но если нужен только сбор на отдельной машине,, а все остальное планируется закрывать другими инструментами, то я принципиальной разницы не заметил.

Sergey
28.04.2018
09:23:19
Ну я уже придумал идею прокси между графаной и карбонапи - чтобы можно было онлайн метрики смотреть не те которые зашиты в конфиге посылки а прям любые (эдакий vector но с центральным входом в виде графаны и графит функций). До этого глядел в сторону snapteld но он по ощущениям менее production ready, хотя и чуть более свежие технологии использует.

http://pcp.io/

ее краснашапка сейчас взяла в оборот и начала толкать

к нему вот такой лайт фронт есть http://getvector.io/ и вот такая штуковина (только в RH перепаковке) http://cockpit-project.org/ использует в качестве поставщика метрик

Dorian
28.04.2018
09:32:53
кто-то blackbox мониторит DNS ?

Не могу разобраться как несколько хостов пробить?

с разными модулями таки это возможно

Evgeny
28.04.2018
15:32:00
поругайте статью, если не лень - http://akumuli.org/akumuli/2018/04/28/scaleable-downsampling/

Vit
28.04.2018
18:28:08
Как и обещал - анонс митапа про мониторинг от DevOps Moscow. Мониторинг(prom) облака(k8s) от Авито, автодискавери метрик от Окметра, Инцидент-менеджмент от Badoo https://devops-moscow.timepad.ru/event/712678/

Aleksandr
28.04.2018
18:36:41
спасиб

Страница 524 из 681