@metrics_ru

« Назад

Страница 524 из 681

Далее »

Pablo

27.04.2018
11:41:03

посмотрим через месяцок чо там с утечками

не у всех кстатит течет но у большинства видимо все таки

Saykhan

27.04.2018
11:43:08

1) подумай что именно в бизнес-процессах тебя интересует 2) подумай ещё раз 3) подумай как собирать метрики по бизнес-процессам 4) сделай

Спасибо, подумаю над этим

Fedor

27.04.2018
13:24:22

Telegraf 1.4.3/1.6.1, CentOS 6/7, Ubuntu 16.04, Win 7-2018, системные метрики/Docker/IIS/MSSQL/JBOSS/Oracle - всего 300+ хостов, не течет, есть пара мелких косяков, можно использовать спокойно.

текло текло

настолько, при пришлось от него отказаться

Google

Fedor

27.04.2018
13:24:57

особенно текло при мсскуле

Vyacheslav

27.04.2018
13:31:51

особенно текло при мсскуле

До версии 1.6 плагин mssql - кошмарный ад, который я бы не рекомендовал использовать вообще. С 1.6 - более менее, пока стабилен.

Fedor

27.04.2018
13:35:14

До версии 1.6 плагин mssql - кошмарный ад, который я бы не рекомендовал использовать вообще. С 1.6 - более менее, пока стабилен.

спасибо!

Alexander

27.04.2018
14:27:53

До версии 1.6 плагин mssql - кошмарный ад, который я бы не рекомендовал использовать вообще. С 1.6 - более менее, пока стабилен.

У них с 1.6 вторая версия плагина используется.

Telegraf в docker всю неделю занимает 11Мб, в WinServer занимает 20Мб. Возможно от наличия плагинов и зависит.

http://docs.grafana.org/installation/docker/#migration-from-a-previous-version-of-the-docker-container-to-5-1-or-later

Vadim

27.04.2018
15:38:44

Добрый день. У меня есть кластер k8s, и отдельно стоящий prometheus/graphana, мне нужно из prometheus скрапить метрики приложения запущенного внутри k8s. Я вроде бы настроил kubernetes_sd_config, но приложение - воркеры использует внутренние адреса 10.x.x.x и prometheus не может законектится тк он стоит отдельно. Как вообще это обычно решается ?

Deep Sea

27.04.2018
15:51:45

прометеус внутри кластера + федерация

Artem

27.04.2018
15:53:03

обычно это костылится)

Vadim

27.04.2018
15:54:19

? спасибо, сейчас буду пихать prometheus в k8s

yuyu

27.04.2018
16:15:09

Нубовский вопрос: у прометея дефолтный порт 9000 можно только через флаг при запуске назначать или как то ещё? В конфиге его можно задать? Что-то не могу в доках найти про это.

Алексей

27.04.2018
16:15:36

да только с консоли

yuyu

27.04.2018
16:18:30

да только с консоли

Печально и странно. Казалось бы: по любому конфиг читать надо - вот туда бы запрятать...

Google

Алексей

27.04.2018
16:20:02

слкадывается впечателение что логика такая. не может сделать reload параметра на лету значит в ключи запуска

Denys ??

27.04.2018
17:40:36

Она закидывает скрин панели в webDav , получает ссылку, и скидывает эту ссылку в слак. WebDav должен быть расшаренный для слака.

В 5й графане можно добавить токен на бота с правами на аплоад файла - он будет загружать картинку в слак

Kirill

27.04.2018
17:48:10

? спасибо, сейчас буду пихать prometheus в k8s

helm install stable/prometheus Рекоммендую. Сильно упрощает жизнь. Только надо ему аккуратно helm values набрать.

Andor

27.04.2018
17:49:40

prometheus-operator

Vadim

27.04.2018
17:58:51

helm install stable/prometheus Рекоммендую. Сильно упрощает жизнь. Только надо ему аккуратно helm values набрать.

Спасибо

Andor

27.04.2018
18:00:13

https://github.com/coreos/prometheus-operator

Kirill

27.04.2018
18:02:50

Andor а что, в продакшене пробовал? Я только на миникубе его ставил. Операторы крутая тема, но лично мне как-то спокойнее, когда мониторинг мной лично настроен. @vvatlin зацени тоже ^ может быть тебе понравится.

Andor

27.04.2018
18:03:35

ну никто не мешает тебе лично использовать его же для твоих нужд

Kirill

27.04.2018
18:05:03

Мне показалось, что не очень круто будет, когда у тебя ворох ServiceMonitor нужно еще описать.

Sergey

27.04.2018
20:29:29

чуть запоздало подключусь про агенты, а кто то pcp мучал?

отделение

27.04.2018
20:38:37

чуть запоздало подключусь про агенты, а кто то pcp мучал?

@iavael?

Валерий

27.04.2018
20:44:30

Господа а посоветуйте инструменты для сбора perf counters с windows машин. Сейчас пользуемся Zabbix, но это не очень удобно , приходится руками настраивать каждую метрику отдельно , а потом еще счетчик для нее в заббиксе . Может есть готовые инструменты чтобы экспортировать имеющиеся на системах windows data collections set например в Grafana ?

Paul

27.04.2018
20:46:17

node_exporter для prometeus вам не подойдет?

я не ставил его на винду, но вроде бы там он работает

Alexander

27.04.2018
20:50:40

Подскажите где мапинг значений задается в таблице http://docs.grafana.org/v5.1/features/panels/table_panel/#string

Нашел, надо выбирать тип String

Валерий

27.04.2018
21:07:06

node_exporter для prometeus вам не подойдет?

Спасибо , посмотрю подробней. Беглый взгляд подсказывает что оно умеет только те счетчики которые в него зашиты, мне же надо разные , ту же группу sql сервер.

Paul

27.04.2018
21:13:45

sql-server - самостоятельная система, в идеологии prometeheus ее должен измерять отдельный сервис

Alexander

27.04.2018
21:23:37

чуть запоздало подключусь про агенты, а кто то pcp мучал?

Мучал немного.

Dmitry

27.04.2018
21:42:59

sql-server - самостоятельная система, в идеологии prometeheus ее должен измерять отдельный сервис

То есть если у меня на хосте sql, mongo и slurm мне дополнительно 3 бинаря запускать к ним? (пардон за нубский вопрос)

Google

Paul

27.04.2018
21:45:32

да, именно так. Потому как сервисы независимые и каждый мониторится независимо

Dmitry

27.04.2018
21:53:12

да, именно так. Потому как сервисы независимые и каждый мониторится независимо

а для короткоживущих вещей? типа джобов (ну или докеров)

evix

27.04.2018
23:37:19

пусть сами отправляют

Dmitry

28.04.2018
00:46:02

пусть сами отправляют

Хорошо бы, но не прокатит. Это будут пользовательские джобы в slurm. Пользователям до фени этот мониторинг. Это может древнее говно писаное на фортране.

Andor

28.04.2018
00:46:42

а тебе тогда почему не пофиг?

Dmitry

28.04.2018
00:48:13

а тебе тогда почему не пофиг?

Совестливый очень. На самом деле нет. Но хочется некоторую пользу нанести и причинить радость.

Andor

28.04.2018
00:49:44

ну ты от задачи/проблемы начинай какую задачу/пробелему ты хочешь решить?

Dmitry

28.04.2018
00:49:46

Просто потом эти пользователи приходят и жалуются что у них все считается медленно. Ну вот и тут им бы и показать графики - типа смотрите, у вас все на одном ядре на первой ноде крутится. Даром что вы аллоцировали 100 нод по 48 ядер в каждом

Andor

28.04.2018
00:49:51

ты сказал, что пользователям пофиг на твой мониторинг

Dmitry

28.04.2018
00:55:04

Сейчас мониторинг - это хелсчекинг, типа рейд развалился. PSU отвалился, вентилятор помер. Хочется что-то поинтереснее. Дело в том что мы продаем HPC кластеры по нескольку штук в месяц, Поэтому построить что-то полезное которое поможет продать больше очень хочется. И как бы даже есть место где можно применить, но вот как это сделать пока не очень понятно.

vladimir

28.04.2018
03:59:40

Сейчас мониторинг - это хелсчекинг, типа рейд развалился. PSU отвалился, вентилятор помер. Хочется что-то поинтереснее. Дело в том что мы продаем HPC кластеры по нескольку штук в месяц, Поэтому построить что-то полезное которое поможет продать больше очень хочется. И как бы даже есть место где можно применить, но вот как это сделать пока не очень понятно.

По моему скромному мнению, мониторить кучу кластеров принадлежащих сторонним организациям можно двумя способами: 1. Набирайте отдел мониторинга, с разрабами, админами и тех поддержкой, и развивайте свои компетенции 2. Для каждого вашего клиента покупайте уже готовые решения мониторинга систем у компании которые этим профессионально занимаются, к примеру у okMeter.io

Валерий

28.04.2018
04:18:55

sql-server - самостоятельная система, в идеологии prometeheus ее должен измерять отдельный сервис

Ок, но в список не попало большая часть счетчиков самой windows, а в то де время есть отдельная независимая система Ad ds.

Sergey

28.04.2018
06:46:49

Мучал немного.

как очучения? collectd new age? течет не течет и все такое

Bogdan (SirEdvin)

28.04.2018
06:50:26

Спасибо , посмотрю подробней. Беглый взгляд подсказывает что оно умеет только те счетчики которые в него зашиты, мне же надо разные , ту же группу sql сервер.

Для винды вроде wmi_exporter

Alexander

28.04.2018
07:18:21

Господа а посоветуйте инструменты для сбора perf counters с windows машин. Сейчас пользуемся Zabbix, но это не очень удобно , приходится руками настраивать каждую метрику отдельно , а потом еще счетчик для нее в заббиксе . Может есть готовые инструменты чтобы экспортировать имеющиеся на системах windows data collections set например в Grafana ?

Телеграф + графана?

Валерий

28.04.2018
07:42:45

Для винды вроде wmi_exporter

Да, спасибо , я его и смотрел.

Телеграф + графана?

Думал над таким вариантом, но насколько я понимаю , для того чтобы telegraf смог читать perf_counter ему в конфигурации нужно их все прописать , т.е. примерно тоже самое что в Zabbix получается.

Nklya

28.04.2018
07:46:52

графана показывает то что ей отдают другие системы

телеграф собирает данные и отправляет в разные системы

В фразе Телеграф + графана что-то потерялось определенно

Google

Вадим

28.04.2018
07:48:15

Буква "о". "Во фразе".

Она и потерялась. ;)

Валерий

28.04.2018
07:50:46

influxdb , но это вроде понятно из конетксат

Моя боль в общем чтобы не писать https://github.com/influxdata/telegraf/tree/master/plugins/inputs/win_perf_counters вот такие конфигурации для telegraf \zabbix а как то генерировать их на базе уже существующих в система data collection set

Admin

ERROR: S client not available

Nklya

28.04.2018
07:52:56

телеграф умеет и в пром например

evix

28.04.2018
07:56:02

флюентд умеет и в пром метрики, и логи в эластик отправлять

Евгений

28.04.2018
07:56:40

телеграф умеет и в пром например

И кликхаус-плагин есть

Deep Sea

28.04.2018
07:58:13

флюентд умеет и в пром метрики, и логи в эластик отправлять

только вот нельзя сделать чтоб каунтер не инкрементировался если определённого ключа нет

yuyu

28.04.2018
08:23:12

И кликхаус-плагин есть

Для телеграфа? Это где такой?

Евгений

28.04.2018
08:25:00

https://github.com/r3nic1e/telegraf-clickhouse-plugin

Evgeny

28.04.2018
08:27:30

Моя боль в общем чтобы не писать https://github.com/influxdata/telegraf/tree/master/plugins/inputs/win_perf_counters вот такие конфигурации для telegraf \zabbix а как то генерировать их на базе уже существующих в система data collection set

Тут я даже соглашусь, что в системе на Z это достаточно удобно реализовано, хочешь добавить счётчиков - вешаешь шаблон через web интерфейс и метрики пошли собираться. В системе с prom, telegraf- зайди на хост и поправь конфиг - это не очень конечно.

Alexey

28.04.2018
08:39:23

Тут я даже соглашусь, что в системе на Z это достаточно удобно реализовано, хочешь добавить счётчиков - вешаешь шаблон через web интерфейс и метрики пошли собираться. В системе с prom, telegraf- зайди на хост и поправь конфиг - это не очень конечно.

Ansible Puppet Chef что там ещё? Зачем руками то?

Nklya

28.04.2018
08:42:40

Наши деды еще руками все делали))

Evgeny

28.04.2018
08:42:47

Ansible Puppet Chef что там ещё? Зачем руками то?

Да конечно это все можно, я не буду спорить. Но если можно этого не делать, я бы предпочёл этого не делать.

Andrew

28.04.2018
08:44:10

Добрый день друзья подскажите пожалуйста как можно в influxdb получить примерно такой результат %MEASUREMENT% и все теги и поля которые есть в этом MEASUREMENT

Валерий

28.04.2018
08:51:27

Тут я даже соглашусь, что в системе на Z это достаточно удобно реализовано, хочешь добавить счётчиков - вешаешь шаблон через web интерфейс и метрики пошли собираться. В системе с prom, telegraf- зайди на хост и поправь конфиг - это не очень конечно.

Конкретно с perf_counter все не совсем так т.к. они чуть отличаются для каждой версии операционной системы + даже для локализованных ОС . Т.е. шаблоны ограниченно применимы. Короче тоже не все хорошо, никакого автоматического оперделения каунтеров в заббиксе тоже нет . Приходится городить на стороне агента все также как в telegraf

Evgeny

28.04.2018
08:52:47

Конкретно с perf_counter все не совсем так т.к. они чуть отличаются для каждой версии операционной системы + даже для локализованных ОС . Т.е. шаблоны ограниченно применимы. Короче тоже не все хорошо, никакого автоматического оперделения каунтеров в заббиксе тоже нет . Приходится городить на стороне агента все также как в telegraf

Не совсем, можно же использовать цифровые

Валерий

28.04.2018
08:54:31

Не совсем, можно же использовать цифровые

Навреное да, вот только будут ли они перенсоимы между системами такие шаблоны ? И как в этом случае с экземплярами ? Например дисков или процессов которые мы мониторим ?

Т.е. шаблон полноценный не сделаешь думаю. Видел пару обсуждений в терекере забикса по LLD для perf_conter но насколько понимаю воз и ныне там. Либо ненужно никому либо

Google

Evgeny

28.04.2018
08:56:31

Навреное да, вот только будут ли они перенсоимы между системами такие шаблоны ? И как в этом случае с экземплярами ? Например дисков или процессов которые мы мониторим ?

Вполне себе переносимы, discovery никто не отменял

Валерий

28.04.2018
08:58:33

Вполне себе переносимы, discovery никто не отменял

Можно пример такого шаблона ? Именно чтобы учитывались экземпляры ?

Alexander

28.04.2018
09:15:26

как очучения? collectd new age? течет не течет и все такое

Утечек не заметил. Функционально он богаче, чем collectd в плане распределенного сбора метрик, визуализации и реакции на изменения, но если нужен только сбор на отдельной машине,, а все остальное планируется закрывать другими инструментами, то я принципиальной разницы не заметил.

Andrey

28.04.2018
09:21:32

Утечек не заметил. Функционально он богаче, чем collectd в плане распределенного сбора метрик, визуализации и реакции на изменения, но если нужен только сбор на отдельной машине,, а все остальное планируется закрывать другими инструментами, то я принципиальной разницы не заметил.

а чего за зверь такой?

Sergey

28.04.2018
09:23:19

Ну я уже придумал идею прокси между графаной и карбонапи - чтобы можно было онлайн метрики смотреть не те которые зашиты в конфиге посылки а прям любые (эдакий vector но с центральным входом в виде графаны и графит функций). До этого глядел в сторону snapteld но он по ощущениям менее production ready, хотя и чуть более свежие технологии использует.

http://pcp.io/

ее краснашапка сейчас взяла в оборот и начала толкать

к нему вот такой лайт фронт есть http://getvector.io/ и вот такая штуковина (только в RH перепаковке) http://cockpit-project.org/ использует в качестве поставщика метрик

Dorian

28.04.2018
09:32:53

кто-то blackbox мониторит DNS ?

Не могу разобраться как несколько хостов пробить?

с разными модулями таки это возможно

Evgeny

28.04.2018
15:32:00

поругайте статью, если не лень - http://akumuli.org/akumuli/2018/04/28/scaleable-downsampling/

Vit

28.04.2018
18:28:08

Как и обещал - анонс митапа про мониторинг от DevOps Moscow. Мониторинг(prom) облака(k8s) от Авито, автодискавери метрик от Окметра, Инцидент-менеджмент от Badoo https://devops-moscow.timepad.ru/event/712678/

Aleksandr

28.04.2018
18:36:41

спасиб

« Назад

Страница 524 из 681

Далее »

Открыть в Telegram