
Pablo
27.04.2018
11:41:03

Saykhan
27.04.2018
11:43:08

Fedor
27.04.2018
13:24:22
настолько, при пришлось от него отказаться

Google

Fedor
27.04.2018
13:24:57
особенно текло при мсскуле

Vyacheslav
27.04.2018
13:31:51
особенно текло при мсскуле
До версии 1.6 плагин mssql - кошмарный ад, который я бы не рекомендовал использовать вообще. С 1.6 - более менее, пока стабилен.

Fedor
27.04.2018
13:35:14

Alexander
27.04.2018
14:27:53
Telegraf в docker всю неделю занимает 11Мб, в WinServer занимает 20Мб. Возможно от наличия плагинов и зависит.
http://docs.grafana.org/installation/docker/#migration-from-a-previous-version-of-the-docker-container-to-5-1-or-later

Vadim
27.04.2018
15:38:44
Добрый день. У меня есть кластер k8s, и отдельно стоящий prometheus/graphana, мне нужно из prometheus скрапить метрики приложения запущенного внутри k8s. Я вроде бы настроил kubernetes_sd_config, но приложение - воркеры использует внутренние адреса 10.x.x.x и prometheus не может законектится тк он стоит отдельно. Как вообще это обычно решается ?

Deep Sea
27.04.2018
15:51:45
прометеус внутри кластера + федерация

Artem
27.04.2018
15:53:03
обычно это костылится)

Vadim
27.04.2018
15:54:19
? спасибо, сейчас буду пихать prometheus в k8s

yuyu
27.04.2018
16:15:09
Нубовский вопрос: у прометея дефолтный порт 9000 можно только через флаг при запуске назначать или как то ещё? В конфиге его можно задать? Что-то не могу в доках найти про это.

Алексей
27.04.2018
16:15:36
да только с консоли

yuyu
27.04.2018
16:18:30
да только с консоли
Печально и странно. Казалось бы: по любому конфиг читать надо - вот туда бы запрятать...

Google

Алексей
27.04.2018
16:20:02
слкадывается впечателение что логика такая. не может сделать reload параметра на лету значит в ключи запуска

Denys ??
27.04.2018
17:40:36

Kirill
27.04.2018
17:48:10

Andor
27.04.2018
17:49:40
prometheus-operator

Vadim
27.04.2018
17:58:51

Andor
27.04.2018
18:00:13
https://github.com/coreos/prometheus-operator

Kirill
27.04.2018
18:02:50
Andor а что, в продакшене пробовал? Я только на миникубе его ставил. Операторы крутая тема, но лично мне как-то спокойнее, когда мониторинг мной лично настроен.
@vvatlin зацени тоже ^ может быть тебе понравится.

Andor
27.04.2018
18:03:35
ну никто не мешает тебе лично использовать его же для твоих нужд

Kirill
27.04.2018
18:05:03
Мне показалось, что не очень круто будет, когда у тебя ворох ServiceMonitor нужно еще описать.

Sergey
27.04.2018
20:29:29
чуть запоздало подключусь про агенты, а кто то pcp мучал?

отделение
27.04.2018
20:38:37

Валерий
27.04.2018
20:44:30
Господа а посоветуйте инструменты для сбора perf counters с windows машин. Сейчас пользуемся Zabbix, но это не очень удобно , приходится руками настраивать каждую метрику отдельно , а потом еще счетчик для нее в заббиксе . Может есть готовые инструменты чтобы экспортировать имеющиеся на системах windows data collections set например в Grafana ?

Paul
27.04.2018
20:46:17
node_exporter для prometeus вам не подойдет?
я не ставил его на винду, но вроде бы там он работает

Alexander
27.04.2018
20:50:40
Подскажите где мапинг значений задается в таблице http://docs.grafana.org/v5.1/features/panels/table_panel/#string
Нашел, надо выбирать тип String

Валерий
27.04.2018
21:07:06

Paul
27.04.2018
21:13:45
sql-server - самостоятельная система, в идеологии prometeheus ее должен измерять отдельный сервис

Alexander
27.04.2018
21:23:37

Dmitry
27.04.2018
21:42:59

Google

Paul
27.04.2018
21:45:32
да, именно так. Потому как сервисы независимые и каждый мониторится независимо

Dmitry
27.04.2018
21:53:12

evix
27.04.2018
23:37:19
пусть сами отправляют

Dmitry
28.04.2018
00:46:02
пусть сами отправляют
Хорошо бы, но не прокатит. Это будут пользовательские джобы в slurm. Пользователям до фени этот мониторинг. Это может древнее говно писаное на фортране.

Andor
28.04.2018
00:46:42
а тебе тогда почему не пофиг?

Dmitry
28.04.2018
00:48:13

Andor
28.04.2018
00:49:44
ну ты от задачи/проблемы начинай
какую задачу/пробелему ты хочешь решить?

Dmitry
28.04.2018
00:49:46
Просто потом эти пользователи приходят и жалуются что у них все считается медленно. Ну вот и тут им бы и показать графики - типа смотрите, у вас все на одном ядре на первой ноде крутится. Даром что вы аллоцировали 100 нод по 48 ядер в каждом

Andor
28.04.2018
00:49:51
ты сказал, что пользователям пофиг на твой мониторинг

Dmitry
28.04.2018
00:55:04
Сейчас мониторинг - это хелсчекинг, типа рейд развалился. PSU отвалился, вентилятор помер. Хочется что-то поинтереснее. Дело в том что мы продаем HPC кластеры по нескольку штук в месяц, Поэтому построить что-то полезное которое поможет продать больше очень хочется. И как бы даже есть место где можно применить, но вот как это сделать пока не очень понятно.

vladimir
28.04.2018
03:59:40

Валерий
28.04.2018
04:18:55

Sergey
28.04.2018
06:46:49
Мучал немного.
как очучения? collectd new age? течет не течет и все такое

Bogdan (SirEdvin)
28.04.2018
06:50:26

Alexander
28.04.2018
07:18:21

Валерий
28.04.2018
07:42:45
Телеграф + графана?
Думал над таким вариантом, но насколько я понимаю , для того чтобы telegraf смог читать perf_counter ему в конфигурации нужно их все прописать , т.е. примерно тоже самое что в Zabbix получается.

Nklya
28.04.2018
07:46:52
графана показывает то что ей отдают другие системы
телеграф собирает данные и отправляет в разные системы
В фразе Телеграф + графана что-то потерялось определенно

Google

Вадим
28.04.2018
07:48:15
Буква "о". "Во фразе".
Она и потерялась. ;)

Валерий
28.04.2018
07:50:46
influxdb , но это вроде понятно из конетксат
Моя боль в общем чтобы не писать https://github.com/influxdata/telegraf/tree/master/plugins/inputs/win_perf_counters вот такие конфигурации для telegraf \zabbix а как то генерировать их на базе уже существующих в система data collection set

Admin
ERROR: S client not available

Nklya
28.04.2018
07:52:56
телеграф умеет и в пром например

evix
28.04.2018
07:56:02
флюентд умеет и в пром метрики, и логи в эластик отправлять

Евгений
28.04.2018
07:56:40

Deep Sea
28.04.2018
07:58:13

yuyu
28.04.2018
08:23:12

Евгений
28.04.2018
08:25:00
https://github.com/r3nic1e/telegraf-clickhouse-plugin

Evgeny
28.04.2018
08:27:30

Alexey
28.04.2018
08:39:23

Nklya
28.04.2018
08:42:40
Наши деды еще руками все делали))

Evgeny
28.04.2018
08:42:47

Andrew
28.04.2018
08:44:10
Добрый день друзья
подскажите пожалуйста
как можно в influxdb
получить примерно такой результат
%MEASUREMENT% и все теги и поля которые есть в этом MEASUREMENT

Валерий
28.04.2018
08:51:27

Evgeny
28.04.2018
08:52:47

Валерий
28.04.2018
08:54:31
Не совсем, можно же использовать цифровые
Навреное да, вот только будут ли они перенсоимы между системами такие шаблоны ? И как в этом случае с экземплярами ? Например дисков или процессов которые мы мониторим ?
Т.е. шаблон полноценный не сделаешь думаю. Видел пару обсуждений в терекере забикса по LLD для perf_conter но насколько понимаю воз и ныне там. Либо ненужно никому либо

Google

Evgeny
28.04.2018
08:56:31

Валерий
28.04.2018
08:58:33

Alexander
28.04.2018
09:15:26
как очучения? collectd new age? течет не течет и все такое
Утечек не заметил. Функционально он богаче, чем collectd в плане распределенного сбора метрик, визуализации и реакции на изменения, но если нужен только сбор на отдельной машине,, а все остальное планируется закрывать другими инструментами, то я принципиальной разницы не заметил.

Andrey
28.04.2018
09:21:32

Sergey
28.04.2018
09:23:19
Ну я уже придумал идею прокси между графаной и карбонапи - чтобы можно было онлайн метрики смотреть не те которые зашиты в конфиге посылки а прям любые (эдакий vector но с центральным входом в виде графаны и графит функций).
До этого глядел в сторону snapteld но он по ощущениям менее production ready, хотя и чуть более свежие технологии использует.
http://pcp.io/
ее краснашапка сейчас взяла в оборот и начала толкать
к нему вот такой лайт фронт есть http://getvector.io/ и вот такая штуковина (только в RH перепаковке) http://cockpit-project.org/ использует в качестве поставщика метрик

Dorian
28.04.2018
09:32:53
кто-то blackbox мониторит DNS ?
Не могу разобраться как несколько хостов пробить?
с разными модулями таки это возможно

Evgeny
28.04.2018
15:32:00
поругайте статью, если не лень - http://akumuli.org/akumuli/2018/04/28/scaleable-downsampling/

Vit
28.04.2018
18:28:08
Как и обещал - анонс митапа про мониторинг от DevOps Moscow. Мониторинг(prom) облака(k8s) от Авито, автодискавери метрик от Окметра, Инцидент-менеджмент от Badoo
https://devops-moscow.timepad.ru/event/712678/

Aleksandr
28.04.2018
18:36:41
спасиб