@metrics_ru

Страница 525 из 681
Валерий
28.04.2018
20:00:20
telegraf юзаем
Глеб, а как генерируете конфигурации агента ? Руками?

Gleb
28.04.2018
20:18:09
Глеб, а как генерируете конфигурации агента ? Руками?
нам одной достаточно, у нас идентичные серверы везде

но вообще там несложно наверное

Валерий
28.04.2018
21:03:37
но вообще там несложно наверное
Понятно, спасибо. Если с https://github.com/lxndrp/pdh2zabbix не полетим пожалуй возьмемся за telegraf .

Google
Vladimir
28.04.2018
21:17:17
я вот не следил последнее время

а, кажется было, да

Gleb
29.04.2018
15:33:00
как понять, почему алертменеджер не групит алерты по alertname, хотя group_by: ['alertname', 'cluster', 'country', 'type', 'job', 'instance']

Andor
29.04.2018
15:34:20
он будет по всем этим лейблам группировать

если все совпадают - будут сгруппированы

Gleb
29.04.2018
15:35:07
а если один не совпадет, то не будет, получается?

а чо делать, если я хочу и по instance и по alertname

inhibition?

Andor
29.04.2018
15:37:09
ты сначала определись чо ты хочешь

Gleb
29.04.2018
15:42:34
ок, тогда другой вопрос. у меня есть алерт, типа, JobDown (for 3m), он warning, и есть JobDownCritical (for 5m), который critical

можно оба алерта в один упаковать ведь?

Andor
29.04.2018
15:43:56
ты понимаешь что "группировка" - это не "упаковать два алерта в один"?

Google
Andor
29.04.2018
15:44:04
просто они пришлются вместе

судя по твоему описанию - тебе нужен inhibition

Gleb
29.04.2018
15:44:20
я понимаю, да, это уже другой вопрос

да, у меня есть. просто держать два алерта не очень красиво

Vit
29.04.2018
21:12:08
А записи будут?
Да, конечно

Konstantin
30.04.2018
14:26:22
Есть у меня внутреннее решение, которое умеет line_protocol инфлюкса писать в кликхауз. Плюс графит протокол как его ест инфлюкс. Но слишком на коленке и медленновато. Что есть лучше? Т.е. насколько я буду изобретать велосипед, если решу нормально реализовать, а не на коленке?

Andor
30.04.2018
14:30:30
Инфлюкс в кх?

А зачем тогда не графит сразу, там вроде есть готовое решение

Konstantin
30.04.2018
14:31:26
Ну тогда его не было

Andor
30.04.2018
14:31:47
Сейчас-то есть

Konstantin
30.04.2018
14:32:00
А так, всё, что умеет line protocol попадает в клик

У инфлюкса есть прикольная фишка с переписыванием графита в его родные межермент-таг-поля. Оно потом позволяет удобно таги группировать

Вот это-то я и подхватил оттуда

Gleb
01.05.2018
00:28:22
Всем привет. Помогите вкурить, как запилить алерты в графане? Есть pid = true, нету = false. И алертилку (вот с ней самый главный вопрос)

Andrey
01.05.2018
00:33:01
А по другому никак никак? в смысле не в графане

Gleb
01.05.2018
00:35:54
а зачем костылить в другом месте?

Andrey
01.05.2018
00:38:04
потому что в другом месте оно к месту

Slach
01.05.2018
03:57:56
какой datasource у графаны ?

Gleb
01.05.2018
03:58:40
prometheus

Slach
01.05.2018
03:59:53
1) научись класть какую то метрику через node_exporter на тему того что нужный тебе pid есть 2) в prometheus есть свои алерты, лучше чем в графане

Google
Slach
01.05.2018
04:01:27
https://groups.google.com/forum/#!topic/prometheus-users/Y2htzgG9FjM

Igor
01.05.2018
06:38:41
привет! подскажите плиз, правильно ли я понимаю что графхаус не создаёт предвычисленных роллапов? к примеру если я имею два rollup - неделя по 1 минуте и год по пол часа, то графхаус в базе будет хранить целый год данных “по минуте” и только в момент формирования запроса делать огрубление данных(если нужно).

Sergey
01.05.2018
07:02:17
не смотрел как там графхаус, но т.к. это двоюродный брат графит-КХ и у них общий бекенд, подозреваю что ты оптимайз не запускал в КХ

Igor
01.05.2018
07:10:44
не запускал, это правда. то есть должна происходить аггрегация во время мержа?

Sergey
01.05.2018
07:49:27
роллап правила в КХ отрабатывают во время оптимайза партиции, в доке как то не очень конкретно было написано когда КХ это делает сам (и делает ли вообще), крон с курлом решает эту задачу

Igor
01.05.2018
07:52:52
Это хорошая новость. в документации кажется этого вообще нет. запустил optimize, жду результата )

Tim
01.05.2018
10:17:50
дорогие коллеги стоит задача технического мониторинга приложений (jvm в основном) и инфраструктуры (postgres, kafka, cassanrda) есть в команде упоротые фанаты ELK которые говорят что можно всё делать через metric beat, и графану поверх этого повесить я в целом не фетишист, но хотелось бы понять, чего ожидать и ещё вопрос, как алерты прикручивать поверх ELK если не брать xpack

Wom
01.05.2018
10:19:55
почему не брать x-pack?

Tim
01.05.2018
10:29:53
ну денег стоит же

Andor
01.05.2018
10:30:30
а ты посчитай сколько тебе времени будет трахаться с этим дерьмом и прикинь что дешевле

Wom
01.05.2018
10:41:01
ну денег стоит же
https://www.elastic.co/products/x-pack/open

Nklya
01.05.2018
10:41:31
то что его заопенсорсили, не означает что он стал бесплатным))

Slach
01.05.2018
13:33:31
Коллеги, а помогите разгадать загадку 1) коннекчусь из браузера к серверу без прокси меряю время запроса получаю waiting TTFB в браузере 300ms ;( 2) смотрю в логи nginx для request_time и upstream_response_time там вижу картинку что оно все 0.200 sec откуда еще может быть 100ms ? левых? nginx же выдает правильные цифры в логе?

Slach
01.05.2018
13:47:10
вот вот... я не понимаю просто как TTFB в браузере (повторюсь Proxy нет) может быть больше чем весь request_time в nginx ... ну ладно бы меньше

M
01.05.2018
13:47:16
тоесть соединение между сетями +100мс

Google
Slach
01.05.2018
13:47:28
ну тогда connection был бы столько

M
01.05.2018
13:47:37
тоесть nginx обрабатывает 200ms а сеть 100ms

Slach
01.05.2018
13:53:52
ну типа nginx request_time это время когда отправлен последний байт клиенту ... но это ж вроде когда tcp ack на этот последний байт пришел

т.е. все равно непонятно

Slach
01.05.2018
13:55:53
у вас между клиентом и nginx'ом логи которого вы смотрите нет какой-нибудь прокси?
вот я только на это щас и уповаю щас попробую прямо на сервере через curl замерить

Admin
ERROR: S client not available

Slach
01.05.2018
13:58:12
похоже что все таки что-то есть только непонятно где =(((

Sergey
01.05.2018
13:59:26
какое-нибудь дополнение против блокировок? :)

Slach
01.05.2018
14:00:04
tcpdump в зубы
а что он покажет? у меня http если man in the niddle proxy будет то я ничего не пойму

Sergey
01.05.2018
14:00:09
добрый провайдер с транспарент-прокси?

Slach
01.05.2018
14:00:15
ну =) это дополнение "отключено" сейчас

Wom
01.05.2018
14:02:29
man in the noodles

Slach
01.05.2018
14:04:48
;) что? логи уже никто не читает?

всем графаночку облитую смузи подавай? ;)

Wom
01.05.2018
14:06:06
читают. в кибане

Slach
01.05.2018
14:08:45
ну две метрики расходятся причем по неизвестным причинам хотя вроде расходиться должны не на 25% ...

Google
Slach
01.05.2018
14:09:04
ну ок =) спасибо в любом случае что навели на мысль проверить с локалхоста

Vasilii
01.05.2018
15:12:21
Nginx request time начинается когда получен запрос, а ttfb когда открыто соединение

Заканчивается nginx request time когда ответ готов и началась передача клиенту, а curl ttfb когда первый байт ответа получен

Slach
01.05.2018
15:16:07
Nginx request time начинается когда получен запрос, а ttfb когда открыто соединение
ок. может какая нибудь настройка в nginx какой то обратный dns resolve делает... щас tcpdump посмотрю на эту тему

GithubReleases
01.05.2018
20:57:07
influxdata/kapacitor was tagged: v1.5.0-rc2 Link: https://github.com/influxdata/kapacitor/releases/tag/v1.5.0-rc2 Release notes: cut v1.5.0-rc2

Juff
02.05.2018
06:04:42
Slach
02.05.2018
06:28:00
ты из Баку ?
=) нет, не из баку =)

Juff
02.05.2018
06:28:32
понятно )) значит аутсорсишь )) я про домен *.az

Slach
02.05.2018
06:29:05
;) ну скорее консультирую и основную проблему вижу, но там какая то дополнительная с ttfb который непонятно откуда берется

Evgeny
02.05.2018
07:11:12
Сделал лэндинг, зацените http://akumuli.org/

Andor
02.05.2018
07:18:46
как обычно на лендингах: минимум информации, максимум пустого места

Evgeny
02.05.2018
07:29:49
В лучших традициях

Alexander
02.05.2018
07:47:49
Сделал лэндинг, зацените http://akumuli.org/
Выглядит хорошо. Еще бы главную страницу вики обновить, а то как-то обрезанно выглядит. Можно оглавление добавить вместо боковой менюшки Pages.

Wom
02.05.2018
07:50:02
и доке убунта 14.04

Evgeny
02.05.2018
07:58:15
Ну это потому что пакеты только под 14.04 собираются, т.к. Travis ci ещё не сделали 16.04

Страница 525 из 681