@metrics_ru

Страница 534 из 681
Twilight
15.05.2018
11:05:54
Всем привет. Никто не встречался с тем что в эластик серч в индексе kibana-int не все дашборды показывает? Делаю запрос HOST:9200/kibana-int/_search?type=dashboard&pretty=1, а мне не все дашборды возвращает.

Andor
15.05.2018
11:07:32
думаю лучше в чяте эластика спросить

Twilight
15.05.2018
11:09:16
Google
Andor
15.05.2018
11:09:54
прости, не подскажу

попробуй поиском или используй ссылку чуть выше в чяте

evix
15.05.2018
11:30:38
@elasticsearch_ru

Pablo
15.05.2018
11:36:54
Есть мнение что запускать кафку и кассандру в докере это такое себе развлечение
я конечно слоупок, но кажется конфлюэнт выпустил куб-оператор даже для кафки, так-то.

Andor
15.05.2018
11:45:56
оператор для кафки точно был

в списке

Sergey
15.05.2018
12:37:58
я тут чуток в прокафке пострадал... и забил

Dorian
15.05.2018
13:20:55
Парни, а как в blackbox можно передать URL layer/asset/web/play/36060?userId=242135&protocol=Zwe&app_name=web ?

Andor
15.05.2018
13:21:27
а в чём проблема?

Dorian
15.05.2018
13:22:32
в том, что & экспортеру не очень нравится

Andor
15.05.2018
13:23:20
экранируй

точнее урл-кодируй

Dorian
15.05.2018
13:23:45
module=vooz target="vml.sport.optus.com.au/layer/asset/web/play/36060?userId=242135" level=debug msg="Invalid HTTP response status code

Google
Andor
15.05.2018
13:24:13
layer%2Fasset%2Fweb%2Fplay%2F36060%3FuserId%3D242135%26protocol%3DZwe%26app_name%3Dweb

Andor
15.05.2018
13:25:18
https://www.w3schools.com/tags/ref_urlencode.asp

Dorian
15.05.2018
13:27:26
https://www.w3schools.com/tags/ref_urlencode.asp
Да я в теме, не думал, что экпортер понимает. Спасибо!

Andor
15.05.2018
13:29:24
ну экспортру урл приходит параметром в его урле

Dorian
15.05.2018
13:30:25
ага

П
15.05.2018
13:54:56
level=warn ts=2018-05-15T13:51:53.336798942Z caller=wal.go:234 component=tsdb msg="invalid segment file detected, truncating WAL" err="invalid magic header 0 in \"/prometheus/wal/000331\"" file=/prometheus/wal/000331

Что значит такое сообщение в логе прометеуса? Диск можно заново форматировать или он еще оклемается?

Andrey
15.05.2018
13:58:15
ну так а смарт глянуть и FS на сбои, не судьба?

П
15.05.2018
13:59:34
Подозреваю что с фс все ок, на диске кончилось место и данные немного покарраптились судя по всему

Andrey
15.05.2018
14:06:27
о... так вот с этого надо было начинать, пожалуй :) прометеус пока так и на запробовал, а вот инфлюкс вполне переживает ручное убиение "частей" хранилки, просто теряяданные в удалённой части, тут поди примерно то же, а с учётом что оно вообще долго не хранит, ну через недельку, поди об этих данных никто и не вспомнит

П
15.05.2018
14:10:50
Ожил

Так и вышло

Nazar
15.05.2018
15:06:39
Коллеги, нужен ваш совет. Тыкаюсь в blackbox curl '127.0.0.1:9115/probe?target=https://google.com&module=http_2xx'

probe_success 1

в графане(и в проме соответственно) почему-то при up{instance="https://google.com"} вижу 0

чядн?

Bogdan (SirEdvin)
15.05.2018
16:20:48
Пром не может достучатся до экспортера, как я понимаю

Nazar
15.05.2018
16:22:50
на самом деле, проблема оказалось в конфиге с blackbox

Google
Dmitry
15.05.2018
20:22:42
А Skyline?
Не поддерживается, застрял в реалиях 5 летней давности

Vladimir
15.05.2018
20:24:41
Не поддерживается, застрял в реалиях 5 летней давности
а что сейчас актуально, если не секрет?

Думаю про это дело в разрезе сетевого мониторинга(полки, уход трафика, аномальные полки, учёт сезонности)

Алексей
15.05.2018
20:50:32
можете расшифровать юзкейсы описанных выше букв

кроме полок

Vladimir
15.05.2018
20:53:38
ну пропадание полное трафика можно детектировать и обычным тресхолдом

А учёт сезонности - это распознование цикличности, что в 4 утра трафик не пропал, а так и должно быть

Andor
15.05.2018
21:04:34
вспоминается доклад Фабиана с заголовковм Alerting In Prometheus Universe

часть таких хотелок там упоминается

но не автомагически конечно

Алексей
15.05.2018
21:15:57
Vladimir а юзкейсы то какие ?

ну тоесть я хорошо понимаю как это применить в серверном мониторинге (хотя наверное нет) но в сетевом ?? в сетевом мониторинге порты апстримов складываются из портов даунстримов что в конечно счете ведет к портам клиентов. утрировано конечно. как вам поможет сезонность и какой вывод вы сделаете глядя на такие данные ?

Andrey
15.05.2018
21:21:56
ну... выявит аномалию например, друго дело, что с паттерном прометея, когда у тебя данных за две недели, цена такой аналитики около 0

Алексей
15.05.2018
21:23:46
ну для сети мониторинг с глубиной 2 недели вообще ни о чём. считай данных нет поэтому и интересен подход сезонности для сети

Phil
15.05.2018
22:40:35
Кстати, а долгосрочное чем сейчас модно держать?

Андрей
15.05.2018
22:58:01
Кликхаус.

Andrey
15.05.2018
23:06:33
этож жаба и прочие страсти мордасти вроде как, да и не прозрачно

Алексей
15.05.2018
23:18:00
жаба там только если ты хочешь ha

а про прозрачность кх нипонятно

Google
vladimir
16.05.2018
03:56:18
А учёт сезонности - это распознование цикличности, что в 4 утра трафик не пропал, а так и должно быть
Графит, реализованный на GoLang, и хранилищем в виде Кликхауса вполне подходит для таких целей. Там и бейзлайны (сглаженное, историческое поведение метрики) легко можно построить, и разницу вновь приходящих данных с этим бейзлайном посчитать, и всё это практически реалтайм (10-30сек).

этож жаба и прочие страсти мордасти вроде как, да и не прозрачно
Сам КХ на С++, обзяки для чтения/записи в него метрик реализованы на GoLang(carbon-clickhouse) и на Java(graphouse).

Andor
16.05.2018
04:14:53
а "сглаженность" там через усреднение?

vladimir
16.05.2018
04:20:52
а "сглаженность" там через усреднение?
Через медиану, берём данные по этой метрике за N предыдущих дней/недель (timeSlice), получаем N метрик, выкидываем 95 персентили (чтобы отсечь пики и падения) и строим медиану по этой группе метрик, получаем бейзлайн.

Andor
16.05.2018
04:21:41
И это для вообще всех метрик вне зависимости от их характера?

vladimir
16.05.2018
04:22:26
Andor
16.05.2018
04:24:28
И как их найти?

vladimir
16.05.2018
04:26:58
И как их найти?
Если у метрики значения ночью ниже чем днём, и/или в выходные ниже чем в будни - и это норма - то это они и есть

Andor
16.05.2018
04:28:47
Я знаю как это глазами определить, не о ручной работе речь

vladimir
16.05.2018
04:33:16
Я знаю как это глазами определить, не о ручной работе речь
Бейзлайны это инструмент выявления отклонений не для всех типов метрик, это так, и принимать решение где его стоит использовать а где нет, тебе придётся самому, в ручную. Если тебе необходимо выявлять отклонения на всех входящих метриках вообще, и желательно без твоего участия, то тебе нужен детектор аномалий, какими-то простыми способами тут не обойтись

Для бизнесовых данных, чаще всего, бейзлайном вполне достаточно.

Vladimir
16.05.2018
05:45:58
ну тоесть я хорошо понимаю как это применить в серверном мониторинге (хотя наверное нет) но в сетевом ?? в сетевом мониторинге порты апстримов складываются из портов даунстримов что в конечно счете ведет к портам клиентов. утрировано конечно. как вам поможет сезонность и какой вывод вы сделаете глядя на такие данные ?
Допустим у меня тысячи арендованных каналов, сложная сеть. Мне надо отслеживать возврат трафика в канал, падение канала, причем падение может быть сложное, например оператор частично сломал у себя мультикаст, тогда протоколы работают, не работает только ldp, трафик служебный на порту есть, но его малый процент

При этом утром у меня аналогичная ситуация, трафика в канале нет, есть только маленький процент, но это не авария, это сезонность

Dmitry
16.05.2018
06:05:40
сезонность - скользкая штука

Phil
16.05.2018
06:07:02
Кликхаус.
Кликхауз длдя складирования редкоиспользуемой информации?

Dmitry
16.05.2018
06:07:14
для аномалий трафика часто используют либо анализ Holt-Winters, либо фильтры Калмана

Holt-Winters как раз выделяет долгосрочные сезонные колебания

но это экономический фильтр, не всегда для сети подходит

Andor
16.05.2018
06:08:39
надо коэффициенты подбирать

Google
Dmitry
16.05.2018
06:08:56
да как не подбирай

от природы трафика зависит

у онлайн-проектов и у операторов - совсем различные профили

Nikita
16.05.2018
06:10:35
А подскажите, в алерт менеджере можно как-то реализовать алертинг который учитывает время дня? Т.е ночью паниковать при других значениях

Andor
16.05.2018
06:10:59
ну смысле холт-винтерс вообще хорошо себя показывает только если коэффициенты подобраны

Nikita
16.05.2018
06:36:06
котором из? в нормальном, да
В Прометеусовском. Сейчас у меня это реализовано через сайленс алерта, но я хочу именно другие значения использовать, а не просто мутить его. Но судя по issue на гитхабе, такого нет пока :(

Andor
16.05.2018
06:36:57
в прометее в запросе можно указать фильтр по времени например

но возможно лучше это настраивать в каком-нибудь pagerduty/opsgenie, там работа с расписанием есть

Andrey
16.05.2018
08:43:45
Напоминаем что уже завтра, 17 мая, c 10:30 до 19:00, состоится второй Big Monitoring Meetup! BIG MONITORING MEETUP #2 — уникальная возможность встретиться с экспертами и профессионалами в области мониторинга. Вас ждут живое общение, обсуждение лучших практик и нетрадиционных подходов, обзор новинок и тенденций в области мониторинга и смежных технологий, выступления специалистов и экскурсия по дата-центру! Основные направления конференции: Мониторинг оборудования и приложений Мониторинг сервисов Новинки производителей Мониторинг для интернета-вещей Мониторинг и ML/AI — новые возможности Визуализация инфраструктуры и бизнес-процессов Информационная безопасность Спикеры мероприятия (докладчики и темы уточняются): Виктор Исаев, команда SAYMON, Мониторинг ЖКХ с помощью SAYMON Александр Зобнин, Grafana (тема уточняется) Григорий Юдин, DCConsult, Применение современных технологий мониторинга ЦОД Павел Козлов, Деловой Партнер, Мессенджеры в системе мониторинга Алексей Широких, NOC Project, Сетевой мониторинг NOC Project Константин Рядов, Openway Service, Isolated Enterprise Operational Monitoring Ольга Филиппова, Тинькофф банк, Мониторинг бизнес-сервисов аналитическими методами Сергей Кунько, Veeam, Veeam One – мониторинг, отчетность и планирование ресурсов Денис Муравьев, GoodWAN, Интернет событий – будущее LPWAN на базе российских технологий Татьяна Свирко, Selectel, Мониторинг инфраструктуры современного дата-центра Для прохода в дата-центр необходим паспорт. Начало регистрации в 10:20. Первый доклад в 11 часов. Регистрация https://eventuer.timepad.ru/event/702213/

Andrew
16.05.2018
08:49:49
Доброе утро подскажите пожалуйста кто как мониторит диски в прометее например как утилизейшн дисков мониторите? что используете кроме стандартного node_exporter со smart скриптом?

Andor
16.05.2018
08:50:34
а что такое по-твоему "утилизация диска"?

Andrew
16.05.2018
08:52:41
утилизация диска это использования его ресурсов у каждого диска есть своя пропускная способность и в нее можно упереться

Andor
16.05.2018
08:53:13
я не манагер, мне пожалуйста технические подробности

в каких единицах, например, меряется "пропускная способность"?

использование каких именно ресурсов диска?

Andrew
16.05.2018
09:06:38
% CPU, затраченный на передачу I/O запросов к диску (“пропускная способность” диска);

скорее воот что я имел ввиду под утилизейнш

поправьте меня если я не прав конечно

Страница 534 из 681