terry
15.05.2018
08:39:49
Twilight
15.05.2018
11:05:54
Всем привет.
Никто не встречался с тем что в эластик серч в индексе kibana-int не все дашборды показывает?
Делаю запрос HOST:9200/kibana-int/_search?type=dashboard&pretty=1, а мне не все дашборды возвращает.
Andor
15.05.2018
11:07:32
думаю лучше в чяте эластика спросить
Twilight
15.05.2018
11:09:16
Google
Andor
15.05.2018
11:09:54
прости, не подскажу
попробуй поиском или используй ссылку чуть выше в чяте
evix
15.05.2018
11:30:38
@elasticsearch_ru
Pablo
15.05.2018
11:36:54
Andor
15.05.2018
11:45:56
оператор для кафки точно был
в списке
Sergey
15.05.2018
12:37:58
я тут чуток в прокафке пострадал... и забил
Dorian
15.05.2018
13:20:55
Парни, а как в blackbox можно передать URL
layer/asset/web/play/36060?userId=242135&protocol=Zwe&app_name=web
?
Andor
15.05.2018
13:21:27
а в чём проблема?
Dorian
15.05.2018
13:22:32
в том, что & экспортеру не очень нравится
Andor
15.05.2018
13:23:20
экранируй
точнее урл-кодируй
Dorian
15.05.2018
13:23:45
module=vooz target="vml.sport.optus.com.au/layer/asset/web/play/36060?userId=242135" level=debug msg="Invalid HTTP response status code
Google
Andor
15.05.2018
13:24:13
layer%2Fasset%2Fweb%2Fplay%2F36060%3FuserId%3D242135%26protocol%3DZwe%26app_name%3Dweb
Dorian
15.05.2018
13:24:34
Andor
15.05.2018
13:25:18
https://www.w3schools.com/tags/ref_urlencode.asp
Dorian
15.05.2018
13:27:26
Andor
15.05.2018
13:29:24
ну экспортру урл приходит параметром в его урле
Dorian
15.05.2018
13:30:25
ага
П
15.05.2018
13:54:56
level=warn ts=2018-05-15T13:51:53.336798942Z caller=wal.go:234 component=tsdb msg="invalid segment file detected, truncating WAL" err="invalid magic header 0 in \"/prometheus/wal/000331\"" file=/prometheus/wal/000331
Что значит такое сообщение в логе прометеуса? Диск можно заново форматировать или он еще оклемается?
Andrey
15.05.2018
13:58:15
ну так а смарт глянуть и FS на сбои, не судьба?
П
15.05.2018
13:59:34
Подозреваю что с фс все ок, на диске кончилось место и данные немного покарраптились судя по всему
Andrey
15.05.2018
14:06:27
о... так вот с этого надо было начинать, пожалуй :) прометеус пока так и на запробовал, а вот инфлюкс вполне переживает ручное убиение "частей" хранилки, просто теряяданные в удалённой части, тут поди примерно то же, а с учётом что оно вообще долго не хранит, ну через недельку, поди об этих данных никто и не вспомнит
П
15.05.2018
14:10:50
Ожил
Так и вышло
Nazar
15.05.2018
15:06:39
Коллеги, нужен ваш совет.
Тыкаюсь в blackbox curl '127.0.0.1:9115/probe?target=https://google.com&module=http_2xx'
probe_success 1
в графане(и в проме соответственно) почему-то при up{instance="https://google.com"} вижу 0
чядн?
Bogdan (SirEdvin)
15.05.2018
16:20:48
Пром не может достучатся до экспортера, как я понимаю
Nazar
15.05.2018
16:22:50
на самом деле, проблема оказалось в конфиге с blackbox
Vladimir
15.05.2018
20:20:29
Google
Dmitry
15.05.2018
20:22:42
А Skyline?
Не поддерживается, застрял в реалиях 5 летней давности
Vladimir
15.05.2018
20:24:41
Думаю про это дело в разрезе сетевого мониторинга(полки, уход трафика, аномальные полки, учёт сезонности)
Алексей
15.05.2018
20:50:32
можете расшифровать юзкейсы описанных выше букв
кроме полок
Vladimir
15.05.2018
20:53:38
ну пропадание полное трафика можно детектировать и обычным тресхолдом
А учёт сезонности - это распознование цикличности, что в 4 утра трафик не пропал, а так и должно быть
Andor
15.05.2018
21:04:34
вспоминается доклад Фабиана с заголовковм Alerting In Prometheus Universe
часть таких хотелок там упоминается
но не автомагически конечно
Алексей
15.05.2018
21:15:57
Vladimir а юзкейсы то какие ?
ну тоесть я хорошо понимаю как это применить в серверном мониторинге (хотя наверное нет) но в сетевом ??
в сетевом мониторинге порты апстримов складываются из портов даунстримов что в конечно счете ведет к портам клиентов. утрировано конечно.
как вам поможет сезонность и какой вывод вы сделаете глядя на такие данные ?
Andrey
15.05.2018
21:21:56
ну... выявит аномалию например, друго дело, что с паттерном прометея, когда у тебя данных за две недели, цена такой аналитики около 0
Алексей
15.05.2018
21:23:46
ну для сети мониторинг с глубиной 2 недели вообще ни о чём. считай данных нет
поэтому и интересен подход сезонности для сети
Phil
15.05.2018
22:40:35
Кстати, а долгосрочное чем сейчас модно держать?
Андрей
15.05.2018
22:58:01
Кликхаус.
Andrey
15.05.2018
23:06:33
этож жаба и прочие страсти мордасти вроде как, да и не прозрачно
Алексей
15.05.2018
23:18:00
жаба там только если ты хочешь ha
а про прозрачность кх нипонятно
Google
vladimir
16.05.2018
03:56:18
Andor
16.05.2018
04:14:53
а "сглаженность" там через усреднение?
vladimir
16.05.2018
04:20:52
а "сглаженность" там через усреднение?
Через медиану, берём данные по этой метрике за N предыдущих дней/недель (timeSlice), получаем N метрик, выкидываем 95 персентили (чтобы отсечь пики и падения) и строим медиану по этой группе метрик, получаем бейзлайн.
Andor
16.05.2018
04:21:41
И это для вообще всех метрик вне зависимости от их характера?
vladimir
16.05.2018
04:22:26
Andor
16.05.2018
04:24:28
И как их найти?
vladimir
16.05.2018
04:26:58
И как их найти?
Если у метрики значения ночью ниже чем днём, и/или в выходные ниже чем в будни - и это норма - то это они и есть
Andor
16.05.2018
04:28:47
Я знаю как это глазами определить, не о ручной работе речь
vladimir
16.05.2018
04:33:16
Я знаю как это глазами определить, не о ручной работе речь
Бейзлайны это инструмент выявления отклонений не для всех типов метрик, это так, и принимать решение где его стоит использовать а где нет, тебе придётся самому, в ручную. Если тебе необходимо выявлять отклонения на всех входящих метриках вообще, и желательно без твоего участия, то тебе нужен детектор аномалий, какими-то простыми способами тут не обойтись
Для бизнесовых данных, чаще всего, бейзлайном вполне достаточно.
Vladimir
16.05.2018
05:45:58
При этом утром у меня аналогичная ситуация, трафика в канале нет, есть только маленький процент, но это не авария, это сезонность
Vladimir
16.05.2018
05:59:42
Dmitry
16.05.2018
06:05:40
сезонность - скользкая штука
Phil
16.05.2018
06:07:02
Кликхаус.
Кликхауз длдя складирования редкоиспользуемой информации?
Dmitry
16.05.2018
06:07:14
для аномалий трафика часто используют либо анализ Holt-Winters, либо фильтры Калмана
Holt-Winters как раз выделяет долгосрочные сезонные колебания
но это экономический фильтр, не всегда для сети подходит
Andor
16.05.2018
06:08:39
надо коэффициенты подбирать
Google
Dmitry
16.05.2018
06:08:56
да как не подбирай
от природы трафика зависит
у онлайн-проектов и у операторов - совсем различные профили
Nikita
16.05.2018
06:10:35
А подскажите, в алерт менеджере можно как-то реализовать алертинг который учитывает время дня? Т.е ночью паниковать при других значениях
Andor
16.05.2018
06:10:59
ну смысле холт-винтерс вообще хорошо себя показывает только если коэффициенты подобраны
Andrey
16.05.2018
06:11:52
Nikita
16.05.2018
06:36:06
котором из? в нормальном, да
В Прометеусовском. Сейчас у меня это реализовано через сайленс алерта, но я хочу именно другие значения использовать, а не просто мутить его. Но судя по issue на гитхабе, такого нет пока :(
Andor
16.05.2018
06:36:57
в прометее в запросе можно указать фильтр по времени например
но возможно лучше это настраивать в каком-нибудь pagerduty/opsgenie, там работа с расписанием есть
Andrey
16.05.2018
08:43:45
Напоминаем что уже завтра, 17 мая, c 10:30 до 19:00, состоится второй Big Monitoring Meetup!
BIG MONITORING MEETUP #2 — уникальная возможность встретиться с экспертами и профессионалами в области мониторинга. Вас ждут живое общение, обсуждение лучших практик и нетрадиционных подходов, обзор новинок и тенденций в области мониторинга и смежных технологий, выступления специалистов и экскурсия по дата-центру!
Основные направления конференции:
Мониторинг оборудования и приложений
Мониторинг сервисов
Новинки производителей
Мониторинг для интернета-вещей
Мониторинг и ML/AI — новые возможности
Визуализация инфраструктуры и бизнес-процессов
Информационная безопасность
Спикеры мероприятия (докладчики и темы уточняются):
Виктор Исаев, команда SAYMON, Мониторинг ЖКХ с помощью SAYMON
Александр Зобнин, Grafana (тема уточняется)
Григорий Юдин, DCConsult, Применение современных технологий мониторинга ЦОД
Павел Козлов, Деловой Партнер, Мессенджеры в системе мониторинга
Алексей Широких, NOC Project, Сетевой мониторинг NOC Project
Константин Рядов, Openway Service, Isolated Enterprise Operational Monitoring
Ольга Филиппова, Тинькофф банк, Мониторинг бизнес-сервисов аналитическими методами
Сергей Кунько, Veeam, Veeam One – мониторинг, отчетность и планирование ресурсов
Денис Муравьев, GoodWAN, Интернет событий – будущее LPWAN на базе российских технологий
Татьяна Свирко, Selectel, Мониторинг инфраструктуры современного дата-центра
Для прохода в дата-центр необходим паспорт. Начало регистрации в 10:20. Первый доклад в 11 часов.
Регистрация https://eventuer.timepad.ru/event/702213/
Andrew
16.05.2018
08:49:49
Доброе утро
подскажите пожалуйста
кто как мониторит диски в прометее
например как утилизейшн дисков мониторите?
что используете кроме стандартного node_exporter со smart скриптом?
Andor
16.05.2018
08:50:34
а что такое по-твоему "утилизация диска"?
Andrew
16.05.2018
08:52:41
утилизация диска
это использования его ресурсов
у каждого диска есть своя пропускная способность
и в нее можно упереться
Andor
16.05.2018
08:53:13
я не манагер, мне пожалуйста технические подробности
в каких единицах, например, меряется "пропускная способность"?
использование каких именно ресурсов диска?
Andrew
16.05.2018
09:06:38
% CPU, затраченный на передачу I/O запросов к диску (“пропускная способность” диска);
скорее воот что я имел ввиду под утилизейнш
поправьте меня если я не прав конечно