@metrics_ru

Страница 131 из 681
Alexander
29.03.2017
08:55:00
Но это немного не про импорт, более удобная организация дашбордов

Pavel
29.03.2017
08:55:03
шикарная вещь

лютейшей плюсую, у нас на работе почти тысяча дашбордов... или не пара тысяч :/

приходится искать свои нужные руками каждый раз :(

Google
Pavel
29.03.2017
08:55:50
а потом импорт фолдера с дашбордами :)

Vladimir
29.03.2017
08:56:17
а, ну тогда да
У нас тоже есть пожелания про гит )

людям очень не нравится что даже сокомандники могут лажануть и поломать дэшборд

поэтому они их очень сильно хотят коммитить в гит на изменения

то есть логика - иметь staging server который сохраняет dashboard'ы в гит, которые потом уже фончиком едут в продакшн

Alexander
29.03.2017
08:57:03
А вы issue не открывали с такой темой?

Vladimir
29.03.2017
08:57:08
менять только на staging'е

пока нет

Ща запилю

Alexander
29.03.2017
08:58:01
ptchol
29.03.2017
09:01:15
но опять же, если бы все дашборды валялись в git :)
Там трудности с тем что экспорт дашбордов экспортит дефолтные параметры

Это приводит иногда к толстым и непонятным диффам

То есть кода ты пытаешься сделать синхронизацию в обе стороны, то что приедет тебе в репу после добавления одной метрики в бороду, может быть не одной строчкой а здоровым непонятным Джейсон диффом, потому что там приедет куча дефолтных параметров строчки

Google
Alexander
29.03.2017
09:06:26
Если есть люди из Питера, можно сегодня на SpbLUG пообщаться.

ptchol
29.03.2017
09:08:04
Может конечно я не прав, и уже сделали как то лучше

lastsky
29.03.2017
09:09:53
https://github.com/grafana/grafana/issues/7978 в общем, изложил, проголосуйте, кто бы хотел подопиливать популярные "заводские" дашборды к графане на github :)

lastsky
29.03.2017
09:11:06
да, но твоя идея тоже крута

ptchol
29.03.2017
09:11:37
Просто коллеги пытались вкрутить https://www.terraform.io/docs/providers/grafana/ и не получается красиво

Pavel
29.03.2017
09:21:20
@Civiloid ?

Serg
29.03.2017
12:13:13
Коллеги, подскажите, как можно или как лучше считать загрузку cpu нескольких серверов. Задача примерно такая - у нас есть 3 сервера, мы хотим видеть общую загрузку по cpu одной метрикой.

Paul
29.03.2017
12:15:27
avg не ваш вариант?

Serg
29.03.2017
12:16:46
AVG?

Ivan
29.03.2017
12:19:05
Коллеги, подскажите, как можно или как лучше считать загрузку cpu нескольких серверов. Задача примерно такая - у нас есть 3 сервера, мы хотим видеть общую загрузку по cpu одной метрикой.
Есть сложная метрика, берёте частоту(моду) вместо средней, получается что-то вроде распределения процента загрузки по оси X и моды(частоты или количества значений в модальном интервале) по оси Y. Наносите всё это от 3-х серверов. Соотвестенно чем выше график справа, тем больше интервалов измерений в нагрузке 90-100%, тем хуже чувствуют себя серверы.

такое сработает на некоторых интервалах времени выхе часа

Serg
29.03.2017
12:25:41
через частоту не совсем правильно, хотя такой вариант вполне можно реализовать.

Paul
29.03.2017
13:02:02
Коллеги, подскажите, как можно или как лучше считать загрузку cpu нескольких серверов. Задача примерно такая - у нас есть 3 сервера, мы хотим видеть общую загрузку по cpu одной метрикой.
складываем загрузку всех ядер и делим на количество всех ядер. Но это очень такая метрика. Пол-потолок-пополам, сработает только, если у вас метрики примерно одинаковые

Serg
29.03.2017
13:06:13
Честно, мы сейчас прикинули и решили делать среднее значение, так как у нас метрика от каждого сервера может быть абсолютно разной. Некоторые сервера могут простаивать, а другие загружены на 100% и понятно, что одной метрикой адекватно не описать такую ситуацию. Но общую загруженность кластера можно средним показать.

Ivan
29.03.2017
13:09:49
вы можете брать n-1 самых загруженных серверов и уже из них брать среднее или какой-нить перцентиль

Zhenia
29.03.2017
13:11:19
а какая польза от такой метрики?

Ivan
29.03.2017
13:11:54
общая утилизация кластера

полезно, но сложно

Google
Zhenia
29.03.2017
13:12:20
ну, я про просто среднее значение

Serg
29.03.2017
13:13:36
Скажем так, вообще польза одной метрикой описывать загрузку кластера весьма сомнительна )))

Но просят на дашборде

ОДНУ ГЛАВНУЮ МЕТРИКУ

?

Mi
29.03.2017
15:13:48
Это будет сверх некорректно

Alexander
29.03.2017
15:14:00
Если визуализация нужна, то тут Heatmap как раз должен подойти

Алексей
29.03.2017
15:14:18
Кажется так

Roman
29.03.2017
15:25:39
Здрасте! Тут есть люди, которые занимаются мониторингом приложений?

Алексей
29.03.2017
15:27:04
Тут скорее нет других

ptchol
29.03.2017
15:27:25
да, мы все тут специалисты по заббиксу

Roman
29.03.2017
15:31:39
Тут скорее нет других
Я про метрики из приложений

Алексей
29.03.2017
15:31:51
Ну и я

Roman
29.03.2017
15:31:56
Не с серверов, а клиентов

Ну значит можно свои ответы задавать?

ptchol
29.03.2017
15:33:31
нет, ты слишком мало раз переспросил, давай ещё раз.

Алексей
29.03.2017
15:35:44
Не с серверов, а клиентов
Нее. Таких нет. Уходи.

Roman
29.03.2017
15:35:45
Ну для начала пару вопросов. Куда лучше складывать события, не интервальные, а случайные. Например такие: девайс x запустил воспроизведения файла 123.mp4

Google
ptchol
29.03.2017
15:37:18
эластиксёртч

у нас же викторина да ? )

Алексей
29.03.2017
15:38:01
Кликхаус

Roman
29.03.2017
15:38:29
Вот проткликхаус я думал как раз

ptchol
29.03.2017
15:38:52
в кликхаусе схема статичная

а твои события могут меняться со временем. нет ?

Roman
29.03.2017
15:39:13
Потом очевидно нужны отчеты - файл 123 был просотрен N раз

Vladimir
29.03.2017
15:39:23
я б сказал что статичная схема это не такая проблема

Admin
ERROR: S client not available

Vladimir
29.03.2017
15:39:30
минус в том что нужно делать Alter'ы

Алексей
29.03.2017
15:39:34
Я побелил

ptchol
29.03.2017
15:39:53
минус в том что нужно делать Alter'ы
так это как бы одно из другого. нет ?

Vladimir
29.03.2017
15:39:56
Или все невошедшее в схему складывать в какое-нибудь поле "не распарсенное" в виде json'а )

Roman
29.03.2017
15:40:01
а твои события могут меняться со временем. нет ?
Могут, но можно делать версии схемы и передавать в потоколе

Vladimir
29.03.2017
15:40:11
так это как бы одно из другого. нет ?
да конечно, но альтеры на добавление-удаление - простые

ptchol
29.03.2017
15:40:21
ну окай.

Roman
29.03.2017
15:40:47
Статичная схема в кликхаусе дает какое то адовое быстродействие по их словам

Для событий эластиксеарч или кликхаус. Другие ответы еще есть?

ptchol
29.03.2017
15:42:09
мне показалось что адовое быстродействите там даёт "аппендонли" структуру данных внизу, которая заполняется таким образом чтобы максимальное количество чтений было последовательным

Владимир ?

Google
Roman
29.03.2017
15:43:36
Там колоночная DB, если селект по одному признаку то шибко быстрее будет чем все строчки считать.

Pavel
29.03.2017
15:45:09
кликхаус имба :)

ptchol
29.03.2017
15:46:49
Там колоночная DB, если селект по одному признаку то шибко быстрее будет чем все строчки считать.
с такой логика вам бы любая колоночная бд подошла, но почему же кх быстрее того же hbase ? )

тока не говорите что java тормозит )

Roman
29.03.2017
15:47:10
Потому что они сжимают данные

Pavel
29.03.2017
15:47:39
и потому что С++ %)

гыгы

Roman
29.03.2017
15:47:50
Я хотел нетфлоу поток скормить и посмотреть

Pavel
29.03.2017
15:48:01
я решал твою задачу и решил :)

Pavel
29.03.2017
15:48:28
ага

укладки нетфлоу в CH

Roman
29.03.2017
15:48:43
Вау и как?

Pavel
29.03.2017
15:49:03
работает отлично, мы для этого замутили спец демона, который читает трафик и батчами кладет в CH, чтобы сжатие было огого и нагрузка на сам CH меньше

жмет в 5-6 раз если сравнивать с сырым размером флоу записанных тупо на диск "как есть"

Roman
29.03.2017
15:50:18
Pavel
29.03.2017
15:50:18
ну и скалится до терабит... сейчас работает на опорке одного-большого-мобильного-оператора.

с бинарной, разумеется.

мы еще порты сохраняем, если их убрать - пожмется еще сильнее, так как рандомизация портов оч высокая, сжатие плохо работает.

Roman
29.03.2017
15:51:34
У меня, кстати, текстовый csv формат в bzip -9 ужимался лучше бинарного

Pavel
29.03.2017
15:52:08
возможно, конечно.

Страница 131 из 681