@metrics_ru

Страница 197 из 681
Алексей
26.06.2017
11:41:17
on disk индекс

Pavel
26.06.2017
11:41:36
неплохо

User ?
26.06.2017
11:42:05
Привет, а подскажите какие коллекторы данных для прометеуса есть? Я знаю telegraph, node_exporter, collectd
Я неправильно спросил. Как еще можно доставить системные метрики до prometheus? какие существуют еще коллекторы, кроме тех что я назвал?

Zhenia
26.06.2017
11:42:12
теперь рестарты не по 40 часов?

Google
Алексей
26.06.2017
11:42:25
Denys ??
26.06.2017
12:13:09
Но с КХ трабла с ритеншенем еще. Вот будет - выкину инфублю
Чо за трабла? Там вроде ж есть ретеншен встроенный, как в виспере?

Pavel
26.06.2017
12:14:32
ритеншена нету как такового там вообще :(

Roman
26.06.2017
12:19:36
ритеншена нету как такового там вообще :(
Непонятно что ты имеешь ввиду. Есть такое https://clickhouse.yandex/docs/ru/table_engines/graphitemergetree.html , тебе не оно нужно?

Pavel
26.06.2017
12:22:04
мне ритеншен для других таблиц нужен, не для метрик, а так да, почти оно, если только с метрикми работать.

Denys ??
26.06.2017
12:24:19
Influx но не для метрик? О_о

Pavel
26.06.2017
12:25:44
вопрос был "умеет ли КХ ретеншен", в общем случае - нет. в частном случае для метрик - да.

Vladimir
26.06.2017
12:31:04
Там есть aggregating merge tree, помесячные партишены и для графит мерж три есть ретеншены графит стайл

Но увы первое это не ретеншены в общем виде

Konstantin
27.06.2017
12:16:35
Привет! Подскажите, пожалуйста, как для всех графиках в графане (источник - инфлюкс) построить персентиль за текущий месяц (считать с начала месяца до сейчас, рисовать поверх текущих значений чертой)

Andor
27.06.2017
12:20:56
берёшь и рисуешь

потом выводишь например на правую ось X

Mikhail
27.06.2017
12:21:55
процентиль же должна на уровне бэкенда высчитываться, так ведь? А графана в таком случае должна просто нарисовать метрику

Google
Konstantin
27.06.2017
12:24:34
Я могу сделать на графике два запроса - один за текущими значениями, другой за персентилем, но таймстемпы всё портят - у запроса на персентили будет только одна точка

И, вероятно, за пределами $timeinterval

Алексей
28.06.2017
06:49:20
ага. ну хоть понятно почему нет анонса от Influxdb. https://github.com/influxdata/influxdb/issues/8500

потому что они сделали релиз который работает пару минут и виснет. фуф.

Semyon
28.06.2017
06:52:20
А я так надеялся, что все станет лучше

Andor
28.06.2017
07:01:00
станет, когда ты перестанешь юзать инфлюкс

Nikita
28.06.2017
07:05:50
КХ в продакшине для метрик много кто использует? Как ощущения?

Roman
28.06.2017
07:39:48
Привет! Подскажите, можно ли в Prometheus как-то вытащить значение лейбла непосредственно в запросе? Например, метрика содержит лейбл с целочисленным значением - множитель. И нужно вывести значение метрики умноженное на этот множитель.

Или может быть в графане это можно как-то сделать?

Semyon
28.06.2017
07:43:23
Denys ??
28.06.2017
11:48:00
Мне лично непонятно насколько его можно использовать с кластером, учитывая что удаления метрик там нет а решардирование официально в бете.

И как оно себя будет вести когда у тебя пара реплик повалялась в дауне пару часов

короче, вопросов много. А на одной ноде неплохо говорят живет.

Nikita
28.06.2017
11:52:15
ну на сколько я знаю яндекс вполне в кластерах живет, более того КХ в отличии от эластика например линейно масштабируется по заявлениям разрабов. Про решардирование - видимо сразу поднимать с запасом, а остальное должно ок быть

Roman
28.06.2017
11:52:44
у меня живет без кластера. только репликация. и мне прям очень нравится - бэкапы, репликация, кастомные запросы через sql и тд. Уже почти все что было на висперах допереводил на КХ

точнее кластер есть, но средствами graphite-web - он ходит в несколько независимых групп КХ

Nikita
28.06.2017
11:54:47
я с КХ работал только для аналитики, все круто было, кроме невозможности апдейта-удаления, но это понятно

Denys ??
28.06.2017
11:57:08
Roman
28.06.2017
12:02:29
Ну, в таком виде он нисколько не интереснее виспера.
Виспер не бекапится, виспер не реплицируется (и как следствие сам не восстанавливается после даунтайма одного из серверов), виспер утилизирует диск в 100 раз больше (лично у меня), виспер жрет много лишнего места на разреженные метрики, висперу требуется специальный агрегатор в памяти перед ним (который может терять данные на рестарте и раздуваться по памяти в случае дисковых тормозов) Такой "кластер" у меня потому, что данные в этих КХ из разных источников, а не потому что я таким образом хотел сделать шардинг. В шардинге пока необходимость не возникала и чувствую на нашей нагрузке еще не скоро возникнет

Google
Denys ??
28.06.2017
12:06:24
Шардинг нужен для нормального кластеринга. Чистые реплики даже с восстановлением - не интересно, их всего две и они рано или поздно кончатся. sparse спасает от разряженных метрик, коих правда немного, buckytools занимается восстановлением. Плюс минус норм, но КХ на этом фоне никак не выглядит серебрянной пулей.

Roman
28.06.2017
12:19:39
ну хз. никогда не использовал buckytools и не могу сравнить его удобство с КХ

Denys ??
28.06.2017
12:32:48
@rlomonosov : А как роллапы в КХ складываются? в ту же партицию? Там же вроде партиции можно подневно удалять, но можно ли их удалять только для определенного age?

Vladimir
28.06.2017
12:33:50
Пока правда не разбирались почему конкретно, но когда включаем спарсы фрагментация памяти настолько увеличивается, что начинают появляться проблемы

У кх нет решардинга, это пока печально, хотя вот именно балансировкой метрик он сам может заниматься (в том числе на чтение)

Плюс в случаи записи в распределенные таблицы и недоступности всех реплик ноды он умеет временно куда нибудь данные положить, а потом перегнать

Roman
28.06.2017
12:36:34
@rlomonosov : А как роллапы в КХ складываются? в ту же партицию? Там же вроде партиции можно подневно удалять, но можно ли их удалять только для определенного age?
В ту же партицию. Партиции пока только по месяцам. И удалять можно как угодно - удаление старых партиций на твоей совести

У нас спарс кстати не зашёл, начались веселые спецэффекты
у меня зашел ровно до тех пор пока мне не понадобилось все висперы скопировать на другой сервер - не влезли ) но в этот момент у нас уже был КХ - так что мы в результате висперы в него перегнали и выбросили

Vladimir
28.06.2017
12:52:30
@deniszh кх не серебряная пуля, но кажется он хорошая основа для более правильного хранилища чем то что есть сейчас

Чем больше я по сторонам смотрю, тем больше так кажется

Fedor
28.06.2017
13:09:07
Привет всем. Подскажите, пожалуйста, где посмотреть текущее количество метрик, снимаемых прометеусом?

Fedor
28.06.2017
13:09:22
сходу не нашел

Mikhail
28.06.2017
13:24:19
из-под коробки вряд ли есть, но на твоем месте помог бы обычный скрипт, который находит в конфиге прометея все ендпоинты, ходит к ним через curl и считает кол-во уникальных строк (т.е. метрик) через wc -l

Denys ??
28.06.2017
13:26:19
@rlomonosov Мож я что то не понимаю тогда. Вот если у меня первый роллап поминутный с age 0, a последний - подневный с age 10 лет - то удалять данные я смогу только через 10 лет и к тому моменту у меня будет поминутных метрик за 10 лет храниться?

Roman
28.06.2017
13:30:59
@rlomonosov Мож я что то не понимаю тогда. Вот если у меня первый роллап поминутный с age 0, a последний - подневный с age 10 лет - то удалять данные я смогу только через 10 лет и к тому моменту у меня будет поминутных метрик за 10 лет храниться?
удалить данные ты можешь в любой момент. просто грохнуть старую партицию все роллапы лежат в одной куче. условно говоря это сортированный по имени метрики и времени файлик - иногда он пересортировывается и делает из нескольких точек одну убить файлик ты можешь в любой момент - тебе никто не запрещает. Даже можешь сменить правила rollup-а и принудительно пересортировать

Fedor
28.06.2017
13:33:01
Спасибо!

Sergey
28.06.2017
13:35:00
Трям! А какова у вас нагрузка (качество количество) на чтение из КХ? У нас его когда начали мучать мелкими запросами типа дай 10000 метрик за 15 минут ему начинало как то не очень становиться

Denys ??
28.06.2017
13:36:01
Ничего себе у вас мелкие запросы

Sergey
28.06.2017
13:36:21
т.е. для всяких генераций стат. данных он клевый, а вот как хранилка метрик с рандомным чтением как то пока непонятно

Google
Admin
ERROR: S client not available

Denys ??
28.06.2017
13:36:24
Виспер пробовали такими же кормить?

Sergey
28.06.2017
13:37:03
ну... я имел в виду не 10000 метрик а условно 100 запросов по 100 метрик

т.е. на генерацию графиков в системе телеметрии его лучше не применять, или можно?

Виспер пробовали такими же кормить?
я с виспером делаю сейчас финт ушами - если получится готовое к проду - напишу :)

Denys ??
28.06.2017
13:42:49
У вас своя система или graphouse или Graphite-clickhouse?

Sergey
28.06.2017
13:42:53
@rlomonosov оченнна интересно

у меня зиппер стек карбона с кафкой

Denys ??
28.06.2017
13:44:37
Если зипперстек то КХ тогда куда?

Sergey
28.06.2017
13:45:15
а соседний отдел лил какие то свои метрики и вот сообщили такое - хочешь статистику - супер, хочешь его валить мелкими запросами - не супер

ну так вот у Романа я так понял произошел переход на КХ с графита, интересно насколько его сильно мучают и как он живет под такой нагрузкой

точнее с виспера как бекенда

Sergey
28.06.2017
13:56:20
Т.е. оно потом в графану отрисовывается? или в какую то свою БЛ? Хранилка - SSD?

Denys ??
28.06.2017
14:00:22
Ну у @rlomonosov оно не напрямую ж пишется и читается, а через умных демонов тм

Sergey
28.06.2017
14:00:56
т.е. + кеширование

Хорошо, спасибо за инфу!

Roman
28.06.2017
14:09:28
т.е. + кеширование
Нет кеширования - все запросы идут к КХ всегда. Сервер с ssd-ами. Отрисовывается в графит, свои дашборды (через графит) и графану (через графит)

Sergey
28.06.2017
14:14:01
а на сервер КХ самый толстый сколько мпс льется?

Roman
28.06.2017
14:27:23
а на сервер КХ самый толстый сколько мпс льется?
не очень много - 2млн точек в минуту, все уникальные (из разных серий). аплод в КХ раз в секунду

Google
Sergey
28.06.2017
14:28:54
мда, и как? запас есть или вышли на финишную прямую по требованиям и пока все норм?

у меня сырой поток 2-3М в сек с 1М+ униками - пока это все живо только благодаря аггрегациям

Denys ??
28.06.2017
14:32:10
3M/сек - это сильно

Vladimir
28.06.2017
14:33:46
у меня зиппер стек карбона с кафкой
Сейчас у зиппер есть маленькая проблема работы с кх. В кх надо отправлять всегда 1 запрос с глобами

Тогда он норм

Правда мы толком не тестировали на чтение пока

Sergey чисто на запись он очень интересен. У нас в тестах было 2.3м на сервер и пространство для оптимизации ещё процентов на 30

Но чтение мы так и не потестировали нормально

Руки пока не дошли

Roman
28.06.2017
14:36:53
мда, и как? запас есть или вышли на финишную прямую по требованиям и пока все норм?
когда переливал висперы, то лилось около 10 часов со скоростью 1.3млн точек в секунду - пользователи даже не заметили. С тех пор нагрузочного тестирования больше не проводил

Страница 197 из 681