@metrics_ru

Страница 96 из 681
Vladimir
10.02.2017
14:23:19
и то четверть периодически отваливается и вероятно останется как хранитель сакральных знаний на случай если совсем что-то плохо будет

Точнее если совсем подробно то так - изначально был один человек, потом стало двое. Потом тем кто занимался им изначально надоело и один ушел, другой вот набрал себе проектов кроме и графиту уделяет дай бог если 5% времени своего. Вместо них вот два новых (включая меня) занимаются сейчас всем, включая развитие, поддержку и пр.

тех кто раньше был используем как источник полезных знаний о том "почему было сделано так"

Nikolay
10.02.2017
14:26:06
два с четвертью
Крутая плотность!

Google
Vladimir
10.02.2017
14:26:54
Крутая плотность!
у нас основная проблема в том, что мы храним данные 5 лет (понижая точность) и сейчас под это выходит дофига места, а значит дофига машин. С учетом отказоустойчивости округленно 200 (196 что ли на практике)

по потоку данных можно было б меньше

Vladimir
10.02.2017
14:27:08
но блин (

и к сожалению подход немного у нас в сторону Графит как Сервис

то есть мы даем людям endpoint'ы и следим чтобы их данные не терялись

Nikolay
10.02.2017
14:27:48
два с четвертью
Если не секрет: Метрики все похожие друг на друга? Типа RUM мониторинг и тп Триггеры/алерты на какой процент метрик существуют?

Vladimir
10.02.2017
14:27:49
а зачем его используют люди - уже не наша проблема

Если не секрет: Метрики все похожие друг на друга? Типа RUM мониторинг и тп Триггеры/алерты на какой процент метрик существуют?
не все, метрики разные - есть как различное железо (включая например отслеживание пары ключевых показателей SMART'а для дисков в железе по серийникам этих дисков и потребления питания серверами и стойками в ДЦ), так и бизнес-метрики типа количество заказов в секунду по регионам

алерты не знаю на какой, сложно сказать

потому что в алертах часто запросы со звездочками

и надо отдельно идти по всем системам и брать списки таргетов и разворачивать

а я не очень хочу это делать

Google
Vladimir
10.02.2017
14:30:39
и отдельный вопрос, считать ли телевизоры с графиками этими триггерами, потому что там отдельное их количество и отдельная методика рассчета нужна

Nikolay
10.02.2017
14:30:58
У нас основной пожиратель ресурсов людей - разобрать требования заказчика, и настроить им адекватную реакцию на их хотелки. Т.е. запилить грамотно триггеры

but how
Просто $40К в год на Unlimited support

Vladimir
10.02.2017
14:31:46
мы можем помочь советом

посмотреть на дэшборд и посоветовать как его сделать читабельнее или быстрее

посмотреть на алерт и сказать почему запрос долго делается или почему делается неправильно

но не более

подход простой - вы шлете нам данные вашей системы, вам виднее что вам важно мониторить

Alex
10.02.2017
14:32:40
Платили бы лучше мне

Я тоже не дурак

Nikolay
10.02.2017
14:33:53
Все в ваших руках ) Info@magnit.ru

Платили бы лучше мне
но они реально помогаеют

когда заббикс стал умирать под нагрузкой (2.4) - они выпусили для нас спец-версию. с ядром от тройки (которая тогда еще не вышла), адаптированную под нас. и все взлетело

Dmitry
10.02.2017
14:35:18
Я тоже пока склоняюсь с CH

Vladimir
10.02.2017
14:35:35
Я тоже пока склоняюсь с CH
для меня у CH пока одна проблема - непонятно как удалять данные

Alex
10.02.2017
14:35:38
но они реально помогаеют
Я тоже реально помогаю

Вот сейчас сижу у кастомера флеймграфы рисую

Google
Vladimir
10.02.2017
14:35:53
В остальном он прям очень нравится

Dmitry
10.02.2017
14:35:58
там по месяцам, вроде, чистка

а так, да

2.5M записей/сек на вставку, это мощно

Vladimir
10.02.2017
14:36:13
там по месяцам, вроде, чистка
там еще проблема в том что либо все либо ничего

то есть предлагается пихать все метрики в 1 базу

и удалять партициями

Dmitry
10.02.2017
14:36:34
ну да

Vladimir
10.02.2017
14:36:36
сразу все метрики что попали в партицию

а если надо вычистить только те где name= - будут сложности

Dmitry
10.02.2017
14:36:59
это да

Vladimir
10.02.2017
14:37:02
кажется что можно, но как-то непонятно будет ли оно нормально работать

Nikolay
10.02.2017
14:37:03
подход простой - вы шлете нам данные вашей системы, вам виднее что вам важно мониторить
у нас другой подход. мы выступаем как сервис мониторинга: мы получаем требования вида "я девочка, я хочу поатьице", анализируем, разрабатываем метрики, триггеры, реализвуем это. реализуем дальнейшую реакцию на события (от позвонить, до выполнить инструкцию №4322)

Vladimir
10.02.2017
14:37:12
впрочем может у @rlomonosov есть уже какие-то наработки по этому

Dmitry
10.02.2017
14:37:17
ну как вариант -- выдрать, перефильтровать, положить заново

Google
Dmitry
10.02.2017
14:38:35
с другой стороны -- у influx retention policy тоже на таблицу

Vladimir
10.02.2017
14:38:39
@rlomonosov кстати, а вы не пробовали менять партицию?

Roman
10.02.2017
14:38:43
впрочем может у @rlomonosov есть уже какие-то наработки по этому
Мы сделали себе удаление из листинга и успокоились на этом. Данные по старым сериям продолжают лежать, но нас это не беспокоит - они нигде не отсвечивают, а места жрут копейки

Vladimir
10.02.2017
14:38:44
у метрики

Dmitry
10.02.2017
14:38:45
те же яйца

Admin
ERROR: S client not available

Vladimir
10.02.2017
14:39:10
редко, но есть такое

Dmitry
10.02.2017
14:39:12
плотность храниения у CH и у influx примерно одинаковая вышла

Nikolay
10.02.2017
14:39:15
и сколько у вас клиентов?
Мы подразделение компании. Клиентов не много - все бизнес-подразделения компании приходят к нам. ну может быть 100-200 сервисов/продуктов надо обслуживать

Vladimir
10.02.2017
14:39:15
и опять же - место жалко

Dmitry
10.02.2017
14:39:20
меня сейчас там больше ZK парит

Vladimir
10.02.2017
14:39:32
Roman
10.02.2017
14:39:34
у нас иногда люди хотят начать писать метрику с чистого листа
У нас такого нету. Так что это нас тоже не беспокоит

Dmitry
10.02.2017
14:39:53
лишняя сущность в проекте

Vladimir
10.02.2017
14:39:55
@rlomonosov еще мы все же хотим тэги с историей )

Dmitry
10.02.2017
14:39:58
и мы не умеем с ней работать

Vladimir
10.02.2017
14:40:07
эффективные

Dmitry
10.02.2017
14:40:15
порог вхождения в целом повысится для opensource версии

Google
Vladimir
10.02.2017
14:40:30
@dvolodin ZK не нужен для односерверного решения

но нужен если нужна репликация или распределенное хранилище

ptchol
10.02.2017
14:41:19
для меня у CH пока одна проблема - непонятно как удалять данные
партицирвоание, или что то типа compaction там же есть наверняка ?

Dmitry
10.02.2017
14:41:57
мне нужна репликация и распределенное хранилище

ptchol
10.02.2017
14:41:58
всё. я прочитал )

Dmitry
10.02.2017
14:42:01
тесты я без zk делал

Roman
10.02.2017
14:42:47
@rlomonosov еще мы все же хотим тэги с историей )
Мне кажется в таком случае стоит отказываться от протокола графита и поддерживать какой-нить инфлюкс. А это будет уже совсем другая история. Лично нам теги нужны для удобного сбора реалтайм-дашбордов, для этого история не очень нужна.

ptchol
10.02.2017
14:43:04
есть, да. И то и то )
Мы жили так с эллиптиксом, вцелом это ок, если есть реплика и возможность "роутинга шардов для чтения по репликам"

ptchol
10.02.2017
14:43:50
тоесть когда мы можешь сказать "читай вот эту часть с вот этой реплики", нам пришлось городить это в своём простеньком прокси

Vladimir
10.02.2017
14:43:54
@rlomonosov скажем так, кажется что если тэги слать и писать всегда - это будет очень большой оверхед

ptchol
10.02.2017
14:44:07
благо там был hash ring и сделать этот роутинг было не так сложно

Vladimir
10.02.2017
14:44:49
тоесть когда мы можешь сказать "читай вот эту часть с вот этой реплики", нам пришлось городить это в своём простеньком прокси
кликхаус может любой выполнять запросы на всем кластере, но можно посчитать по хэшу куда кто попадет

KOT
10.02.2017
18:48:25
@samosvat 1,3М записей в секунду в mysql???

Nikolay
10.02.2017
18:48:37
Ааааааааааа

Нет. Это количество метрик

На входе в систему

В среднем

Страница 96 из 681