
Vladimir
10.02.2017
14:23:19
и то четверть периодически отваливается и вероятно останется как хранитель сакральных знаний на случай если совсем что-то плохо будет
Точнее если совсем подробно то так - изначально был один человек, потом стало двое. Потом тем кто занимался им изначально надоело и один ушел, другой вот набрал себе проектов кроме и графиту уделяет дай бог если 5% времени своего. Вместо них вот два новых (включая меня) занимаются сейчас всем, включая развитие, поддержку и пр.
тех кто раньше был используем как источник полезных знаний о том "почему было сделано так"

Nikolay
10.02.2017
14:26:06

Google

Vladimir
10.02.2017
14:26:54
Крутая плотность!
у нас основная проблема в том, что мы храним данные 5 лет (понижая точность) и сейчас под это выходит дофига места, а значит дофига машин. С учетом отказоустойчивости округленно 200 (196 что ли на практике)
по потоку данных можно было б меньше

Алексей
10.02.2017
14:27:06

Vladimir
10.02.2017
14:27:08
но блин (
и к сожалению подход немного у нас в сторону Графит как Сервис
то есть мы даем людям endpoint'ы и следим чтобы их данные не терялись

Nikolay
10.02.2017
14:27:48
два с четвертью
Если не секрет:
Метрики все похожие друг на друга? Типа RUM мониторинг и тп
Триггеры/алерты на какой процент метрик существуют?

Vladimir
10.02.2017
14:27:49
а зачем его используют люди - уже не наша проблема
алерты не знаю на какой, сложно сказать
потому что в алертах часто запросы со звездочками
и надо отдельно идти по всем системам и брать списки таргетов и разворачивать
а я не очень хочу это делать

Google

Alex
10.02.2017
14:30:35

Vladimir
10.02.2017
14:30:39
и отдельный вопрос, считать ли телевизоры с графиками этими триггерами, потому что там отдельное их количество и отдельная методика рассчета нужна

Nikolay
10.02.2017
14:30:58
У нас основной пожиратель ресурсов людей - разобрать требования заказчика, и настроить им адекватную реакцию на их хотелки. Т.е. запилить грамотно триггеры
but how
Просто
$40К в год на Unlimited support

Vladimir
10.02.2017
14:31:46
мы можем помочь советом
посмотреть на дэшборд и посоветовать как его сделать читабельнее или быстрее
посмотреть на алерт и сказать почему запрос долго делается или почему делается неправильно
но не более
подход простой - вы шлете нам данные вашей системы, вам виднее что вам важно мониторить

Alex
10.02.2017
14:32:40
Платили бы лучше мне
Я тоже не дурак

Nikolay
10.02.2017
14:33:53
Все в ваших руках )
Info@magnit.ru
когда заббикс стал умирать под нагрузкой (2.4) - они выпусили для нас спец-версию. с ядром от тройки (которая тогда еще не вышла), адаптированную под нас. и все взлетело

Dmitry
10.02.2017
14:35:18
Я тоже пока склоняюсь с CH

Vladimir
10.02.2017
14:35:35

Alex
10.02.2017
14:35:38
Вот сейчас сижу у кастомера флеймграфы рисую

Google

Vladimir
10.02.2017
14:35:53
В остальном он прям очень нравится

Dmitry
10.02.2017
14:35:58
там по месяцам, вроде, чистка
а так, да
2.5M записей/сек на вставку, это мощно

Vladimir
10.02.2017
14:36:13
то есть предлагается пихать все метрики в 1 базу
и удалять партициями

Dmitry
10.02.2017
14:36:34
ну да

Vladimir
10.02.2017
14:36:36
сразу все метрики что попали в партицию
а если надо вычистить только те где name= - будут сложности

Dmitry
10.02.2017
14:36:59
это да

Vladimir
10.02.2017
14:37:02
кажется что можно, но как-то непонятно будет ли оно нормально работать

Nikolay
10.02.2017
14:37:03

Vladimir
10.02.2017
14:37:12
впрочем может у @rlomonosov есть уже какие-то наработки по этому

Dmitry
10.02.2017
14:37:17
ну как вариант -- выдрать, перефильтровать, положить заново

Vladimir
10.02.2017
14:37:36
и положить
обратно
и потом запустить optimize чтобы оно схлопнулось

Google

Dmitry
10.02.2017
14:38:35
с другой стороны -- у influx retention policy тоже на таблицу

Vladimir
10.02.2017
14:38:39
@rlomonosov кстати, а вы не пробовали менять партицию?

Roman
10.02.2017
14:38:43

Vladimir
10.02.2017
14:38:44
у метрики

Dmitry
10.02.2017
14:38:45
те же яйца

Vladimir
10.02.2017
14:38:58
удалив старый шлак

Admin
ERROR: S client not available

Vladimir
10.02.2017
14:39:10
редко, но есть такое

Dmitry
10.02.2017
14:39:12
плотность храниения у CH и у influx примерно одинаковая вышла

Nikolay
10.02.2017
14:39:15
и сколько у вас клиентов?
Мы подразделение компании. Клиентов не много - все бизнес-подразделения компании приходят к нам. ну может быть 100-200 сервисов/продуктов надо обслуживать

Vladimir
10.02.2017
14:39:15
и опять же - место жалко

Dmitry
10.02.2017
14:39:20
меня сейчас там больше ZK парит

Vladimir
10.02.2017
14:39:32

Roman
10.02.2017
14:39:34

Dmitry
10.02.2017
14:39:53
лишняя сущность в проекте

Vladimir
10.02.2017
14:39:55
@rlomonosov еще мы все же хотим тэги с историей )

Dmitry
10.02.2017
14:39:58
и мы не умеем с ней работать

Vladimir
10.02.2017
14:40:07
эффективные

Dmitry
10.02.2017
14:40:15
порог вхождения в целом повысится для opensource версии

Google

Vladimir
10.02.2017
14:40:30
@dvolodin ZK не нужен для односерверного решения
но нужен если нужна репликация или распределенное хранилище

ptchol
10.02.2017
14:41:19

Dmitry
10.02.2017
14:41:57
мне нужна репликация и распределенное хранилище

ptchol
10.02.2017
14:41:58
всё. я прочитал )

Dmitry
10.02.2017
14:42:01
тесты я без zk делал

Vladimir
10.02.2017
14:42:05

Roman
10.02.2017
14:42:47
@rlomonosov еще мы все же хотим тэги с историей )
Мне кажется в таком случае стоит отказываться от протокола графита и поддерживать какой-нить инфлюкс. А это будет уже совсем другая история. Лично нам теги нужны для удобного сбора реалтайм-дашбордов, для этого история не очень нужна.

ptchol
10.02.2017
14:43:04
есть, да. И то и то )
Мы жили так с эллиптиксом, вцелом это ок, если есть реплика и возможность "роутинга шардов для чтения по репликам"

Vladimir
10.02.2017
14:43:36

ptchol
10.02.2017
14:43:50
тоесть когда мы можешь сказать "читай вот эту часть с вот этой реплики", нам пришлось городить это в своём простеньком прокси

Vladimir
10.02.2017
14:43:54
@rlomonosov скажем так, кажется что если тэги слать и писать всегда - это будет очень большой оверхед

ptchol
10.02.2017
14:44:07
благо там был hash ring и сделать этот роутинг было не так сложно

Vladimir
10.02.2017
14:44:49

KOT
10.02.2017
18:48:25
@samosvat 1,3М записей в секунду в mysql???

Nikolay
10.02.2017
18:48:37
Ааааааааааа
Нет. Это количество метрик
На входе в систему
В среднем