
Vladimir
05.12.2017
15:39:22
это пики. :)
я когда тестил КХ в прошлом году, у меня было неделю ровно 2.1кк в секунду, но графитных точек
уперлось в то что на тестовом сервере кончилось место
ну и да, write-only :)

Evgeny
05.12.2017
15:40:18

Google

vladimir
05.12.2017
15:40:54
Порядка 28 миллионов

Алексей
05.12.2017
15:41:08
у меня тоже пики были дофига. но сейчас я замечаю что запись может быть разной.
и да у меня конечно схема другая но всё равно.
высокая скорость будет оптимальными батчами с в одну таблицу одним форматом

Vladimir
05.12.2017
15:41:46

Алексей
05.12.2017
15:41:55
отклонения от оптимальной схемы более чем возможны.

Vladimir
05.12.2017
15:42:05
у каждых таких историй успеха к сожалению есть кучи "но должно быть..."
в этом суть

Алексей
05.12.2017
15:42:23
я так понимаю что в схеме выше батчинг за carbon-c-relay ?

Vladimir
05.12.2017
15:42:31

Алексей
05.12.2017
15:42:56
а да. не понял его там
а очередь где ?

Vladimir
05.12.2017
15:43:08
демонок который слушает графитный протокол, конвертирует в нативный формат и скидывает внутрь раз в секунду

Алексей
05.12.2017
15:43:10
на зукипере ?

Google

Vladimir
05.12.2017
15:43:18

Алексей
05.12.2017
15:43:33
ну на mainteince window

Vladimir
05.12.2017
15:43:40
вообще их две
carbon-clickhouse на диске мейнтенит очередь если вставка упала
и релей в памяти если тоже не смог отправить

Алексей
05.12.2017
15:45:18
толщина этой очереди будет бедой.

Vladimir
05.12.2017
15:45:28

Алексей
05.12.2017
15:45:40
у меня как то раз была ситуация когда кликхаус останавливался около 2 минут.

Vladimir
05.12.2017
15:45:46
там много заботливо разложенных граблей

Алексей
05.12.2017
15:45:49
стартовал гдето минуту
так что на ~5 минут как минимум нужна очередь. увы.
а рестарт железного сервера может и подольше если чего.

Vladimir
05.12.2017
15:46:47
ну само собой

Алексей
05.12.2017
15:47:21
схема хранения в очереди далека от отптимальной. так что тут будет еще 100гигов. на тупо подстраховку

Evgeny
05.12.2017
15:47:40
по диску просто

Vladimir
05.12.2017
15:47:54
@freeseacher суть в том что это внешние к КХ проблемы. КХ может держать 2М записей в секунду постоянно долго, если нет чтений
если есть чтения - там становится печальнее и нужен более жирный сервер уже

Алексей
05.12.2017
15:48:10
ну как нет чтений то :)

Google

Алексей
05.12.2017
15:48:18
в схеме потом еще появится chproxy

Vladimir
05.12.2017
15:48:19
@freeseacher а я про свой опыт говорил же

Алексей
05.12.2017
15:48:29
и мы это знаем, точно появится

Vladimir
05.12.2017
15:48:36
плюс я не помню какое у них там железо
@freeseacher в моих экспериментах год назад carbon-clickhouse + clickhouse выжирали 12 ядер на пару на потоке 2.1М метрик в секунду
@freeseacher и запросы сложные соответственно выполнялись довольно плохо при таком потоке
но добавив еще пару ядер сверху можно было б жить

Denys ??
05.12.2017
16:09:07
Так там же кластер КХ же? vladimir ?

Алексей
05.12.2017
16:09:56
Кластер да. И чо :)?

vladimir
05.12.2017
16:10:39
Да, но это не имеет особой разницы, так как все метрики из релеев летят на одну ноду, а потом разлетаются уже по реплике

Denys ??
05.12.2017
16:10:39
Ну и что смущает в 125 млн тогда?

vladimir
05.12.2017
16:11:40
Мы с виспером страдали при 10кк, а с КХ пусть и в пик но проверили 125кк

Denys ??
05.12.2017
16:11:56
оно имеет узкие места конечно, но 125 млн это далеко не предел.

vladimir
05.12.2017
16:12:07
Согласен

Denys ??
05.12.2017
16:12:19
а сколько нод в кластере и что за железо, если не секрет?

vladimir
05.12.2017
16:12:32
Это то что мы видели по факту.
3 ноды, 1 на запись 2 на чтение

Denys ??
05.12.2017
16:13:11
ноды в кластере выключали?

vladimir
05.12.2017
16:13:18
Да

Google

vladimir
05.12.2017
16:13:24
Все ок

Denys ??
05.12.2017
16:13:25
все 3 - реплики?
в смысле конфигурации КХ

vladimir
05.12.2017
16:14:07
Да все три, но по очереди само собой

Vladimir
05.12.2017
16:14:19

vladimir
05.12.2017
16:14:45
Я говорю про 10кк вновь пришедших

Vladimir
05.12.2017
16:15:02
Ну вновь пришедших да, создаются они не быстро
Но я бы не сказал что ситуация "пришло 10м новых метрик" это штатный режим работы

Admin
ERROR: S client not available

Denys ??
05.12.2017
16:17:41
Я бы сказал что ситуация "пришло 10М новых метрик" это режим работы "жопа"

Alexey
05.12.2017
16:18:14

vladimir
05.12.2017
16:18:18
Такой был, и мы встали в позу

Vladimir
05.12.2017
16:19:03

Alexey
05.12.2017
16:19:22
Такой был, и мы встали в позу
на самом деле при наличии достаточного количества памяти на сервере он нормально переживает это у нас вплоть до нескольких часов

Vladimir
05.12.2017
16:19:52
vladimir ну у нас на создании он не дропал
но создавал их долго

Alexey
05.12.2017
16:23:05
[cache]
max-size = 2147483648
[whisper]
workers = 48
max-updates-per-second = 30000
11kk метрик создаются около 2 часов при входящих ~450K точек в секунду

vladimir
05.12.2017
16:25:14
У нас воркеров было 56, а max-updates-per-second = 0
Мы пробовали 20000 - но любая перезагрузка go-carbon отрисовывала дыры в графиках
В КХ таких проблем нет

Google

Dmitry
05.12.2017
16:28:41
Наделал скринов, "как долбоебы-гошники из церкви метрик жгут про Python", пусть в @rudepython поржут :))

Алексей
05.12.2017
16:29:45

Evgeny
05.12.2017
16:30:30
Владимир почитав статью понял, почему у меня для аналогичной задачи кх не полетел (были проблемы при чтении) и что без вашего форка с окном для чтения метрик у меня ничего не получиться ;) профиль метрик очень похож на метрики кубера (то есть то нет, уников много а данных намного меньше)

vladimir
05.12.2017
16:31:34
@ihard, я рад что не зря писал!

Dmitry
05.12.2017
16:35:09

Roman
05.12.2017
16:35:53
А materialized view date_metrics уже существовал на момент загрузки данных со скоростью 125kk/m?

vladimir
05.12.2017
16:43:34
Нет
Вьюшке месяц только

Roman
05.12.2017
16:48:20
мы просто пытались использовать materialized view и КХ прям очень сильно деградировал по скорости. в результате забили и льем софтом сразу в несколько табличек

Сергей
05.12.2017
16:53:00

vladimir
05.12.2017
16:56:29
@rlomonosov это отличный вопрос для Алексея Миловидова! ;)

Dmitry
05.12.2017
16:57:17

Favoretti
05.12.2017
16:58:49
а де чатик по ансибл? ? (сорри за оффтоп)

Сергей
05.12.2017
17:03:29

Andrew
05.12.2017
17:08:27
Премного благодарен!

Сергей
05.12.2017
17:10:39

Favoretti
05.12.2017
17:11:13
Деда давно пора ботом заменить.

Andrew
05.12.2017
17:11:21

Сергей
05.12.2017
17:11:31