@clickhouse_ru

Страница 173 из 723
papa
19.06.2017
23:07:16
а в статистике при этом что написано, 300М?

а у вас для древних дат статистика продолжает обновляться?

Maksim
19.06.2017
23:11:06
я туплю там тоже 300 млн. совпало

но все равно не пойму как тогда на основе большого количества данных построить отчет

Google
Maksim
19.06.2017
23:11:36
в тех же метриках явно можно фильтровать как угодно и группировать

papa
19.06.2017
23:12:59
а зачем toString()?

Maksim
19.06.2017
23:14:52
чтобы вместо пустых строк (где нету данных) не прилетала длинная невидимая строка с байтами

papa
19.06.2017
23:44:45
а откуда >100 байт на запись? дата регион*3 пол возраст штуки это примерно 2+2+2+2+1+1+4=14

данные в прошлое обновляются? если нет, то месяц надо один раз посчитать, а не при отчете.

userid есть, семплировать можно?

сколько строк в ответе, сколько машин хранят данные.

Maksim
20.06.2017
07:02:01
сколько строк в ответе, сколько машин хранят данные.
одна машина у нас. не понял на счет > 100 байт

А может ли долго запрос возвращаться из-за высокого IOPS ?

6 тыс IOPS

Andrey
20.06.2017
08:23:38
Может конечно. В случаях если вы берете много данных для расчёта (чтение с диска) или если вы уходите в своп в процессе расчёта. Или если стоят опции external_group_by, external_sort (в точном названии могу ошибиться)

Maksim
20.06.2017
08:25:13
Может конечно. В случаях если вы берете много данных для расчёта (чтение с диска) или если вы уходите в своп в процессе расчёта. Или если стоят опции external_group_by, external_sort (в точном названии могу ошибиться)
600+ млн записей по 40 полей. расчет суммы и группировка по 5 полям и сортировка по 5. смотрю по мониторингу что местам то 5 то 6 тыс IOPS. что значит external_group_by и external_sort? как можно оптимизить скорость выполнения?

Дмитрий
20.06.2017
08:26:51
По умолчанию КХ выполняет все операции в оперативной памяти, и, если ее не хватит, запрос со сложной групировкой может не выполниться. Для этого есть параметры max_bytes_before_external_group_by и max_bytes_before_external_sort, которые указывают после какого порога сбрасыавть данные во временные файлы на диск

Google
Maksim
20.06.2017
08:28:00
запустили запрос. еще выполняется



это memory

процессор



по IOPS пик был на 304

из этого следует что он упирается именно в проц?

Виктор
20.06.2017
08:33:55
Create table в студию

Дмитрий
20.06.2017
08:34:06
percent-steal в обычном режиме не должен быть таким высоким. Скорей всего на машине очень много чего работает одновременно, либо настройка КХ не совсем корректна, например, выставлен больший параметр по использованию потоков чем есть виртуальных процессоров на машине

Maksim
20.06.2017
08:36:15
Create table в студию
таблица содержит только 1 индекс на eventDate. запрос который запускаю - выше (вчера скидывал)

Maksim
20.06.2017
08:41:32
а как посчитать?

есть еще процесы которые просто висят не грузят проц. но жрут память таких много

Дмитрий
20.06.2017
08:42:10
ps ax | grep clickhouse-server | wc -l

Maksim
20.06.2017
08:42:31
ps ax | grep clickhouse-server | wc -l 2

и 2 виртуальных ядра

Дмитрий
20.06.2017
08:45:41
не ту команду дал

ps -axH | grep clickhouse-server | wc -l

Google
Дмитрий
20.06.2017
08:46:26
два ядра немного маловато для описанного вами профиля нагрузки

Maksim
20.06.2017
08:47:17
ps -axH | grep clickhouse-server | wc -l 43

Александр
20.06.2017
08:47:33
Я тестировал кх на 1 ядре и 4 гигах оперативы :) показал достаточно хороший результат с таблицей в 90 гигов и 18 колонками

Maksim
20.06.2017
08:48:19


idle 0 ) снова запустил запрос

Дмитрий
20.06.2017
08:48:59
вы уверены, что на машине только КХ? В скриншоте у вас там еще Java запущена

на Jenkins похоже

Maksim
20.06.2017
08:50:16
и jenkins есть да. но он не грузит ведь ничего

и apache стоит для tabix

и collectd для сбора метрик

Andrey
20.06.2017
08:51:22
виртуалка?

Maksim
20.06.2017
08:51:28
да

Andrey
20.06.2017
08:51:29
высокий steal-time это время сворованное у виртуалки гипервизором

Maksim
20.06.2017
08:51:51
amazon

Andrey
20.06.2017
08:52:07
Оу)

st — (Steal Time) время, «украденное» гипервизором у этой виртуальной машины для других задач (например работа другой виртуальной машины) это из википедии

т.е. в это время ваша вирта не работала

Maksim
20.06.2017
08:52:44
я знаю что такое steal

Ivan
20.06.2017
08:52:53
может помочь стоп-старт виртуалки

или снапшот - убиение - старт

Google
Maksim
20.06.2017
08:53:17
прод машину нельзя останавливать)

Ivan
20.06.2017
08:53:24
есть вероятность запуститься на новом гипервизоре, раз этот перегружен

если нельзя - нужна отказоустойчивость :)

тогда можно

тем более амазон - снапшот, запуск копии, доливка данных, переключение прода

Maksim
20.06.2017
08:55:37
можешь более подробно объяснить эту кухню

если остановить машину и снова включить - есть вероятность попасть на другой гипервизор и будет steal ниже, всегда?

Ivan
20.06.2017
08:56:45
нет

есть вероятность что на новом гипервизоре стил будет ниже :)

Vladimir
20.06.2017
08:57:12
это отдельная машина для кх. там только он и стоит. до запрос steal был 22%, после запроса 35-45. где можно уменьшить этот параметр ?
steal значит что на физ хосте оверселинг довольно высокий и тебя активно переключает гипервизор, если очень условно

а, уже ответили

Ivan
20.06.2017
08:58:39
но тебе никто не запрещает эту процедуру повторять регулярно

Vladimir
20.06.2017
08:58:41
@maksim_melnichuk условно представь себе секунду. Steal 50% значит что твоя машина хочет работать всю секунду, а ей дают только 0.5

условно и упрощенно

Ivan
20.06.2017
08:59:20
а когда у тебя кластер кх, который не умирает от выключения одной ноды, то это и вообще отлично - никто не заметит

Maksim
20.06.2017
09:02:15
в общем я так понял это проблема виртуализации

Pavel
20.06.2017
09:02:23
или выделения ресурсов

это не означает, что гипервизор сломался/плохой

это скорее означает, что потребление ресурсов больше, чем вы заплатили / выделено админами

и гипервизор режет это потребление в соотвествии с тем, что вам выделено.

Google
Pavel
20.06.2017
09:03:27
если мы говорим о нормальных облаках - а-ля амазон, гугл, азур - то на другой машине все будет точно-также

Maksim
20.06.2017
09:04:01
это значит что сервер упирается в нагрузку по тарифному плану и гипервизор режет ?

Pavel
20.06.2017
09:04:54
скорее всего именно это и значит, эта штука крайне специфична к типу гипервизора и ведет себя по-разному

другие инстансы имеют такие же конфиги железа и там тоже есть нунлевой steal?

Maksim
20.06.2017
09:05:44
окей кто работал с amazon какой тип инстанса предпочтительнее для кх ?

Pavel
20.06.2017
09:05:45
точно ли нагрузка на все инстансы идентичная?

Maksim
20.06.2017
09:05:54
ui сервер тоже бывает steal 40+ %

если нагрузки нету то steal вообще 0

https://aws.amazon.com/ru/ec2/instance-types/

какой инстанс нужен для нормальной работы кх ?

мы используем почти везде t2

может в этом проблема

Ivan
20.06.2017
09:11:40
сколько кредитов там осталось?

на т2

в информации по инстансу есть

Alexey
20.06.2017
09:14:12
Как раз статья на тему - сравнение ClickHouse на AWS с физическим сервером и с Redshift: https://www.altinity.com/blog/2017/6/20/clickhouse-vs-redshift

Страница 173 из 723