@clickhouse_ru

Страница 262 из 723
Evgeniy
15.09.2017
00:16:51
а receive_timeout не работает на запросах типа clickhouse-client --query="INSERT INTO ... FORMAT TSV" --receive_timeout=3600 ? Прост поймали когда 5 минут не слать данные в stdin клиенту ничего, а потом опять слать, то сервер рвет соединение с эксепшеном по таймауту https://github.com/yandex/ClickHouse/blob/dc5eca0bebf41bf91b88ec3bcc24e664e5d22f3d/dbms/src/Server/TCPHandler.cpp#L267 и есть подозрение что настройка в 3600 не работает и юзается дефолтная 300

помогло только выставить ее в users.xml в 3600

Alexey
15.09.2017
00:31:25
Возможно, что такие настройки не вступают в силу, если соединение уже установлено. То есть, они должны быть выставлены до установления соединения. Хотя ничто не мешало бы смотреть на настройки и соответствующем образом менять параметры соединения. Но это не сделано. То есть, такое поведение неудобно, но объяснимо.

Александр
15.09.2017
04:59:37
Google
Tima
15.09.2017
05:50:14
Konstantin
15.09.2017
06:29:37
привет! подскажите как правильно добавить несколько часов к DateTime?

нужно что то вроде: SELECT NOW(), NOW() + INTERVAL 6 HOUR

Александр
15.09.2017
06:31:07
EventTime + 3600 * 6

Konstantin
15.09.2017
06:33:17
EventTime + 3600 * 6
спасибо))) не догадался что надо просто секундами добавлять, думал мб функция есть

Александр
15.09.2017
06:42:01
Все просто ) под капотом datetime это обычный unix timestamp

Kirill
15.09.2017
06:49:20
По воводу 1.1.54289 релиза, там исправлена ошибка ALTER на ReplicatedMergeTree после выполнения ALTER MODIFY элемента Nested структуры, мы вчера 1.1.54284 словили ошибку с битыми данными на ALTER Enum (начало жаловаться на то что типы не соответствуют). Еще мы вчера словили n-e количество сегфолтов на ровном, казалось бы, месте. Нужно было заинсталировать кластер с нуля, но часть таблиц у нас недоехала, к ним шло обращение и сервер отдавал станратно что таблици нет, после этого вкатили CREATE TABLE ... ON CLUSTER и ноды стали вываливаться одна за другой Кусок лога https://gist.githubusercontent.com/kshvakov/0b27e91074533f5549ec89e881a645e2/raw/b219c2405f14890f4eb83a4700d4f8fed766e00e/gistfile1.txt Плюс еще что-то пошло нетак с создание MATVIEW и при вставке в целевую таблицу ругалось что таблици от VIEW нет, создать ее нельзя т.к. ругалось на то что реплика уже существует (VIEW - реплицируемая) Короче, вчера у нас была маленькая пятница )

Александр
15.09.2017
06:51:33
По воводу 1.1.54289 релиза, там исправлена ошибка ALTER на ReplicatedMergeTree после выполнения ALTER MODIFY элемента Nested структуры, мы вчера 1.1.54284 словили ошибку с битыми данными на ALTER Enum (начало жаловаться на то что типы не соответствуют). Еще мы вчера словили n-e количество сегфолтов на ровном, казалось бы, месте. Нужно было заинсталировать кластер с нуля, но часть таблиц у нас недоехала, к ним шло обращение и сервер отдавал станратно что таблици нет, после этого вкатили CREATE TABLE ... ON CLUSTER и ноды стали вываливаться одна за другой Кусок лога https://gist.githubusercontent.com/kshvakov/0b27e91074533f5549ec89e881a645e2/raw/b219c2405f14890f4eb83a4700d4f8fed766e00e/gistfile1.txt Плюс еще что-то пошло нетак с создание MATVIEW и при вставке в целевую таблицу ругалось что таблици от VIEW нет, создать ее нельзя т.к. ругалось на то что реплика уже существует (VIEW - реплицируемая) Короче, вчера у нас была маленькая пятница )
У меня была похожая проблема с ddl запросами. Ноды рандомно зависали, причем всегда две и из разных шардов. Вылечил обновлением.

Но после обновления появилась проблема с limit by )

Kirill
15.09.2017
06:52:41
А с ним что не так и в какой версии ?

Александр
15.09.2017
06:54:19
Могу чуть позже сказать версию, еще в дороге, не помню точно какая у нас сейчас. Проблему сейчас в логе найду, мы с Алексеем ее обсуждали

Kirill
15.09.2017
06:55:05
ОК

Александр
15.09.2017
06:58:50
Отправил в личку, т.к. там 18 сообщений

Google
Konstantin
15.09.2017
07:00:13
а в новой версии убрали лимит на размер словаря?

Александр
15.09.2017
07:46:54
Там же лимит вроде как прописывался изначально? Т.е. сколько максимум словарь может сожрать оперативки

Konstantin
15.09.2017
07:52:45
там был лимит на количество строк около 2млн

Vladimir
15.09.2017
08:02:04
всем привет. есть необходимость перераспределить данные - добавили в кластер новый шард, хочется не заливать новые данные только на него, а перераспределить старые. решардинг, насколько я понимаю, до сих пор в бетте. есть идея сделать через detach/attach partition, но не уверен, что кликхаус нормально на такое отреагирует. никто не пробовал? или может есть другие идеи, как такое сделать?

Kirill
15.09.2017
08:04:27
Отлично отреагирует на DETACH/ATTACH

Vladimir
15.09.2017
08:05:49
вес шарда - это хорошо. но заливаться будет только на него (а потом и выборка будет только с него). не очень хочется такого перекоса по нагрузке.

Tima
15.09.2017
08:06:34
Так сначала укажите новому шардру сильно больший вес. А когда данные выровняются - уберите перекос

Kirill
15.09.2017
08:08:05
Часто всем более нужны новые данные, поэтому в какой-то момент можно остаться с 1-м сервером если так веса крутить

Vladimir
15.09.2017
08:10:44
вот я тоже об этом подумал. что в какой-то момент большая часть запросов будет валиться на него

Mikhail
15.09.2017
08:13:35
Привет! Подскажите, пожалуйста, а если какая-нибудь настройка для ограничения времени выполнения запроса?

Vladimir
15.09.2017
08:23:37
Отлично отреагирует на DETACH/ATTACH
а ключ шардирования? он только на вставку влияет? т.е. в данных его нет и т.п. ведь при переносе мы, по сути, его принудительно меняем для тех данных, что были ранее вставлены

Kirill
15.09.2017
08:24:03
Да, только на вставу в distributed

Vladimir
15.09.2017
08:24:20
не нашёл информации об этом в доке... отлично. спасибо!

Konstantin
15.09.2017
09:17:31
а сколько времени может выполняться rename table?)

уже минут 10 висит rename что может быть не так?

Alexey
15.09.2017
09:22:26
RENAME ждёт выполнения всех остальных запросов. Если запросы идут непрерывно, то будет ждать вечно.

Konstantin
15.09.2017
09:24:27
Алексей, а у нас нет ддругих запросов, это локальный тест, движок replacingMergeTree и судя по логу чтото мержится в это время

Alexey
15.09.2017
09:31:36
Мержится всё это время?

Google
Konstantin
15.09.2017
09:32:03
ага

Alexey
15.09.2017
09:32:51
Мержи тоже блокируют rename.

Konstantin
15.09.2017
09:34:06
хм, т.е. пока движок сам не закончит мерж то rename не случится?

а прервать тогда можно rename?

Alexey
15.09.2017
09:35:28
Нет, он не прерывается. Если совсем плохо, то можно сделать forcerestart сервера.

Konstantin
15.09.2017
09:35:58
ок, понятно. Спасибо!

вопрос от коллеги - а можно индексы расположить отдельно? чтобы они были на ssd а основные данные на рейде?

Alexey
15.09.2017
11:05:58
Такой возможности нет. Но вряд ли это требуется для ClickHouse, потому что индексы занимают очень мало места и кэшируются в оперативке. Проверьте: find /opt/clickhouse -name '*.idx' -or -name '*.mrk' | xargs wc -c

Konstantin
15.09.2017
11:07:35
ок, спасибо =)

M
15.09.2017
12:35:04
Добрый день, подскажите секция With в Select умеет только скалярные значения возвращать? Есть желание сделать следующе: WITH (SELECT id FROM dictionaries.dic) AS dic_items SELECT f1 FROM table WHERE f2 in dic_items Но это только генерит ошибоньку DB::Exception: Scalar subquery returned more than one row...

Сделать один подзапрос в словарь по условию, и потом эти значения использовать в селекте

Alexey
15.09.2017
12:35:59
Да, только скалярные.

M
15.09.2017
12:36:10
Спасибо

Kirill
15.09.2017
12:38:03
Да, местами очень не хватает CTE

Virus
15.09.2017
13:26:17
Здравствуйте! Падаем с ошибками: 2017.09.15 13:25:41.593455 [ 2003 ] <Error> void DB::ReplicatedMergeTreeRestartingThread::run(): std::exception. Code: 1001, type: std::system_error, e.what() = Resource temporarily unavailable 2017.09.15 13:25:41.593922 [ 2002 ] <Error> void DB::ReplicatedMergeTreeRestartingThread::run(): std::exception. Code: 1001, type: std::system_error, e.what() = Resource temporarily unavailable 2017.09.15 13:25:41.600634 [ 2004 ] <Error> void DB::ReplicatedMergeTreeRestartingThread::run(): std::exception. Code: 1001, type: std::system_error, e.what() = Resource temporarily unavailable что может быть?

Alexey
15.09.2017
13:30:45
Используется очень большое количество мелких таблиц - создаётся много потоков - следующий поток невозможно создать.

Paul
15.09.2017
13:37:13
коллеги, а где-то существует репозиторий с пакетами clickhouse для debian?

Alexey
15.09.2017
13:44:06
Не видел. Часто можно выбрать "соответствующую" Ubuntu и взять пакет для ней.

Paul
15.09.2017
13:45:11
а какая убунта соответсвует debian jessie?

Alexey
15.09.2017
13:46:36
Не знаю. Надеюсь, кто-нибудь другой в этом чате подскажет.

Google
Oleg
15.09.2017
13:46:40
14-15

15.10 wily jessie / sid 15.04 vivid jessie / sid 14.10 utopic jessie / sid 14.04 trusty jessie / sid

Paul
15.09.2017
13:47:02
спасибо!

Konstantin
15.09.2017
13:49:39
а можно выполнить sql запрос из файла конфигурации словаря?

papa
15.09.2017
13:50:47
в общем случае у словаря нет запроса, который можно выполнить в CH. а что вы хотите получить?

Konstantin
15.09.2017
13:56:11
скажаем так хотели сделать в mysql view но не получается из-за вложенности select'ов если select разбивать на разные view то почемуто нарушается структура выходных данных, поэтому хотели налету делать как обычный запрос

Mike
15.09.2017
13:57:24
Помогите раступить обратно? КХ слушает только локалосты, а пользователю можно коннектиться с других хостов. Что-бы могло быть? ➜ ~ netstat -nlp | grep clic tcp 0 0 127.0.0.1:9000 0.0.0.0:* LISTEN 8584/clickhouse-ser tcp 0 0 127.0.0.1:9009 0.0.0.0:* LISTEN 8584/clickhouse-ser tcp 0 0 127.0.0.1:8123 0.0.0.0:* LISTEN 8584/clickhouse-ser tcp6 0 0 ::1:9000 :::* LISTEN 8584/clickhouse-ser tcp6 0 0 ::1:9009 :::* LISTEN 8584/clickhouse-ser tcp6 0 0 ::1:8123 :::* LISTEN 8584/clickhouse-ser а в users.xml 68 <networks incl="networks" replace="replace"> 69 <ip>::/0</ip> 70 </networks>

Рестарт делал даже

Alexey
15.09.2017
13:58:56
listen_host в config.xml

Mike
15.09.2017
14:00:02
Ой, это с апдейтом, наверное прилетело? Я не менял и работало

Алексей, спасибо, заработало!

Alexey
15.09.2017
14:00:48
Довольно давно (не меньше полугода назад) было изменение, что сервер слушает по-умолчанию только localhost.

Mike
15.09.2017
14:01:05
Это один из самых старых инстансов ?

yuyu
15.09.2017
14:59:15
Нет, дело в старой версии. собрал 1.1.54236 - и в ней плохо.
Интересно: нашёл способ как заставить тестовый пример заработать в этой старой версии. Если вместо (position(ip_prefix,':') > 0) ? IPv6StringToNum(extract(ip_prefix,'^(.+)/')) : IPv6StringToNum('0') as ip6 написать (position(ip_prefix,':') > 0) ? IPv6StringToNum(extract(ip_prefix,'^(.+)/')) : IPv6StringToNum(ip_prefix) as ip6 то всё отрабатывает нормально без вылета по эксепшн. PS: и, по-хорошему, надо было бы заменить формат в последнем pipe на FORMAT Native, но и с CSV прокатило (повезло).

Igor
15.09.2017
19:26:40
Товарищи, не подскажите c++ либу для работы с clickhouse? Насколько жив проект clickhouse-cpp? Спасибо.

prll
15.09.2017
19:38:11
если не пугает размер и время сборки - весь clickhouse можно собрать как so и использовать что надо

Virus
16.09.2017
07:29:11
Здравствуйте! А как наверняка выяснить лидера из двух реплик одного шарда?

Vladimir
16.09.2017
19:53:29
Маленькии вопросик по drop partition Если запустить на распределенной таблице можно надеятся что выполнится на всех нижележащих MetgeTree ?

Google
Igor
16.09.2017
20:36:43
Можно узнать о методах компрессии чисел с плавающей точкой? Можно ли использовать КХ для задачи записи в реальном времени и хранения измерений 1,5 млн. аналоговых сигналов? Какой движок таблиц посоветуете для такой задачи? Спасибо.

Александр
16.09.2017
21:04:16
Запрос должен полететь по кластеру

Или речь не об этом?

Vladimir
16.09.2017
21:04:40
Спасибо

Об этом

наверное

Александр
16.09.2017
21:05:36
Ну я так понял, что есть кластер и нужно дропнуть партицию с таблицы на всем кластере. Если речь об этом, то ON CLUSTER должен решить эту проблему

Vladimir
16.09.2017
21:05:59
да об этом, спсб

Александр
16.09.2017
21:06:17
Пожалуйста :)

Можно узнать о методах компрессии чисел с плавающей точкой? Можно ли использовать КХ для задачи записи в реальном времени и хранения измерений 1,5 млн. аналоговых сигналов? Какой движок таблиц посоветуете для такой задачи? Спасибо.
Не знаю на счет чисел с плавающей точкой, но у меня есть БД собранная из файлов, которые в сжатом виде весят 400 Gb. Таблица с нагенерированными данными соразмерная количеству строк в файлах, а их примерно 3ккк, весит в сжатом виде всего 22 Gb. Все данные - строки, в таблице всего 4 колонки. Так что сжатие очень хорошее, даже на строках.

Vladislav
17.09.2017
18:23:32
Всем привет. Подскажите, плиз, пытаемся внедрить графану, попробовали datasource от vertamedia, но он какой-то кривой(Графики при группировки по дате странно выглядят, таблицы по датам в принципе чушь показывают). Есть ли какой-то аналог datasource?(на сайте графаны не нашел) Или может посоветуете аналогичную тулзу с конструктором отчетов\графиков?

Страница 262 из 723