@clickhouse_ru

Страница 529 из 723
Diomid
15.05.2018
18:37:18
В документации сказано, что надо использовать зуукипер для этих целей и дистрибьютед таблицы вместе. Видимо я неправильно понял. Можете привести боевой пример пожалуйста или ссылку.

Diomid
15.05.2018
18:46:33
Спасибо!

Перепутал типы таблиц. Хотел все сказать про ReplicatedMergeTree.

Google
Egor
16.05.2018
06:14:53
Доброго дня. Подскажите, обновление на новую версию как проходит? Просто накатывание новой версии?

А то я что-то в доках не вижу эту тему. Нужно с версии 1.1.54327 обновиться до последней

Гаврилов
16.05.2018
06:15:56
yum upgrade ?

Egor
16.05.2018
06:16:01
Точнее вопрос такой: хочу новую версию натравить на старые данные, кто-нибудь так делал?

Tima
16.05.2018
07:09:36
Точнее вопрос такой: хочу новую версию натравить на старые данные, кто-нибудь так делал?
Да, делал. Выключаете КХ, обновляете пакеты clickhouse-server и clickhouse-client, стартуете КХ, ждете пока подхватятся данные

Повторяете для всех серверов с КХ

Egor
16.05.2018
07:15:34
Напомните, как директива называлась, которая настраивала сбор данных материалайзед вью по времени ?

хочу чтоб сбрасывал данные раз в 5 сек

Ульяна
16.05.2018
08:57:46
Почему Clickhouse называется Clickhouse?

Гаврилов
16.05.2018
08:58:25
домик для кликов?)

Stanislav
16.05.2018
08:59:50
подозреваю, что имелся ввиду clickchaos, который надо было упорядочивать, но таки решили не раздувать :-)

Google
Vitaly
16.05.2018
09:02:00
Почему Clickhouse называется Clickhouse?
рискну предположить, что это про кликстрим и warehouse https://en.wikipedia.org/wiki/Clickstream https://en.wikipedia.org/wiki/Data_warehouse

Kirill
16.05.2018
10:16:45
Скажите пожалуйста, где прочитать про то, как кликхаус хранит дефолтные (пустые) значения колонок. Если много полей не будут иметь значения - как это отразится на занимаемом базой месте?

Wolf
16.05.2018
10:17:30
Ну оно будет просто очень хорошо сжиматься

Kirill
16.05.2018
10:18:45
Т.е. что-то типа 1 бита на запись просто чтобы знать - дефолтное значение согласно типу или нет?

Ульяна
16.05.2018
10:20:31
домик для кликов?)
мне тоже эта версия нравится)

Wolf
16.05.2018
10:37:54
Kirill
16.05.2018
10:38:17
ага, ок, спасибо

Александр
16.05.2018
11:25:38
А в докере почему то не обновляются словари по таймауту?

Александр
16.05.2018
11:47:46
Ну потому что оно только в докере себя так странно ведет

У словаря lifetime 55 секунд. Данные записались в словарь и минут 10 висели без обновления, пока я принудительно не сделал reload dictionary. После этого все изменения подхватывались корректно через указанный lifetime.

Wolf
16.05.2018
11:49:06
Ну надо логи видимо и конфиги смотреть

Александр
16.05.2018
11:51:58
Привет ! а https://github.com/yandex/clickhouse-jdbc по http на кластер ходит или там сложнее все ? Встал вопрос замокать кластер чтобы посмотреть на клиент , чтобы слабое место найти Клиент ходит через clickhouse-jdbc - была идея замокать http endpoint

Александр
16.05.2018
11:57:00
Да, ходит по http
правильно ли я понимаю, что могу поднять http endpoint с ?query, указать ip и запросы туда пойдут ?

Александр
16.05.2018
12:19:46
да
Спасибо, попробуем

Maksim
16.05.2018
13:58:39
митап в 18:30 ?

Alexey
16.05.2018
14:03:31
18 - встреча гостей, 19 - начало докладов.

Google
Alexey
16.05.2018
14:04:02
Да, приходите в 18 30 :)

dmks
16.05.2018
14:10:21
ClickHouse C++ Meetup https://events.yandex.ru/events/meetings/16-May-2018/
Прошу прощения, а регистрация закрыта совсем? Только увидел :(

Mikhail
16.05.2018
14:22:29
после добавления колонки в середину получаю ошибки: DB::Exception: Cannot append block to another: different type of columns at index 5. видимо как-то не правильно вставляю колонку структура такая: my_table (Distributed), my_table_data - таблица с данными 2 реплики на каждой делаю ALTER TABLE my_table ADD COLUMN ALTER TABLE my_table_data ADD COLUMN ON CLUSTER - сделать нельзя, т.к. старая версия ch, не поддерживается такая вставка подскажите, как правильно делать добавление колонки?

похоже проблема из-за расхождения реплик

по сути вопрос, как добавить колонку, если есть 2 реплики и нет поддержки ON CLUSTER

Tima
16.05.2018
14:35:12
по сути вопрос, как добавить колонку, если есть 2 реплики и нет поддержки ON CLUSTER
Скорее всего так: 1. остановить запись 2. дождаться окончания репликации 3. расширить все таблицы 4. вернуть запись

Mikhail
16.05.2018
14:36:46
да, тоже об этом подумал, видимо так придется

Alexandr
16.05.2018
15:00:27
Все снова привет. Есть простой вопрос: Безопасно ли делать insert into из select, где источник и назначение одна и та же таблица? Сейчас все работает правильно, но не нашел в документации, что так и останется. Спасибо

Combot
16.05.2018
15:00:47
combot.org/chat/-1001080295593

Alex
16.05.2018
15:02:02
коллеги, подскажите пожалуйста, допустимо ли делать бэкапы через SELECT * FORMAT Native ? не будет ли на нодах сильного жора по памяти для больших партиций.

sha-bang
16.05.2018
15:03:50
Приветствую Правильно ли я понимаю что для подсчета количество операциий в секунду можно получить из Запись select * from system.metrics where metric = ''Write" Чтение select * from system.metrics where metric = ''Read" А есть возможность аналогично получить размер запроса?

Egor
16.05.2018
15:33:30
про жор памяти не скажу

Alex
16.05.2018
15:46:10
сразу скажу, что восстанавливаются большие объёмы Очень долго
скорость восстановления не критична, просто у нод есть лимиты по памяти, не хотелось бы чтоб бэкап вылетал по лимитам

Egor
16.05.2018
15:46:38
не думаю, что по памяти вылетит. читает с диска без транзакций итд

Pavel
16.05.2018
15:52:05
а не отвечает ли Primary key за уникальность?

или в таблице могут быть данные с одинаковым PK?

Andrey
16.05.2018
15:52:46
Pavel
16.05.2018
15:52:55
Круто

Roman
16.05.2018
15:53:21
если это не ReplacingMergeTree, где в каком-то роде отвечает )

Google
Andrey
16.05.2018
15:53:48
Он отвечает за построение индекса по MergeTree таблицам.

Kirill
16.05.2018
16:07:56
В документации к описанию TSVWithNames (https://clickhouse.yandex/docs/ru/formats/tabseparatedwithnames/) есть вот такая фраза, которая немного сбивает с толку: "вы не можете использовать имена столбцов, чтобы указать их порядок расположения". Как ее стоит понимать?

Т.е. строка реально игнорируется и это сделать просто для удобства, чтобы не заморачиваться с удалением первой строки при вставке самостоятельно?

Alexander
16.05.2018
16:12:11
Возможно здесь уже задавали этот вопрос, есть табличка GraphiMergeTree с кастомным партицированием. Почему после OPTIMIZE партиции останется несколько файлов? , Т.е. я вижу несколько кусков этой таблицы вместо ожидаемого одного.

Tatiana
16.05.2018
16:16:41
по сути вопрос, как добавить колонку, если есть 2 реплики и нет поддержки ON CLUSTER
ALTER TABLE реплицируется. Если вы добавили колонку в одной из реплик, и она не прилетела в остальные реплики, вам надо искать, что пошло не так.

конечно, если вы в Replicated*MergeTree колонку добавляли

во все остальные Engines надо добавлять руками на каждом сервере

Andrey
16.05.2018
16:19:59
Если кто-то знает как рассчитывать маркетинговые воронки для сессии пользователя, при учёте того, что пользователь может несколько раз попать в воронку за одну сессию - пришлите варианты запросов

papa
16.05.2018
16:21:04
и надо эти несколько раз посчитать как больше одного?

Andrey
16.05.2018
16:21:27
Именно

Я два раза за сессию прошёл одну воронку, и это должны быть два хита

Здесь вопрос в том, как побить сессию на новый этап воронки

Предположим что я делаю пример из лекции Марии с arrayFilter



И вот я получаю результаты поподания (где эти номера порядковый номер в сессии)

И тут я вижу две воронки

11 -> 13 -> 15

78 -> 80

Но если считать по лекции, попадание будет одно

papa
16.05.2018
16:29:22
тут есть разные варианты что чем считать. вот если бы у вас было [11,12] [13,14] [15] то это уже две воронки, или еще нет. можно искать покрытие независимыми цепями, можно бить по времени и начинать вторую воронку после окончания первой,

Google
papa
16.05.2018
16:30:22
в любом случае для запроса это может оказаться тяжеловато, может sequenceCount что-нибудь может посчитать, а может нет.

Andrey
16.05.2018
16:31:39
ок, попробую sequenceCount

Это что было нужно!

Спасибо

Diomid
16.05.2018
16:39:48
Скажите пожалуйста, есть те, кто смог подружить КХ с Зуукипером для репликации? Что-то у меня не получается данные отреплицировать.

Andrey
16.05.2018
16:47:05
в любом случае для запроса это может оказаться тяжеловато, может sequenceCount что-нибудь может посчитать, а может нет.
SELECT sum(step_1), sum(step_2), sum(step_3) FROM ( SELECT session_id, countIf( first_cond ) AS step_1, sequenceCount('(?1).*(?2)')(datetime , first_cond , second_cond ) AS step_2, sequenceCount('(?1).*(?2).*(?3)')(datetime, first_cond , second_cond, third_cond ) AS step_3 FROM events GROUP BY session_id )

Теперь осталось придумать как это переписать на функции высшего порядка

Diomid
16.05.2018
17:40:44
а что конкретно не получается?
Конкретно не получается реплицировать даннные. Не понимаю, что мне нужно написать в конфиге КХ для этих целей. Я указал <zookeeper> </zookeeper> сервера. Вопрос надо ли мне указывать настройки <remote_servers> и там прописывать replica? + Откуда брать параметры при создании таблицы '/clickhouse/tables/{shard}/hits', '{replica}'

Tatiana
16.05.2018
17:42:42
> Я указал <zookeeper> </zookeeper> сервера. Этого достаточно. Параметры при создании таблицы использовать не обязательно. Если вы хотите их использовать, надо прописать их в секции <macros>

Страница 529 из 723