
Diomid
15.05.2018
18:37:18
В документации сказано, что надо использовать зуукипер для этих целей и дистрибьютед таблицы вместе. Видимо я неправильно понял. Можете привести боевой пример пожалуйста или ссылку.

Tatiana
15.05.2018
18:41:48

Diomid
15.05.2018
18:46:33
Спасибо!
Перепутал типы таблиц. Хотел все сказать про ReplicatedMergeTree.

Google

Egor
16.05.2018
06:14:53
Доброго дня. Подскажите, обновление на новую версию как проходит? Просто накатывание новой версии?
А то я что-то в доках не вижу эту тему. Нужно с версии 1.1.54327 обновиться до последней

Гаврилов
16.05.2018
06:15:56
yum upgrade ?

Egor
16.05.2018
06:16:01
Точнее вопрос такой: хочу новую версию натравить на старые данные, кто-нибудь так делал?

Tima
16.05.2018
07:09:36
Повторяете для всех серверов с КХ

Egor
16.05.2018
07:15:34
Напомните, как директива называлась, которая настраивала сбор данных материалайзед вью по времени ?
хочу чтоб сбрасывал данные раз в 5 сек

Ульяна
16.05.2018
08:57:46
Почему Clickhouse называется Clickhouse?

Гаврилов
16.05.2018
08:58:25
домик для кликов?)

Stanislav
16.05.2018
08:59:50
подозреваю, что имелся ввиду clickchaos, который надо было упорядочивать, но таки решили не раздувать :-)

Google

Vitaly
16.05.2018
09:02:00

Kirill
16.05.2018
10:16:45
Скажите пожалуйста, где прочитать про то, как кликхаус хранит дефолтные (пустые) значения колонок. Если много полей не будут иметь значения - как это отразится на занимаемом базой месте?

Wolf
16.05.2018
10:17:30
Ну оно будет просто очень хорошо сжиматься

Kirill
16.05.2018
10:18:45
Т.е. что-то типа 1 бита на запись просто чтобы знать - дефолтное значение согласно типу или нет?

Ульяна
16.05.2018
10:20:31

Wolf
16.05.2018
10:37:54

Kirill
16.05.2018
10:38:17
ага, ок, спасибо

Александр
16.05.2018
11:25:38
А в докере почему то не обновляются словари по таймауту?

Wolf
16.05.2018
11:47:26

Александр
16.05.2018
11:47:46
Ну потому что оно только в докере себя так странно ведет
У словаря lifetime 55 секунд. Данные записались в словарь и минут 10 висели без обновления, пока я принудительно не сделал reload dictionary. После этого все изменения подхватывались корректно через указанный lifetime.

Wolf
16.05.2018
11:49:06
Ну надо логи видимо и конфиги смотреть

Александр
16.05.2018
11:51:58
Привет ! а https://github.com/yandex/clickhouse-jdbc по http на кластер ходит или там сложнее все ?
Встал вопрос замокать кластер чтобы посмотреть на клиент , чтобы слабое место найти
Клиент ходит через clickhouse-jdbc - была идея замокать http endpoint

Alex
16.05.2018
11:54:29

Александр
16.05.2018
11:57:00
Да, ходит по http
правильно ли я понимаю, что могу поднять http endpoint с ?query, указать ip и запросы туда пойдут ?

Denis
16.05.2018
12:18:31

Александр
16.05.2018
12:19:46

Andrey
16.05.2018
13:24:24

Maksim
16.05.2018
13:58:39
митап в 18:30 ?

Alexey
16.05.2018
14:03:31
18 - встреча гостей, 19 - начало докладов.

Google

Alexey
16.05.2018
14:04:02
Да, приходите в 18 30 :)

dmks
16.05.2018
14:10:21

Mikhail
16.05.2018
14:22:29
после добавления колонки в середину получаю ошибки:
DB::Exception: Cannot append block to another: different type of columns at index 5.
видимо как-то не правильно вставляю колонку
структура такая: my_table (Distributed), my_table_data - таблица с данными
2 реплики
на каждой делаю
ALTER TABLE my_table ADD COLUMN
ALTER TABLE my_table_data ADD COLUMN
ON CLUSTER - сделать нельзя, т.к. старая версия ch, не поддерживается такая вставка
подскажите, как правильно делать добавление колонки?
похоже проблема из-за расхождения реплик
по сути вопрос, как добавить колонку, если есть 2 реплики и нет поддержки ON CLUSTER

Tima
16.05.2018
14:35:12

Mikhail
16.05.2018
14:36:46
да, тоже об этом подумал, видимо так придется

Alexandr
16.05.2018
15:00:27
Все снова привет. Есть простой вопрос: Безопасно ли делать insert into из select, где источник и назначение одна и та же таблица? Сейчас все работает правильно, но не нашел в документации, что так и останется. Спасибо

Combot
16.05.2018
15:00:47
combot.org/chat/-1001080295593

Alex
16.05.2018
15:02:02
коллеги, подскажите пожалуйста, допустимо ли делать бэкапы через SELECT * FORMAT Native ? не будет ли на нодах сильного жора по памяти для больших партиций.

sha-bang
16.05.2018
15:03:50
Приветствую
Правильно ли я понимаю что для подсчета количество операциий в секунду можно получить из
Запись
select * from system.metrics where metric = ''Write"
Чтение
select * from system.metrics where metric = ''Read"
А есть возможность аналогично получить размер запроса?

Egor
16.05.2018
15:33:30
про жор памяти не скажу

Alex
16.05.2018
15:46:10

Egor
16.05.2018
15:46:38
не думаю, что по памяти вылетит. читает с диска без транзакций итд

Pavel
16.05.2018
15:52:05
а не отвечает ли Primary key за уникальность?
или в таблице могут быть данные с одинаковым PK?

Andrey
16.05.2018
15:52:46

Pavel
16.05.2018
15:52:55
Круто

Roman
16.05.2018
15:53:21
если это не ReplacingMergeTree, где в каком-то роде отвечает )

Google

Andrey
16.05.2018
15:53:48
Он отвечает за построение индекса по MergeTree таблицам.

Kirill
16.05.2018
16:07:56
В документации к описанию TSVWithNames (https://clickhouse.yandex/docs/ru/formats/tabseparatedwithnames/) есть вот такая фраза, которая немного сбивает с толку: "вы не можете использовать имена столбцов, чтобы указать их порядок расположения". Как ее стоит понимать?
Т.е. строка реально игнорируется и это сделать просто для удобства, чтобы не заморачиваться с удалением первой строки при вставке самостоятельно?

Alexander
16.05.2018
16:12:11
Возможно здесь уже задавали этот вопрос, есть табличка GraphiMergeTree с кастомным партицированием. Почему после OPTIMIZE партиции останется несколько файлов? , Т.е. я вижу несколько кусков этой таблицы вместо ожидаемого одного.

Tatiana
16.05.2018
16:16:41
конечно, если вы в Replicated*MergeTree колонку добавляли
во все остальные Engines надо добавлять руками на каждом сервере

Andrey
16.05.2018
16:19:59
Если кто-то знает как рассчитывать маркетинговые воронки для сессии пользователя, при учёте того, что пользователь может несколько раз попать в воронку за одну сессию - пришлите варианты запросов

papa
16.05.2018
16:21:04
и надо эти несколько раз посчитать как больше одного?

Andrey
16.05.2018
16:21:27
Именно
Я два раза за сессию прошёл одну воронку, и это должны быть два хита
Здесь вопрос в том, как побить сессию на новый этап воронки
Предположим что я делаю пример из лекции Марии с arrayFilter
И вот я получаю результаты поподания (где эти номера порядковый номер в сессии)
И тут я вижу две воронки
11 -> 13 -> 15
78 -> 80
Но если считать по лекции, попадание будет одно

papa
16.05.2018
16:29:22
тут есть разные варианты что чем считать. вот если бы у вас было
[11,12] [13,14] [15] то это уже две воронки, или еще нет. можно искать покрытие независимыми цепями, можно бить по времени и начинать вторую воронку после окончания первой,

Google

papa
16.05.2018
16:30:22
в любом случае для запроса это может оказаться тяжеловато, может sequenceCount что-нибудь может посчитать, а может нет.

Andrey
16.05.2018
16:31:39
ок, попробую sequenceCount
Это что было нужно!
Спасибо

Diomid
16.05.2018
16:39:48
Скажите пожалуйста, есть те, кто смог подружить КХ с Зуукипером для репликации? Что-то у меня не получается данные отреплицировать.

Andrey
16.05.2018
16:47:05
в любом случае для запроса это может оказаться тяжеловато, может sequenceCount что-нибудь может посчитать, а может нет.
SELECT
sum(step_1),
sum(step_2),
sum(step_3)
FROM
(
SELECT
session_id,
countIf( first_cond ) AS step_1,
sequenceCount('(?1).*(?2)')(datetime , first_cond , second_cond ) AS step_2,
sequenceCount('(?1).*(?2).*(?3)')(datetime, first_cond , second_cond, third_cond ) AS step_3
FROM events
GROUP BY session_id
)
Теперь осталось придумать как это переписать на функции высшего порядка

Tatiana
16.05.2018
17:36:11

Diomid
16.05.2018
17:40:44
а что конкретно не получается?
Конкретно не получается реплицировать даннные.
Не понимаю, что мне нужно написать в конфиге КХ для этих целей.
Я указал <zookeeper> </zookeeper> сервера.
Вопрос надо ли мне указывать настройки <remote_servers> и там прописывать replica?
+
Откуда брать параметры при создании таблицы '/clickhouse/tables/{shard}/hits', '{replica}'

Tatiana
16.05.2018
17:42:42
> Я указал <zookeeper> </zookeeper> сервера.
Этого достаточно.
Параметры при создании таблицы использовать не обязательно.
Если вы хотите их использовать, надо прописать их в секции <macros>