@clickhouse_ru

Страница 529 из 723

Diomid

15.05.2018
18:37:18

В документации сказано, что надо использовать зуукипер для этих целей и дистрибьютед таблицы вместе. Видимо я неправильно понял. Можете привести боевой пример пожалуйста или ссылку.

Tatiana

15.05.2018
18:41:48

В документации сказано, что надо использовать зуукипер для этих целей и дистрибьютед таблицы вместе. Видимо я неправильно понял. Можете привести боевой пример пожалуйста или ссылку.

Distributed таблицы нужны, чтобы делать запросы к нескольким шардам. Для репликации через ZooKeeper они не нужны

Diomid

15.05.2018
18:46:33

Спасибо!

Перепутал типы таблиц. Хотел все сказать про ReplicatedMergeTree.

Google

Egor

16.05.2018
06:14:53

Доброго дня. Подскажите, обновление на новую версию как проходит? Просто накатывание новой версии?

А то я что-то в доках не вижу эту тему. Нужно с версии 1.1.54327 обновиться до последней

Гаврилов

16.05.2018
06:15:56

yum upgrade ?

Egor

16.05.2018
06:16:01

yum upgrade ?

docker

Точнее вопрос такой: хочу новую версию натравить на старые данные, кто-нибудь так делал?

Tima

16.05.2018
07:09:36

Точнее вопрос такой: хочу новую версию натравить на старые данные, кто-нибудь так делал?

Да, делал. Выключаете КХ, обновляете пакеты clickhouse-server и clickhouse-client, стартуете КХ, ждете пока подхватятся данные

Повторяете для всех серверов с КХ

Egor

16.05.2018
07:15:34

Да, делал. Выключаете КХ, обновляете пакеты clickhouse-server и clickhouse-client, стартуете КХ, ждете пока подхватятся данные

Спасибо, попробую так

Напомните, как директива называлась, которая настраивала сбор данных материалайзед вью по времени ?

хочу чтоб сбрасывал данные раз в 5 сек

Ульяна

16.05.2018
08:57:46

Почему Clickhouse называется Clickhouse?

Гаврилов

16.05.2018
08:58:25

домик для кликов?)

Stanislav

16.05.2018
08:59:50

подозреваю, что имелся ввиду clickchaos, который надо было упорядочивать, но таки решили не раздувать :-)

Google

Vitaly

16.05.2018
09:02:00

Почему Clickhouse называется Clickhouse?

рискну предположить, что это про кликстрим и warehouse https://en.wikipedia.org/wiki/Clickstream https://en.wikipedia.org/wiki/Data_warehouse

Kirill

16.05.2018
10:16:45

Скажите пожалуйста, где прочитать про то, как кликхаус хранит дефолтные (пустые) значения колонок. Если много полей не будут иметь значения - как это отразится на занимаемом базой месте?

Wolf

16.05.2018
10:17:30

Ну оно будет просто очень хорошо сжиматься

Kirill

16.05.2018
10:18:45

Т.е. что-то типа 1 бита на запись просто чтобы знать - дефолтное значение согласно типу или нет?

Ульяна

16.05.2018
10:20:31

домик для кликов?)

мне тоже эта версия нравится)

Wolf

16.05.2018
10:37:54

Т.е. что-то типа 1 бита на запись просто чтобы знать - дефолтное значение согласно типу или нет?

Нет, просто это колоночная бд и жмется вся колонка

Kirill

16.05.2018
10:38:17

ага, ок, спасибо

Александр

16.05.2018
11:25:38

А в докере почему то не обновляются словари по таймауту?

Wolf

16.05.2018
11:47:26

А в докере почему то не обновляются словари по таймауту?

А причем тут докер то.

Александр

16.05.2018
11:47:46

Ну потому что оно только в докере себя так странно ведет

У словаря lifetime 55 секунд. Данные записались в словарь и минут 10 висели без обновления, пока я принудительно не сделал reload dictionary. После этого все изменения подхватывались корректно через указанный lifetime.

Wolf

16.05.2018
11:49:06

Ну надо логи видимо и конфиги смотреть

Александр

16.05.2018
11:51:58

Привет ! а https://github.com/yandex/clickhouse-jdbc по http на кластер ходит или там сложнее все ? Встал вопрос замокать кластер чтобы посмотреть на клиент , чтобы слабое место найти Клиент ходит через clickhouse-jdbc - была идея замокать http endpoint

Alex

16.05.2018
11:54:29

Привет ! а https://github.com/yandex/clickhouse-jdbc по http на кластер ходит или там сложнее все ? Встал вопрос замокать кластер чтобы посмотреть на клиент , чтобы слабое место найти Клиент ходит через clickhouse-jdbc - была идея замокать http endpoint

Да, ходит по http

Александр

16.05.2018
11:57:00

Да, ходит по http

правильно ли я понимаю, что могу поднять http endpoint с ?query, указать ip и запросы туда пойдут ?

Denis

16.05.2018
12:18:31

правильно ли я понимаю, что могу поднять http endpoint с ?query, указать ip и запросы туда пойдут ?

да

Александр

16.05.2018
12:19:46

да

Спасибо, попробуем

Andrey

16.05.2018
13:24:24

попробуйте где то поднять инстанс с 1.1.54378 и попробовать без 1=1. У меня похожая магия была. в 1.1.54378 ушла

Проблема продолжает иметь место на версии 1.1.54380

Maksim

16.05.2018
13:58:39

митап в 18:30 ?

Alexey

16.05.2018
14:03:31

18 - встреча гостей, 19 - начало докладов.

Google

Alexey

16.05.2018
14:04:02

Да, приходите в 18 30 :)

dmks

16.05.2018
14:10:21

ClickHouse C++ Meetup https://events.yandex.ru/events/meetings/16-May-2018/

Прошу прощения, а регистрация закрыта совсем? Только увидел :(

Mikhail

16.05.2018
14:22:29

после добавления колонки в середину получаю ошибки: DB::Exception: Cannot append block to another: different type of columns at index 5. видимо как-то не правильно вставляю колонку структура такая: my_table (Distributed), my_table_data - таблица с данными 2 реплики на каждой делаю ALTER TABLE my_table ADD COLUMN ALTER TABLE my_table_data ADD COLUMN ON CLUSTER - сделать нельзя, т.к. старая версия ch, не поддерживается такая вставка подскажите, как правильно делать добавление колонки?

похоже проблема из-за расхождения реплик

по сути вопрос, как добавить колонку, если есть 2 реплики и нет поддержки ON CLUSTER

Tima

16.05.2018
14:35:12

по сути вопрос, как добавить колонку, если есть 2 реплики и нет поддержки ON CLUSTER

Скорее всего так: 1. остановить запись 2. дождаться окончания репликации 3. расширить все таблицы 4. вернуть запись

Mikhail

16.05.2018
14:36:46

да, тоже об этом подумал, видимо так придется

Alexandr

16.05.2018
15:00:27

Все снова привет. Есть простой вопрос: Безопасно ли делать insert into из select, где источник и назначение одна и та же таблица? Сейчас все работает правильно, но не нашел в документации, что так и останется. Спасибо

Combot

16.05.2018
15:00:47

combot.org/chat/-1001080295593

Alex

16.05.2018
15:02:02

коллеги, подскажите пожалуйста, допустимо ли делать бэкапы через SELECT * FORMAT Native ? не будет ли на нодах сильного жора по памяти для больших партиций.

sha-bang

16.05.2018
15:03:50

Приветствую Правильно ли я понимаю что для подсчета количество операциий в секунду можно получить из Запись select * from system.metrics where metric = ''Write" Чтение select * from system.metrics where metric = ''Read" А есть возможность аналогично получить размер запроса?

Egor

16.05.2018
15:33:30

коллеги, подскажите пожалуйста, допустимо ли делать бэкапы через SELECT * FORMAT Native ? не будет ли на нодах сильного жора по памяти для больших партиций.

сразу скажу, что восстанавливаются большие объёмы Очень долго

Egor

16.05.2018
15:33:39

про жор памяти не скажу

Alex

16.05.2018
15:46:10

сразу скажу, что восстанавливаются большие объёмы Очень долго

скорость восстановления не критична, просто у нод есть лимиты по памяти, не хотелось бы чтоб бэкап вылетал по лимитам

Egor

16.05.2018
15:46:38

не думаю, что по памяти вылетит. читает с диска без транзакций итд

Pavel

16.05.2018
15:52:05

а не отвечает ли Primary key за уникальность?

или в таблице могут быть данные с одинаковым PK?

Andrey

16.05.2018
15:52:46

а не отвечает ли Primary key за уникальность?

Нет, не отвечает

Pavel

16.05.2018
15:52:55

Круто

Roman

16.05.2018
15:53:21

если это не ReplacingMergeTree, где в каком-то роде отвечает )

Google

Andrey

16.05.2018
15:53:48

Он отвечает за построение индекса по MergeTree таблицам.

Kirill

16.05.2018
16:07:56

В документации к описанию TSVWithNames (https://clickhouse.yandex/docs/ru/formats/tabseparatedwithnames/) есть вот такая фраза, которая немного сбивает с толку: "вы не можете использовать имена столбцов, чтобы указать их порядок расположения". Как ее стоит понимать?

Admin

ERROR: S client not available

Kirill

16.05.2018
16:10:00

Т.е. строка реально игнорируется и это сделать просто для удобства, чтобы не заморачиваться с удалением первой строки при вставке самостоятельно?

Alexander

16.05.2018
16:12:11

Возможно здесь уже задавали этот вопрос, есть табличка GraphiMergeTree с кастомным партицированием. Почему после OPTIMIZE партиции останется несколько файлов? , Т.е. я вижу несколько кусков этой таблицы вместо ожидаемого одного.

Tatiana

16.05.2018
16:16:41

по сути вопрос, как добавить колонку, если есть 2 реплики и нет поддержки ON CLUSTER

ALTER TABLE реплицируется. Если вы добавили колонку в одной из реплик, и она не прилетела в остальные реплики, вам надо искать, что пошло не так.

конечно, если вы в Replicated*MergeTree колонку добавляли

во все остальные Engines надо добавлять руками на каждом сервере

Andrey

16.05.2018
16:19:59

Если кто-то знает как рассчитывать маркетинговые воронки для сессии пользователя, при учёте того, что пользователь может несколько раз попать в воронку за одну сессию - пришлите варианты запросов

papa

16.05.2018
16:21:04

и надо эти несколько раз посчитать как больше одного?

Andrey

16.05.2018
16:21:27

Именно

Я два раза за сессию прошёл одну воронку, и это должны быть два хита

Здесь вопрос в том, как побить сессию на новый этап воронки

Предположим что я делаю пример из лекции Марии с arrayFilter

И вот я получаю результаты поподания (где эти номера порядковый номер в сессии)

И тут я вижу две воронки

11 -> 13 -> 15

78 -> 80

Но если считать по лекции, попадание будет одно

Google

papa

16.05.2018
16:29:22

тут есть разные варианты что чем считать. вот если бы у вас было [11,12] [13,14] [15] то это уже две воронки, или еще нет. можно искать покрытие независимыми цепями, можно бить по времени и начинать вторую воронку после окончания первой,

в любом случае для запроса это может оказаться тяжеловато, может sequenceCount что-нибудь может посчитать, а может нет.

Andrey

16.05.2018
16:31:39

ок, попробую sequenceCount

Это что было нужно!

Спасибо

Diomid

16.05.2018
16:39:48

Скажите пожалуйста, есть те, кто смог подружить КХ с Зуукипером для репликации? Что-то у меня не получается данные отреплицировать.

Andrey

16.05.2018
16:47:05

в любом случае для запроса это может оказаться тяжеловато, может sequenceCount что-нибудь может посчитать, а может нет.

SELECT sum(step_1), sum(step_2), sum(step_3) FROM ( SELECT session_id, countIf( first_cond ) AS step_1, sequenceCount('(?1).*(?2)')(datetime , first_cond , second_cond ) AS step_2, sequenceCount('(?1).*(?2).*(?3)')(datetime, first_cond , second_cond, third_cond ) AS step_3 FROM events GROUP BY session_id )

Теперь осталось придумать как это переписать на функции высшего порядка

Tatiana

16.05.2018
17:36:11

Скажите пожалуйста, есть те, кто смог подружить КХ с Зуукипером для репликации? Что-то у меня не получается данные отреплицировать.

а что конкретно не получается?

Diomid

16.05.2018
17:40:44

а что конкретно не получается?

Конкретно не получается реплицировать даннные. Не понимаю, что мне нужно написать в конфиге КХ для этих целей. Я указал <zookeeper> </zookeeper> сервера. Вопрос надо ли мне указывать настройки <remote_servers> и там прописывать replica? + Откуда брать параметры при создании таблицы '/clickhouse/tables/{shard}/hits', '{replica}'

Tatiana

16.05.2018
17:42:42

> Я указал <zookeeper> </zookeeper> сервера. Этого достаточно. Параметры при создании таблицы использовать не обязательно. Если вы хотите их использовать, надо прописать их в секции <macros>

« Назад

Страница 529 из 723

Далее »

Открыть в Telegram