
Alex
17.05.2017
10:07:13
Выглядит так, как будто у вас в users.xml содержимое config.xml

Vladimir
17.05.2017
10:08:05
Глупый вопрос. Собираюсь на сервере кроме КХ держать постгресс для словариков + data integration server. Два последних сервера - в докере. Как лучше - для однообразия поместить КХ в контейнер или оставить на физическом хосте. По идее производительность КХ не должна сильно страдать.? В дальнейшем будущем собираемся делать кластер. Но на данный момент 128Г ОП должно хватить за глаза. "Безобразно но однообразно" (c) или как

Alex
17.05.2017
10:18:49
(Говорю без продакшен-опыта использования докера) Думаю, что основное - правильно выбрать способ монтирования volume. Чтобы данные не терял и не тормозил.

Google

Alex
17.05.2017
10:19:09
А то в интернете достаточно страшилок

Vladimir
17.05.2017
10:20:55
А то в интернете достаточно страшилок
в интернете много страшных историй. Туда лучше не ходить)) Мы в докере на продакшне поднимали системы. Особенно удобно если поднимается глючная портированная система. Например переносили Bizagi.

Fike
17.05.2017
10:21:30

Vladimir
17.05.2017
10:22:14

Alex
17.05.2017
10:23:04
Наверно, правильная терминология - storage driver. https://docs.docker.com/engine/userguide/storagedriver/selectadriver/

Vladimir
17.05.2017
10:23:33

Fike
17.05.2017
10:23:39
Да
ну если директория монтируется внутрь контейнера, то там только пробросить ее можно и все

Vladimir
17.05.2017
10:24:24

Fike
17.05.2017
10:26:03
маунт вроде в обход union fs идет, нет?

Vladimir
17.05.2017
10:28:41
маунт вроде в обход union fs идет, нет?
я так понимаю именно так. Ну то есть если сделать -v для дата КХ то производительности и проблем с записью/чтением данных вообще не должно быть. кроме этого отпадает вопрос с сохранностью данных при краше контейнера
Единственный вопрос при контейнеризации - организация кластера, но и его можно решить если делать expose порты. Правда не пробовал.

Google

Alexey
17.05.2017
13:04:40
Чет не соображу... есть массив значений типа [1,2,3,4] как относительного это массива сделать что-то вроде X IN [1,2,3,4]?
отбой, нашел https://clickhouse.yandex/reference_en.html#has(arr, elem)
надеюсь это достаточно эффективно

Andrey
17.05.2017
13:23:14
Товарищи, а как настроить на сервере логирование чтобы он выводил в лог всю строки INSERT на которой произошла ошибка при вставке. Ибо сейчас он выводит в лог только кусочек, а когда 150 колонок - очень не просто понять где при переливке произошёл косяк.

Vyacheslav
17.05.2017
13:28:39
Поделитись кто-нибудь открытым ключем E0C56BD4, которым пакеты кликхауза подписаны, похоже его дропнули с keyserver.ubuntu.com

Vladimir
17.05.2017
13:30:45

Vyacheslav
17.05.2017
13:32:30
gpgkeys: no key data found for http://keyserver.ubuntu.com/
gpg: no valid OpenPGP data found.

Vladimir
17.05.2017
13:32:56

Pavel
17.05.2017
13:36:00
а про mapd не понимаю, откуда его сравнение с CH

Fike
17.05.2017
13:36:25

Vladimir
17.05.2017
13:36:39

Felixoid
17.05.2017
13:36:41

Pavel
17.05.2017
13:36:45
и на мой взгляд, поддержка GPU за десятки тысяч баксов несколько уходит за рамки идеологии которую сейчас поддерживает кликхаус

Vladimir
17.05.2017
13:36:47
и потом доказывать что одно лучше другого

Pavel
17.05.2017
13:37:04
кликхаусом я могу проанилизировать ТЕРАБАЙТЫ на паре своих домашних ноутбуков, на которых встроенное видео на 512мб=)
и лично мне нахрен эти GPU за миллионы не сдались, кому надо -купите/поставьте mapd :)

artem
17.05.2017
13:40:50
Всем добрый день.
Ребят есть в clickhouse выгрузка из яндекс метрики из коробки?

Alexandra
17.05.2017
14:24:15
https://tech.yandex.com/metrika/doc/api2/logs/clickhouse-integration-docpage/

Anatoly
17.05.2017
16:21:22
Ребят, добрый день
Может кто подскажет, не очень понимаю как сделать
Есть визиты, которые кладутся в базу сразу(юзерагент, ип, user_id и пр.), и есть информация которая приходит задолго после - время на странице, флаги типа был ли скролл и т.п.
Если в обычной бд не было проблем - просто проапдейти запись и все, то как в кх это сделать?

Google

Oleg
17.05.2017
16:22:16
еще 1 записью?

Andrey
17.05.2017
16:22:19
Collapsingmergetree

Anatoly
17.05.2017
16:29:34
Т.е. грубо говоря мне приходит показание таймера в виде {visit_id: ..., seconds: ...}
После я нахожу последний визит, мержу секунды и вставляю эту запись?
Так?
Просто смущает что это куча одиночных операций селекта, а в доке указано ограничение на 100 запросов в секунду

papa
17.05.2017
16:29:57


Vladislav
17.05.2017
16:31:50
Ребят, добрый день
Может кто подскажет, не очень понимаю как сделать
Есть визиты, которые кладутся в базу сразу(юзерагент, ип, user_id и пр.), и есть информация которая приходит задолго после - время на странице, флаги типа был ли скролл и т.п.
Если в обычной бд не было проблем - просто проапдейти запись и все, то как в кх это сделать?
у нас аналогично, сначала приходят данные о pageview со всей инфой, потом флаги времени на странице, скроллы и т.п., которые заполняют основную информацию, чтобы можно было сматчить с pageview, и значение для дополнительного столбца

Anatoly
17.05.2017
16:33:19

Vladislav
17.05.2017
16:33:57
CollapsingMergeTree

Anatoly
17.05.2017
16:39:28
А select запросы с final? Или каждый раз полотно group by id, ua, userId,...?

papa
17.05.2017
16:40:12
зависит от того, что вы хотите посчитать.
если вам нужна последняя версия каждого объекта - то да. если нужна общая статистика - почти всегда свертка с Sign дает то что надо.

Anatoly
17.05.2017
17:11:40
Ребят, извиняюсь за тупость
В случае с Collapsingmergetree
Когда мне нужно изменить запись по id - я нахожу эту запись и делаю два инсерта, один - на вставку старой(найденной) записи с Sign = -1, второй - на ставку измененной записи с Sign = 1
Правильно понимаю?

Vladimir
17.05.2017
17:15:09
Ну да
Но только оно сразу не схлопнется в одну запись

Anatoly
17.05.2017
17:19:49
Да не, я понимаю что не схлопнется, меня sign не пугает
Меня пугает что перед каждой правкой нужно находить предыдущую версию, когда в доке написано ограничение 100 запросов в секунду

papa
17.05.2017
17:25:32
в Метрике предыдущая версия живет в том числе снаружи.

Andrey
17.05.2017
17:28:48

Anatoly
17.05.2017
17:29:14

papa
17.05.2017
17:32:52
> что перед каждой правкой нужно находить предыдущую версию,
для этого нужен какой-то (шардированный реплицируемый) kv-storage, на базе которого будет реализована функция (новые события,состояние)->(новое состояние,лог изменения). лог изменения писать в CH, велосипед городить свой.

Anatoly
17.05.2017
17:35:27
Ну это же Яндекс
уже ждешь что там велосипед написали и выложили)

Google

papa
17.05.2017
17:35:49
да можно просто метрикой пользоваться

Magistr
17.05.2017
17:50:13
А закешируте в аэроспайке например
А оттуда уже в кх можно выгребать
Он как раз хорошо шардируется

Andrew
18.05.2017
08:02:17
а с чем связана рекомендация относительно Float32/Float64 - "Не рекомендуется хранить числа с плавающей запятой в таблицах." ?

Igor
18.05.2017
08:02:39
с тем, что точность теряется, наверное

Vladimir
18.05.2017
08:20:22

Andrew
18.05.2017
08:25:18
Ну про артефакты плавучки я в курсе, но это ж не проблема хранения в таблицах

Aleksey
18.05.2017
08:56:54

Vladimir
18.05.2017
09:04:11

Elza
18.05.2017
09:06:59
привет!
я только начала пользоваться кх
подскажите, как скачать данные в файл csv?
пишу такой запрос. все как будто выполнилось, но в файле пусто.

Vladimir
18.05.2017
09:09:47
Если что, нужно второе

Vladimir
18.05.2017
09:42:47
Как в конфиге КХ прописать слушать только ipv4?

prll
18.05.2017
09:48:54
listen_host 127.0.0.1 или 0.0.0.0

Anatoly
18.05.2017
10:36:28
на дев-сервере для табикса пришлось <listen_host>::</listen_host> прописать, иначе с внешних никак не получилось подключиться

blide
18.05.2017
11:29:15
Всем привет. Кликхаус ещё не научился пробрасывать where, prewhere в подзапрос представления?

Dima
18.05.2017
13:19:18
привет всем, заранее прошу прощения если помешаю вопросом :) Мы внедряем clickhouse для нашего проекта по мобильной рекламе. Кто-нибудь мог бы помочь (платно или бесплатно) с некоторыми вопросами или посоветовать кого-нибудь, кто разбирается в clickhouse?

Pavel
18.05.2017
13:20:05
мне кажется тут вам и бесплатно помогут если вопросы будут сфорулированные)

Google

Dima
18.05.2017
13:23:48
спасибо! лучше конечно в виде фрилансера для проекта

Alexander
18.05.2017
13:27:45

Dima
18.05.2017
13:27:48
Мы хотим писать в него трафик и делать статистический анализ. Так как мы не совсем технически подкованы то нужна помощь в этом. Например: как создать пользователей, понять как писать отдельно каждый запрос или пачками. Желательно найти человека, который бы мог по каждому вопросу поддерживать, по мере их появления.

Andrey
18.05.2017
13:28:31
Добрый день!
Подскажите пожалуйста настройку для изменения лимита, после которого над партицией не происходит OPTIMIZE c FINAL.
Можно ли эту настройку передать не перезагружая сервер?

Alexander
18.05.2017
13:29:12

Vladimir
18.05.2017
13:35:19
вам же потом поддерживать то что фрилансеры насоздают )

Dima
18.05.2017
13:37:09
штука в том, что у СТО будет это все поддерживать :) потому что он разберется с clichous'ом, но сейчас сроки поджимают, поэтому нужен знающий человек, который бы нам помог

Andrey
18.05.2017
13:44:34
Ребят, а кто нибудь собирал под маком CH?

Igor
18.05.2017
13:45:18
да

Andrey
18.05.2017
13:45:34
Удачно?))

Igor
18.05.2017
13:45:36
да

Vladimir
18.05.2017
13:45:45
мастер собирается