
Alex
27.12.2017
07:50:08
))
какой-то опасный таймаут у тебя)

Eugenia
27.12.2017
07:52:44
фича?
SELECT if(0 AND 0 AND NULL AND NULL, 1, 0)
┌─if(and(0, 0, NULL, NULL), 1, 0)─┐
│ \N │
└─────────────────────────────────┘

Constantine
27.12.2017
08:17:33

Google

Eugenia
27.12.2017
08:18:50
только до тех пор, пока в проде не оказывается)

Eugene
27.12.2017
08:29:41
Добрый день коллеги! Подскажите пожалуйста, есть задачка посчитать сколько слов начинается с какой буквы.
То есть по просу - сделать группировку по первой букве слова. Мож кто подскажет как решить?

Alex
27.12.2017
08:32:58

Cargeh
27.12.2017
08:35:22

Eugene
27.12.2017
08:35:52

Nikolay
27.12.2017
08:39:37
если одно слово на строку, то можно через функцию substring вытащить первые символы и сделать по ним group by
если я правильно понял суть задачи :)

Eugene
27.12.2017
08:43:21

Max
27.12.2017
08:55:34
Товарищи а как вы решаете с тегами кейсы?
Например есть строка, в строке идентификатор сущности и этой сущности могут быть N тегов.
Ну если строка гвоздями прибита в CH , то теги нет - меняются постоянно.
Хотелось бы по ним группировать и фильтровать.
Словарик ид сущности-строка и раскукоживать каждый раз строку в массив?

Vladimir
27.12.2017
08:58:24

Max
27.12.2017
08:58:43
Так они динамические
Я бы вставлял если бы это статика была
Не обновлять же партицию на каждое обновление тегов

Google

Vladimir
27.12.2017
09:00:21
Ну тогда раскукоживать каждый раз. Или можно сделать динамический словарь тегов если есть какой-то id строки

Max
27.12.2017
09:00:23
Можно ещё пре-селект делать в рсубд и делать in выражение с только сущностями у которых есть нужные теги
Просто как быстро будет раскукоживание работать на миллиардах строк

Vladimir
27.12.2017
09:01:27
Ну вам в любом случае ведь нужно перезаливать эти данные, да? Раз теги могут измениться

Max
27.12.2017
09:01:51
Самая близкая аналогия теги у товаров которые ставят юзеры
Могут отменять их или создавать новые
В вакууме, но проблематика понятна
Нет, перезаливать не надо. Сущность которая тегируется статична. Ид товара, например.

Vladimir
27.12.2017
09:03:17
Мне кажутся тут либо словарь, либо ReplacingMergeeTree с полем updated_at

Alexander
27.12.2017
11:28:25
Прошу прощения, что пропустил вопрос. На митапе 12го декабря я рассказывал, как используется ClickHouse не в РФ. Яндекс обещал выложить видео. Не все компании готовы раскрывать имена, некоторые можно найти тут https://www.altinity.com/blog/2017/8/10/who-and-why-is-using-clickhouse -- но с августа их стало заметно больше.

Alisa
27.12.2017
11:30:20

Vladimir
27.12.2017
14:17:56
Коллеги, добрый день, а как привести строку к нижнему регистру, если в ней кириллица?

Cargeh
27.12.2017
14:18:32

Vladimir
27.12.2017
14:19:05
есть просто lower()

Aliaksei
27.12.2017
14:52:15
будут ли работать ubuntu пакеты на debian stable?

Felixoid
27.12.2017
14:56:18

prll
27.12.2017
14:57:00
должны

Oleg
27.12.2017
14:57:21
работают стабильно месяца 2 у нас, но гарантировать конечно не буду)

Андрей Михайлович
27.12.2017
15:00:10

Google

Aliaksei
27.12.2017
15:37:18
Собираю... Кстати для чего используется libmysqlclient-dev?

Psy
27.12.2017
15:39:13

Aliaksei
27.12.2017
16:20:06
mkdir: cannot create directory 'debian/tmp/usr/share/clickhouse/headers/./contrib/libboost/boost_1_65_0/boost/smart_ptr/detail': No such file or directory не выходит каменный цветочек

prll
27.12.2017
16:23:27
Какая версия

Aliaksei
27.12.2017
16:24:36
только что с гита - 1.1.54328

Vladimir
27.12.2017
16:28:58
max_connections без рестарта не применяется?
чот после перезда на 1.1.54327 его внезапно стало не хватать

prll
27.12.2017
16:45:56
max_connections - да, только с рестартом

Vladimir
27.12.2017
16:46:30
грустно

prll
27.12.2017
16:57:21

Aliaksei
27.12.2017
17:03:44
10 мин - забираю

Mike
27.12.2017
17:23:59
Здравствуйте, кто-то знаком с Catboost?

Aliaksei
27.12.2017
17:24:42
Собрались deb пакеты. Спасибо! Сейчас буду ставить и тестировать.
# systemctl status clickhouse-server.service
● clickhouse-server.service - ClickHouse Server (analytic DBMS for big data)
Loaded: loaded (/etc/systemd/system/clickhouse-server.service; enabled; vendor preset: enabled)
Active: activating (auto-restart) (Result: exit-code) since Wed 2017-12-27 18:45:17 UTC; 7s ago
Process: 737 ExecStart=/usr/bin/clickhouse-server --config=/etc/clickhouse-server/config.xml (code=exited, status=70)
при этом классический инит скрипт паботает

kamish
27.12.2017
18:48:51
вы когда-нибудь дебажили/копались в systemd-юнитах?
гляньте логи, посмотрите journalctl -u clickhouse-server.service, не знаю там
запустите кликхаус лапками, выполните содержимое параметра ExecStart в systemctl cat clickhouse-server.service и воочию созерцайте происходящее

Artiom
27.12.2017
18:52:13
здраствуйте, а кто как эволюциямии схемы управляет?

Aliaksei
27.12.2017
18:52:47
созерцаю, при этом если руками запустить команду из юнита то она работает

kamish
27.12.2017
18:54:00
загадошно. я просто всегда запускаю кх из докера, не имел дело с кликхаусными systemd-сервисами

Google

Aliaksei
27.12.2017
18:59:15
я вижу в чём дело. deb пакет ставит директории /etc/clickhouse-server/ root:root а юнит сразу переключается на clickhouse. Как следсвие не может сохранять config-preprocessed.xml если поменять права на clickhouse, то стартует ... но не отдает консоль

Илья
27.12.2017
19:38:24
Как вариант поменять в юните пользователя на рута

kamish
27.12.2017
19:41:41
да, всё равно, ему ведь сначала нужен рут, чтобы присосаться к порту

Илья
27.12.2017
19:41:42
Сервайс файл
/etc/systemd/system/clickhouse-server.service
Либо
/usr/lib/systemd/system/clickhouse-server.service

kamish
27.12.2017
19:42:43
systemctl edit clickhouse-server.service
если редактировать лапками, то надо будет daemon-reload делать

Alexey
27.12.2017
21:17:41
а с зукипера нет планов съехать случаем? :)
Планов нет, но на всякий случай смотрим на etcd.
у него вроде есть совместимость с зукипером? есть положительный опыт такой замены?
Есть совместимость, опыт использования отрицательный - слой совместимости (zetcd) не работает.

Felixoid
27.12.2017
21:19:48

Alexey
27.12.2017
21:20:44
Смотрим, но там всё сложно - как раз сегодня @ztlpn рассказывал.

Aliaksei
27.12.2017
21:22:33
будет ли работать кликхаус на zfs? или ему O_DIRECT?

Virus
27.12.2017
21:22:36
а кто-нибудь что-нибудь меняет в настройках пакетного 3.4.8 зукипера в убунте, кроме настроек:
tickTime=2000
initLimit=30000
syncLimit=10
dataDir=/var/lib/zookeeper
preAllocSize=131072
snapCount=3000000
maxClientCnxns=2000
maxSessionTimeout=60000000
clientPort=2181
clientPortBindAddress=ZooKeeper-1
server.1=ZooKeeper-1:2888:3888
server.2=ZooKeeper-2:2888:3888
server.3=ZooKeeper-3:2888:3888
autopurge.snapRetainCount=10
autopurge.purgeInterval=1
(взято из tips) ?

Alexey
27.12.2017
21:23:55

Aliaksei
27.12.2017
21:25:07
Стоит ли включать zfs сжатие? Или сжатие кликхаус (если я правильно понял документацию
)

Alexey
27.12.2017
21:25:35
Лучше выключить сжатие в ZFS.

kamish
27.12.2017
21:26:01
будет оверхед, если включить

Alexey
27.12.2017
21:26:39
ClickHouse и так жмёт данные.
В принципе, есть возможность выключить сжатие в ClickHouse и включить в ZFS, но в итоге будет хуже.

Aliaksei
27.12.2017
21:27:10
те лучше сжатие кх, понятно, спасибо!

Google

Timur
28.12.2017
01:40:53
вопрос по репоикации: у меня в лабе я не заморачивался с DNS, поднял кластер с репликми, после вставки в репликейтед таблицу на репликах не видел данных, select * rofm system.replication_queue увидел вот что: Poco::Exception. Code: 1000, e.code() = 0, e.displayText() = Host not found: devtimur001.XX.XXX.com, e.what() = Host not found, откуда он взял hosname если я везед в конфигах прописал IPs?
добавил в hosts и все рассосалось, но все же хочется понять

Ilya
28.12.2017
01:45:38

Timur
28.12.2017
01:46:38
ставил из rpm
https://github.com/Altinity/clickhouse-rpm-install
спасибо за ответ

Alexey
28.12.2017
01:50:04

Timur
28.12.2017
01:51:17
спасибо за ответ

Alexey
28.12.2017
01:54:02
Стоит иметь ввиду, что репликация и Distributed таблицы - независимая функциональность.
Например, вы можете использовать Distributed таблицы поверх кластера без репликации или поверх кластера, репликация в котором осуществляется вручную. Наоборот, можно создать реплицируемые таблицы, но не использовать распределённые запросы.
Конфигурация в секции remote_servers относится только к Distributed таблицам.

Timur
28.12.2017
04:24:00
ага, я понял это
мне как раз нужна distributed + replicated для параллельной обработки и резервирования
Для меня сейчас важно понять как правильно пострить схему + стоит ли активно использовать словари

Egor
28.12.2017
09:10:10
Привет! А видео с последних выступлений уже доступны где нибудь? Я помню ссылки на презентации тут были, интересно было бы видео посмотреть.

Eugene
28.12.2017
10:07:07
Как правильно удалить несколько нод из кластера ? таблицы *MergeTree используются

pavel
28.12.2017
10:34:39
1) Можно ли детачнуть месяц данных из таблицы MergeTree и аттачнуть к таблице ReplicatedMergeTree?
2) При аттаче к таблице ReplicatedMergeTree месяца, вставится ли этот кусок в прилагающийся к таблице MATERIALIZED VIEW?
3) При аттаче к таблице ReplicatedMergeTree месяца, разойдётся ли этот кусок по другим репликам?