
Igor
13.04.2017
17:14:21
а какая версия клиента?

Fike
13.04.2017
17:14:40

Anton
13.04.2017
17:17:15
это понятно. но Яндекс-то рабоьает с всемирной паутиной. ПАУТИНОЙ. чуете, чем пахнет? отсюда вопрос: жобавлять такой функционал будут или нет?
просто тогда CH юыл бы вообще огонь, если бы еще и графовые структуры умел

Google

Dmitry
13.04.2017
17:19:22
графовые структуры статичны
а ch шардирует данные по дате

Uncel
13.04.2017
17:20:55

Anton
13.04.2017
17:21:26

Uncel
13.04.2017
17:22:18

Anton
13.04.2017
17:22:48
буду ковыряться

Uncel
13.04.2017
17:23:58
https://www.google.ru/amp/s/yokota.blog/2016/12/13/graph-analytics-on-hbase-with-hgraphdb-and-giraph/amp/
И еще куча около hpc, вида flashx, и gunrock

Fike
13.04.2017
17:25:15

Sergei
13.04.2017
17:26:02
Игорь из СМИ рассказывает про tabix.io

Anton
13.04.2017
17:27:06

Google

Fike
13.04.2017
17:29:29

Alexander
13.04.2017
17:33:50
В интернете только один бенчмарк нашелся по kdb/clickhouse
http://tech.marksblogg.com/benchmarks.html

Владимир
13.04.2017
17:35:24
tabix.io хорош для графов поверх кх

Igor
13.04.2017
17:52:16
Моя презентация о tabix
https://www.dropbox.com/s/fjnwq519b3qjv9z/CH_Meetup_13APR_final.pptx?dl=0
( лучше смотреть в powerPoint для просмотра видео )

Slava
13.04.2017
17:57:59
всем привет. скажите, правильно ли я понимаю что jdbc драйвер(для кх) общается с кх по http?

Igor
13.04.2017
17:58:06
да

Slava
13.04.2017
17:58:40
благодарю

Vladislav
13.04.2017
18:17:50
@garikanet спасибо большое.

Sergey
13.04.2017
18:18:50
.

Roman
13.04.2017
18:33:40

Andrey
13.04.2017
18:44:35
Ребята, а поделитесь остальными презентациями)

Alexey
13.04.2017
20:25:00
Моя презентация здесь:
https://github.com/yandex/clickhouse-presentations/tree/master/meetup5
Можно скачать:
https://github.com/yandex/clickhouse-presentations/archive/master.zip
Распаковать и открыть meetup5/index.html в браузере.
На сайт ещё не выложилось.

Bob
13.04.2017
21:50:31
Докер с tabix.ui (Build 17.04.3), если кому надо: https://hub.docker.com/r/e11it/tabix.ui/

Igor
13.04.2017
21:53:25

Andrey
14.04.2017
06:29:01

Рулон
14.04.2017
07:07:32
Доброе утро! На докладе что -то прозвучало про union all
union как то хитро работает в кликхаусе?

Roma
14.04.2017
07:18:54
union как то хитро работает в кликхаусе?
Прозвучало если делать два запроса по части данных, то объединять их нужно в клиенте. Union all вылетит из-за нехватки памяти, т.к. запроса будет не два, а один.

Google

Andrey
14.04.2017
07:25:21
Добрый день!
Использую ReplacingMergeTree и встретил очень интересное поведение. Дубликатов по ключу я не нашёл.
Но заметил большую странность. Как так получается что колличество уникальных ключей, больше чем общее колличество записей?
Ожидал увидеть обратную ситуацию при неразрешённых коллизиях, а тут совсем уже чёрная магия

Igor
14.04.2017
07:26:06
uniq считает приближенное значение. для точного есть uniqExact

Roman
14.04.2017
07:29:04
судя по кол-ву вопросов с ф-цией uniq наверное нужо создать какую-нибудь uniqApprox и поменять их местами ?

Igor
14.04.2017
07:29:35
> Алгоритм является очень точным для множеств небольшой кардинальности (до 65 536) и очень эффективным по CPU (при расчёте не слишком большого количества таких функций, использование uniq почти так же быстро, как использование других агрегатных функций).
> Не стоит бояться приближённых расчётов. Поэтому, используйте лучше функцию uniq.

Рулон
14.04.2017
07:36:01

Andrey
14.04.2017
07:43:20

Andrey
14.04.2017
08:57:23
Ребят, чет туплю.
field_name DateTime DEFAULT now() - нормальное описание поля с типом DateTime у котого дефолтное значение дожно проставляться DateTime от даты и времени вставки?

Владимир
14.04.2017
09:02:07
Есть нюанс - это хорошо работает, только если вставка происходит атомарно. У меня например, данные сначала копятся в очереди, а потом пачкой отправляются в КХ, поэтому даты желательно проставлять вручную, чтобы не было сдвигов на границе дня

Andrey
14.04.2017
09:03:49
Ага, спасибо, важный коммент.

Владимир
14.04.2017
09:04:05
А так да - now() - DateTime, today() - Date

Андрей
14.04.2017
09:16:35
Вчера на митапе докладчики демонстрировали великолепные графики. С помощью каких инструментов их строят? Есть какая-то общедоступная литература по этому вопросу?

Владимир
14.04.2017
09:17:25
tabix.io ?

Андрей
14.04.2017
09:17:43
Да, и там тоже. Еще и на слайдах

Mariya
14.04.2017
09:17:55
Маша показывала картинки на plot.ly

Maria
14.04.2017
09:18:35
и seaborn еще)

Mariya
14.04.2017
09:18:48
Вот тут есть статья про все это: https://habrahabr.ru/company/ods/blog/323210/

Андрей
14.04.2017
09:19:00
Спасибо!

Pavel
14.04.2017
09:28:01
кстати, а как оптимально хранить IPv4 сетку в формате CIDR в CH?

Maksim
14.04.2017
09:32:19
Добрый день. скажите пожалуйста
Column campaign_id is not under aggregate function and not in GROUP BY
чтобы это значило? указал поле в select для вывода

Google

Andrey
14.04.2017
09:32:59
А полный запрос можно увидеть?

Andrey
14.04.2017
09:33:20

Maksim
14.04.2017
09:33:37

Igor
14.04.2017
09:34:07

Andrey
14.04.2017
09:34:07
Ну вы же понимаете, что там могут быть разные значения для разных строк?

Andrey
14.04.2017
09:34:17

Maksim
14.04.2017
09:34:25
SELECT
eventDate,
campaign_id,
ads_id,
group_id,
ads_start_id,
sum(spent) as spent,
sum(shows) as shows,
sum(clicks) as clicks
FROM banner_history_segments
WHERE ads_start_id IN(100)
GROUP BY ads_start_id, eventDate

Igor
14.04.2017
09:34:27
можно через any(campaign_id) (тогда выведется случайное, но одно), можно через, кажется, groupArray(campaign_id) - тогда выведется массив всех имеющихся значений

Andrey
14.04.2017
09:34:28
если очень хочется - any(campaign_id)
Больше не отвечаю на вопросы, у кого-то очень хороший интернет)

Maksim
14.04.2017
09:35:53
я что-то не понял. что значит случайное? а реально как?

Andrey
14.04.2017
09:37:10
выведется первое значение campaign_id, попавшееся для ads_start_id = 100 и данного eventDate

Maksim
14.04.2017
09:37:55
а ну это подходит. мне без разницы в рамках одного старта всегда одна кампания

Владимир
14.04.2017
09:38:15
Если всегда одна - почему не добавить её в groupBy ?
Запрос просто будет выглядеть логичнее и понятнее

Igor
14.04.2017
09:39:11
плюсую предложение добавить campaign_id в group by )

Maksim
14.04.2017
09:40:47
тогда уже и ad и group_id тоже в group by

Igor
14.04.2017
09:41:01
ну да, раз вы их перечисляете в столбцах)

Maksim
14.04.2017
09:41:14
они тоже в рамках одного старта одинаковые. но что быстрее будет выполнятся any(field) или еще пару группировок ?

Igor
14.04.2017
09:41:28
хз, посчитайте сами)

Google

Maksim
14.04.2017
09:43:37
почти одинаково - по разному

papa
14.04.2017
09:50:22

Pavel
14.04.2017
09:50:41
хочется ее потом удобно обрабатывать прямо в запросах, без магии и обработки

papa
14.04.2017
09:51:04
bitAnd(addr ,mask)=prefix

Pavel
14.04.2017
09:51:52
я тут в тикет откомментил, как хочу это видеть https://github.com/yandex/ClickHouse/issues/247 последний коммент
тут вопрос во-первых, чтобы сохранить в одном поле, а, во-вторых, чтобы декодировать удобно из компактного пердставления в удобоваримое для людей

Vladislav
14.04.2017
10:33:10
Получил ошибку Code: 89. DB::Exception: QuickLZ compression method is disabled: while receiving packet при запросе из представления
версия 1.1.54198

Рулон
14.04.2017
10:56:44
Люди, а после добавления пользователей надо рестартануть?

Felixoid
14.04.2017
10:57:20

Рулон
14.04.2017
10:58:22

Maksim
14.04.2017
11:43:16
скажите еще плиз
SELECT sum(clicks) as clicks,
WHERE ... AND
(clicks <> 0 or shows <> 0)
дает ошибку Aggregate function sum(clicks) is found in WHERE or PREWHERE in query
как исключить из результатов записи у которых клики и показы по 0 ?
я понял в чем ошибка. алиас который указывается после sum() .. воспринимается как само поле