@clickhouse_ru

Страница 116 из 723
Igor
13.04.2017
17:14:21
а какая версия клиента?

Fike
13.04.2017
17:14:40
скажите пожалуйста, а есть ли у Clickhouse какие-нибудь фишки как у графовых баз данных?
Модель хранения и сам продукт заточены под совсем иные нужды

Anton
13.04.2017
17:17:15
это понятно. но Яндекс-то рабоьает с всемирной паутиной. ПАУТИНОЙ. чуете, чем пахнет? отсюда вопрос: жобавлять такой функционал будут или нет?

просто тогда CH юыл бы вообще огонь, если бы еще и графовые структуры умел

Google
Dmitry
13.04.2017
17:19:22
графовые структуры статичны

а ch шардирует данные по дате

Anton
13.04.2017
17:21:26
Полно же решений
подскажите пожалуйста?

Uncel
13.04.2017
17:22:18
подскажите пожалуйста?
Форк титана( janusgraph) например,

Anton
13.04.2017
17:22:48
буду ковыряться

Uncel
13.04.2017
17:23:58
https://www.google.ru/amp/s/yokota.blog/2016/12/13/graph-analytics-on-hbase-with-hgraphdb-and-giraph/amp/

И еще куча около hpc, вида flashx, и gunrock

Sergei
13.04.2017
17:26:02


Игорь из СМИ рассказывает про tabix.io

Anton
13.04.2017
17:27:06
Тем, что КХ другими вещами занимается, для графового есть графовое
ну к примеру Postgres тоже вроде как sql, однако я знаю людей, которые его используют как nosql из-за поддержки json-b

Google
Fike
13.04.2017
17:29:29
ну к примеру Postgres тоже вроде как sql, однако я знаю людей, которые его используют как nosql из-за поддержки json-b
Блин, nosql - это не хранение неструктурированных данных. В кликхаусе first class citizen - это колонка, в графовых бд - узел и связь, это не та штука, которую можно просто взять и на лету внедрить

Alexander
13.04.2017
17:33:50


В интернете только один бенчмарк нашелся по kdb/clickhouse

http://tech.marksblogg.com/benchmarks.html

Владимир
13.04.2017
17:35:24
tabix.io хорош для графов поверх кх

Igor
13.04.2017
17:52:16
Моя презентация о tabix https://www.dropbox.com/s/fjnwq519b3qjv9z/CH_Meetup_13APR_final.pptx?dl=0 ( лучше смотреть в powerPoint для просмотра видео )

Slava
13.04.2017
17:57:59
всем привет. скажите, правильно ли я понимаю что jdbc драйвер(для кх) общается с кх по http?

Igor
13.04.2017
17:58:06
да

Slava
13.04.2017
17:58:40
благодарю

Vladislav
13.04.2017
18:17:50
@garikanet спасибо большое.

Sergey
13.04.2017
18:18:50
.

Andrey
13.04.2017
18:44:35
Ребята, а поделитесь остальными презентациями)

Alexey
13.04.2017
20:25:00
Моя презентация здесь: https://github.com/yandex/clickhouse-presentations/tree/master/meetup5 Можно скачать: https://github.com/yandex/clickhouse-presentations/archive/master.zip Распаковать и открыть meetup5/index.html в браузере. На сайт ещё не выложилось.

Bob
13.04.2017
21:50:31
Докер с tabix.ui (Build 17.04.3), если кому надо: https://hub.docker.com/r/e11it/tabix.ui/

Igor
13.04.2017
21:53:25
Докер с tabix.ui (Build 17.04.3), если кому надо: https://hub.docker.com/r/e11it/tabix.ui/
спасибо, заберу в репу ... а то issue висит поправить докер)

Рулон
14.04.2017
07:07:32
Доброе утро! На докладе что -то прозвучало про union all

union как то хитро работает в кликхаусе?

Roma
14.04.2017
07:18:54
union как то хитро работает в кликхаусе?
Прозвучало если делать два запроса по части данных, то объединять их нужно в клиенте. Union all вылетит из-за нехватки памяти, т.к. запроса будет не два, а один.

Google
Andrey
14.04.2017
07:25:21
Добрый день! Использую ReplacingMergeTree и встретил очень интересное поведение. Дубликатов по ключу я не нашёл. Но заметил большую странность. Как так получается что колличество уникальных ключей, больше чем общее колличество записей? Ожидал увидеть обратную ситуацию при неразрешённых коллизиях, а тут совсем уже чёрная магия



Igor
14.04.2017
07:26:06
uniq считает приближенное значение. для точного есть uniqExact

Roman
14.04.2017
07:29:04
судя по кол-ву вопросов с ф-цией uniq наверное нужо создать какую-нибудь uniqApprox и поменять их местами ?

Igor
14.04.2017
07:29:35
> Алгоритм является очень точным для множеств небольшой кардинальности (до 65 536) и очень эффективным по CPU (при расчёте не слишком большого количества таких функций, использование uniq почти так же быстро, как использование других агрегатных функций). > Не стоит бояться приближённых расчётов. Поэтому, используйте лучше функцию uniq.

Andrey
14.04.2017
07:43:20
uniq считает приближенное значение. для точного есть uniqExact
Спасибо большое, цифры сошлись. ReplacingMergeTree за неделю при 4kRPS не оставил дубликатов. Огненный движок!

Andrey
14.04.2017
08:57:23
Ребят, чет туплю. field_name DateTime DEFAULT now() - нормальное описание поля с типом DateTime у котого дефолтное значение дожно проставляться DateTime от даты и времени вставки?

Владимир
14.04.2017
09:02:07
Есть нюанс - это хорошо работает, только если вставка происходит атомарно. У меня например, данные сначала копятся в очереди, а потом пачкой отправляются в КХ, поэтому даты желательно проставлять вручную, чтобы не было сдвигов на границе дня

Andrey
14.04.2017
09:03:49
Ага, спасибо, важный коммент.

Владимир
14.04.2017
09:04:05
А так да - now() - DateTime, today() - Date

Андрей
14.04.2017
09:16:35
Вчера на митапе докладчики демонстрировали великолепные графики. С помощью каких инструментов их строят? Есть какая-то общедоступная литература по этому вопросу?

Владимир
14.04.2017
09:17:25
tabix.io ?

Андрей
14.04.2017
09:17:43
Да, и там тоже. Еще и на слайдах

Mariya
14.04.2017
09:17:55
Маша показывала картинки на plot.ly

Maria
14.04.2017
09:18:35
и seaborn еще)

Mariya
14.04.2017
09:18:48
Вот тут есть статья про все это: https://habrahabr.ru/company/ods/blog/323210/

Андрей
14.04.2017
09:19:00
Спасибо!

Pavel
14.04.2017
09:28:01
кстати, а как оптимально хранить IPv4 сетку в формате CIDR в CH?

Maksim
14.04.2017
09:32:19
Добрый день. скажите пожалуйста Column campaign_id is not under aggregate function and not in GROUP BY чтобы это значило? указал поле в select для вывода

Google
Andrey
14.04.2017
09:32:59
А полный запрос можно увидеть?

Maksim
14.04.2017
09:33:37
в select указал, а в group by?)
так я не хочу группировать по этому полю просто вывести

Igor
14.04.2017
09:34:07
Andrey
14.04.2017
09:34:07
Ну вы же понимаете, что там могут быть разные значения для разных строк?

Andrey
14.04.2017
09:34:17
Maksim
14.04.2017
09:34:25
SELECT eventDate, campaign_id, ads_id, group_id, ads_start_id, sum(spent) as spent, sum(shows) as shows, sum(clicks) as clicks FROM banner_history_segments WHERE ads_start_id IN(100) GROUP BY ads_start_id, eventDate

Igor
14.04.2017
09:34:27
можно через any(campaign_id) (тогда выведется случайное, но одно), можно через, кажется, groupArray(campaign_id) - тогда выведется массив всех имеющихся значений

Andrey
14.04.2017
09:34:28
если очень хочется - any(campaign_id)

Больше не отвечаю на вопросы, у кого-то очень хороший интернет)

Maksim
14.04.2017
09:35:53
я что-то не понял. что значит случайное? а реально как?

Andrey
14.04.2017
09:37:10
выведется первое значение campaign_id, попавшееся для ads_start_id = 100 и данного eventDate

Maksim
14.04.2017
09:37:55
а ну это подходит. мне без разницы в рамках одного старта всегда одна кампания

Владимир
14.04.2017
09:38:15
Если всегда одна - почему не добавить её в groupBy ?

Запрос просто будет выглядеть логичнее и понятнее

Igor
14.04.2017
09:39:11
плюсую предложение добавить campaign_id в group by )

Maksim
14.04.2017
09:40:47
тогда уже и ad и group_id тоже в group by

Igor
14.04.2017
09:41:01
ну да, раз вы их перечисляете в столбцах)

Maksim
14.04.2017
09:41:14
они тоже в рамках одного старта одинаковые. но что быстрее будет выполнятся any(field) или еще пару группировок ?

Igor
14.04.2017
09:41:28
хз, посчитайте сами)

Google
Maksim
14.04.2017
09:43:37
почти одинаково - по разному

papa
14.04.2017
09:50:22
кстати, а как оптимально хранить IPv4 сетку в формате CIDR в CH?
можно хранить как битовую маску подсети, смотря что вы с ней делать собираетесь.

Pavel
14.04.2017
09:50:41
хочется ее потом удобно обрабатывать прямо в запросах, без магии и обработки

papa
14.04.2017
09:51:04
bitAnd(addr ,mask)=prefix

Pavel
14.04.2017
09:51:52
я тут в тикет откомментил, как хочу это видеть https://github.com/yandex/ClickHouse/issues/247 последний коммент

тут вопрос во-первых, чтобы сохранить в одном поле, а, во-вторых, чтобы декодировать удобно из компактного пердставления в удобоваримое для людей

Vladislav
14.04.2017
10:33:10
Получил ошибку Code: 89. DB::Exception: QuickLZ compression method is disabled: while receiving packet при запросе из представления

версия 1.1.54198

Рулон
14.04.2017
10:56:44
Люди, а после добавления пользователей надо рестартануть?

Felixoid
14.04.2017
10:57:20
Люди, а после добавления пользователей надо рестартануть?
нет, подцепляется автоматом, если всё правильно

Рулон
14.04.2017
10:58:22
нет, подцепляется автоматом, если всё правильно
спасибо, значит у меня не правильно)

Maksim
14.04.2017
11:43:16
скажите еще плиз SELECT sum(clicks) as clicks, WHERE ... AND (clicks <> 0 or shows <> 0) дает ошибку Aggregate function sum(clicks) is found in WHERE or PREWHERE in query как исключить из результатов записи у которых клики и показы по 0 ?

я понял в чем ошибка. алиас который указывается после sum() .. воспринимается как само поле

Страница 116 из 723