@clickhouse_ru

Страница 146 из 723
Alex
17.05.2017
10:07:13
Выглядит так, как будто у вас в users.xml содержимое config.xml

Vladimir
17.05.2017
10:08:05
Глупый вопрос. Собираюсь на сервере кроме КХ держать постгресс для словариков + data integration server. Два последних сервера - в докере. Как лучше - для однообразия поместить КХ в контейнер или оставить на физическом хосте. По идее производительность КХ не должна сильно страдать.? В дальнейшем будущем собираемся делать кластер. Но на данный момент 128Г ОП должно хватить за глаза. "Безобразно но однообразно" (c) или как

Alex
17.05.2017
10:18:49
(Говорю без продакшен-опыта использования докера) Думаю, что основное - правильно выбрать способ монтирования volume. Чтобы данные не терял и не тормозил.

Google
Alex
17.05.2017
10:19:09
А то в интернете достаточно страшилок

Vladimir
17.05.2017
10:20:55
А то в интернете достаточно страшилок
в интернете много страшных историй. Туда лучше не ходить)) Мы в докере на продакшне поднимали системы. Особенно удобно если поднимается глючная портированная система. Например переносили Bizagi.

Alex
17.05.2017
10:23:04
Наверно, правильная терминология - storage driver. https://docs.docker.com/engine/userguide/storagedriver/selectadriver/

Fike
17.05.2017
10:23:39
Да
ну если директория монтируется внутрь контейнера, то там только пробросить ее можно и все

Vladimir
17.05.2017
10:24:24
ну если директория монтируется внутрь контейнера, то там только пробросить ее можно и все
Все правильно. Имелось ввиду - сторадж драйвер + монтирование

Fike
17.05.2017
10:26:03
маунт вроде в обход union fs идет, нет?

Vladimir
17.05.2017
10:28:41
маунт вроде в обход union fs идет, нет?
я так понимаю именно так. Ну то есть если сделать -v для дата КХ то производительности и проблем с записью/чтением данных вообще не должно быть. кроме этого отпадает вопрос с сохранностью данных при краше контейнера

Единственный вопрос при контейнеризации - организация кластера, но и его можно решить если делать expose порты. Правда не пробовал.

Google
Alexey
17.05.2017
13:04:40
Чет не соображу... есть массив значений типа [1,2,3,4] как относительного это массива сделать что-то вроде X IN [1,2,3,4]?

отбой, нашел https://clickhouse.yandex/reference_en.html#has(arr, elem)

надеюсь это достаточно эффективно

Andrey
17.05.2017
13:23:14
Товарищи, а как настроить на сервере логирование чтобы он выводил в лог всю строки INSERT на которой произошла ошибка при вставке. Ибо сейчас он выводит в лог только кусочек, а когда 150 колонок - очень не просто понять где при переливке произошёл косяк.

Vyacheslav
17.05.2017
13:28:39
Поделитись кто-нибудь открытым ключем E0C56BD4, которым пакеты кликхауза подписаны, похоже его дропнули с keyserver.ubuntu.com

Vladimir
17.05.2017
13:30:45
Vyacheslav
17.05.2017
13:32:30
gpgkeys: no key data found for http://keyserver.ubuntu.com/ gpg: no valid OpenPGP data found.

Pavel
17.05.2017
13:36:00
а про mapd не понимаю, откуда его сравнение с CH

Fike
17.05.2017
13:36:25
Vladimir
17.05.2017
13:36:39
а про mapd не понимаю, откуда его сравнение с CH
никто не мешает людям сравнивать самолет с арбузом

Felixoid
17.05.2017
13:36:41
добрый день подскажите пожалуйста есть ли какая-то возможность создать VIEW поверх Distributed таблицы?
можно, но там с использованием индексов пол года назад была проблема. А так - это ж просто аналог подзапроса

Pavel
17.05.2017
13:36:45
и на мой взгляд, поддержка GPU за десятки тысяч баксов несколько уходит за рамки идеологии которую сейчас поддерживает кликхаус

Vladimir
17.05.2017
13:36:47
и потом доказывать что одно лучше другого

Pavel
17.05.2017
13:37:04
кликхаусом я могу проанилизировать ТЕРАБАЙТЫ на паре своих домашних ноутбуков, на которых встроенное видео на 512мб=)

и лично мне нахрен эти GPU за миллионы не сдались, кому надо -купите/поставьте mapd :)

artem
17.05.2017
13:40:50
Всем добрый день.

Ребят есть в clickhouse выгрузка из яндекс метрики из коробки?

Alexandra
17.05.2017
14:24:15
https://tech.yandex.com/metrika/doc/api2/logs/clickhouse-integration-docpage/

Anatoly
17.05.2017
16:21:22
Ребят, добрый день Может кто подскажет, не очень понимаю как сделать Есть визиты, которые кладутся в базу сразу(юзерагент, ип, user_id и пр.), и есть информация которая приходит задолго после - время на странице, флаги типа был ли скролл и т.п. Если в обычной бд не было проблем - просто проапдейти запись и все, то как в кх это сделать?

Google
Oleg
17.05.2017
16:22:16
еще 1 записью?

Andrey
17.05.2017
16:22:19
Collapsingmergetree

Anatoly
17.05.2017
16:29:34
Т.е. грубо говоря мне приходит показание таймера в виде {visit_id: ..., seconds: ...} После я нахожу последний визит, мержу секунды и вставляю эту запись? Так? Просто смущает что это куча одиночных операций селекта, а в доке указано ограничение на 100 запросов в секунду

Vladislav
17.05.2017
16:31:50
Ребят, добрый день Может кто подскажет, не очень понимаю как сделать Есть визиты, которые кладутся в базу сразу(юзерагент, ип, user_id и пр.), и есть информация которая приходит задолго после - время на странице, флаги типа был ли скролл и т.п. Если в обычной бд не было проблем - просто проапдейти запись и все, то как в кх это сделать?
у нас аналогично, сначала приходят данные о pageview со всей инфой, потом флаги времени на странице, скроллы и т.п., которые заполняют основную информацию, чтобы можно было сматчить с pageview, и значение для дополнительного столбца

Vladislav
17.05.2017
16:33:57
CollapsingMergeTree

Anatoly
17.05.2017
16:39:28
А select запросы с final? Или каждый раз полотно group by id, ua, userId,...?

papa
17.05.2017
16:40:12
зависит от того, что вы хотите посчитать.

если вам нужна последняя версия каждого объекта - то да. если нужна общая статистика - почти всегда свертка с Sign дает то что надо.

Anatoly
17.05.2017
17:11:40
Ребят, извиняюсь за тупость В случае с Collapsingmergetree Когда мне нужно изменить запись по id - я нахожу эту запись и делаю два инсерта, один - на вставку старой(найденной) записи с Sign = -1, второй - на ставку измененной записи с Sign = 1 Правильно понимаю?

Vladimir
17.05.2017
17:15:09
Ну да

Но только оно сразу не схлопнется в одну запись

Anatoly
17.05.2017
17:19:49
Да не, я понимаю что не схлопнется, меня sign не пугает Меня пугает что перед каждой правкой нужно находить предыдущую версию, когда в доке написано ограничение 100 запросов в секунду

papa
17.05.2017
17:25:32
в Метрике предыдущая версия живет в том числе снаружи.

Andrey
17.05.2017
17:28:48
Anatoly
17.05.2017
17:29:14
Вы же понимаете что все в мире относительно? У кого то на 50 сляжет все. У кого то 1000 держать будет и не поперхнётся.
Я понимаю) Обидно будет если переедем, но не до конца оттестим Хочется без даунтамов и серьезных изменений архитектуры после переезда

papa
17.05.2017
17:32:52
> что перед каждой правкой нужно находить предыдущую версию, для этого нужен какой-то (шардированный реплицируемый) kv-storage, на базе которого будет реализована функция (новые события,состояние)->(новое состояние,лог изменения). лог изменения писать в CH, велосипед городить свой.

Anatoly
17.05.2017
17:35:27
Ну это же Яндекс уже ждешь что там велосипед написали и выложили)

Google
papa
17.05.2017
17:35:49
да можно просто метрикой пользоваться

Magistr
17.05.2017
17:50:13
А закешируте в аэроспайке например

А оттуда уже в кх можно выгребать

Он как раз хорошо шардируется

Andrew
18.05.2017
08:02:17
а с чем связана рекомендация относительно Float32/Float64 - "Не рекомендуется хранить числа с плавающей запятой в таблицах." ?

Igor
18.05.2017
08:02:39
с тем, что точность теряется, наверное

Vladimir
18.05.2017
08:20:22
а с чем связана рекомендация относительно Float32/Float64 - "Не рекомендуется хранить числа с плавающей запятой в таблицах." ?
Насколько я помню тут говорили, что люди пытались делать подсчет денег на КХ и брали Float, а потом удилвлись почему сравнения нормально не работают, и почему 2.0 + 2.0 = 3.9999999994

Andrew
18.05.2017
08:25:18
Ну про артефакты плавучки я в курсе, но это ж не проблема хранения в таблицах

Aleksey
18.05.2017
08:56:54
кликхаусом я могу проанилизировать ТЕРАБАЙТЫ на паре своих домашних ноутбуков, на которых встроенное видео на 512мб=)
я думаю тут есть ньюансы... основной в том что можно использовать энд-юзеровские решения типа GTX 1080... они как раз стоят даже дешевле чем ЦПУ.... единственное различие между такими ГПУ и теслами это стабильность работы и объемы памяти... последний факт думаю может быть наиболее важным...

Elza
18.05.2017
09:06:59
привет! я только начала пользоваться кх подскажите, как скачать данные в файл csv? пишу такой запрос. все как будто выполнилось, но в файле пусто.



Vladimir
18.05.2017
09:42:47
Как в конфиге КХ прописать слушать только ipv4?

prll
18.05.2017
09:48:54
listen_host 127.0.0.1 или 0.0.0.0

Anatoly
18.05.2017
10:36:28
на дев-сервере для табикса пришлось <listen_host>::</listen_host> прописать, иначе с внешних никак не получилось подключиться

blide
18.05.2017
11:29:15
Всем привет. Кликхаус ещё не научился пробрасывать where, prewhere в подзапрос представления?

Dima
18.05.2017
13:19:18
привет всем, заранее прошу прощения если помешаю вопросом :) Мы внедряем clickhouse для нашего проекта по мобильной рекламе. Кто-нибудь мог бы помочь (платно или бесплатно) с некоторыми вопросами или посоветовать кого-нибудь, кто разбирается в clickhouse?

Pavel
18.05.2017
13:20:05
мне кажется тут вам и бесплатно помогут если вопросы будут сфорулированные)

Google
Dima
18.05.2017
13:23:48
спасибо! лучше конечно в виде фрилансера для проекта

Dima
18.05.2017
13:27:48
Мы хотим писать в него трафик и делать статистический анализ. Так как мы не совсем технически подкованы то нужна помощь в этом. Например: как создать пользователей, понять как писать отдельно каждый запрос или пачками. Желательно найти человека, который бы мог по каждому вопросу поддерживать, по мере их появления.

Andrey
18.05.2017
13:28:31
Добрый день! Подскажите пожалуйста настройку для изменения лимита, после которого над партицией не происходит OPTIMIZE c FINAL. Можно ли эту настройку передать не перезагружая сервер?

Alexander
18.05.2017
13:29:12
Ну про артефакты плавучки я в курсе, но это ж не проблема хранения в таблицах
В kdb для хранения денег используется float, но они учитывают точность при сравнении.

Dima
18.05.2017
13:37:09
штука в том, что у СТО будет это все поддерживать :) потому что он разберется с clichous'ом, но сейчас сроки поджимают, поэтому нужен знающий человек, который бы нам помог

Andrey
18.05.2017
13:44:34
Ребят, а кто нибудь собирал под маком CH?

Igor
18.05.2017
13:45:18
да

Andrey
18.05.2017
13:45:34
Удачно?))

Igor
18.05.2017
13:45:36
да

Vladimir
18.05.2017
13:45:45
Удачно?))
я собирал вчера

мастер собирается

Страница 146 из 723