@clickhouse_ru

Страница 205 из 723
Artem
17.07.2017
09:58:27
Под какие объемы?
Хз, я ж не пробовал, как я могу их узнать. Посещалка сайта ~60к сутки

Vitaliy
17.07.2017
09:58:29
КХ сервер поднимется и на 512Mb RAM, сколько нужно однозначно зависит от сколько данных

Andrey
17.07.2017
09:59:04
Хз, я ж не пробовал, как я могу их узнать. Посещалка сайта ~60к сутки
зависит от обьемов записи конечно. Но я думаю взлетит.

Artem
17.07.2017
09:59:39
Хочу модели аттрибуции сделать, соответственно нужны все действия юзеров совершивших конверсию

Google
Artem
17.07.2017
10:01:50
Ну так, есть желающие помочь? Сделаем через тимвьювер )

Алексей
17.07.2017
10:05:00
Господа, а в AS использовать два слова нельзя да ? хочу SELECT name as Interface number,

но ни в каких кавычках не получается :(

получаю Syntax error: failed at position ...

Roman
17.07.2017
10:08:06
в обратных пробовали?

` таких вот

Алексей
17.07.2017
10:09:18
спасибо. бектики даже в голову использовать не пришло

Artem
17.07.2017
10:11:43
Еще разок попробую) Нужно помочь мне поставить и запустить кликхаус на убунте в виртуалке или через докер + загрузить данные, вывести отчеты, показать как это все работает. Оплата за затраченное время Делать будем через тимвьювер

prll
17.07.2017
10:54:15
по умолчанию никуда 8)

Andrey
17.07.2017
10:54:19
такой вариант, в принципе, для меня подходит, я просто буду забирать .so и .h

по умолчанию никуда 8)
вот видимо по этому я его и не нашёл

Google
prll
17.07.2017
10:55:24
cmake -DMAKE_STATIC_LIBRARIES=0

Andrey
17.07.2017
10:55:29
по умолчанию никуда 8)
так... а именно clickhouse.so?

я не могу его себе вкомилить собрав .o?

prll
17.07.2017
10:56:34
или скорее всего лучше использовать все либы как .so и сделать свою .so - cmake -DUSE_STATIC_LIBRARIES=0

Vsevolod
17.07.2017
10:59:26
можно вкомпилить, собрав .a

prll
17.07.2017
10:59:27
я не могу его себе вкомилить собрав .o?
Можно, только называется оно dbms.a и весит около 500м

Vsevolod
17.07.2017
10:59:46
это неважно, сколько весит статическая либа

Andrey
17.07.2017
11:00:06
или скорее всего лучше использовать все либы как .so и сделать свою .so - cmake -DUSE_STATIC_LIBRARIES=0
для подключения всего этого мне понадобятся только .so и .h? Как-то всё равно не очень понятно как оно gcc в чистый С упоребится, получается до сборки ClickHouse мне нужно ещё добавить С-обёрток над классами?

prll
17.07.2017
11:01:19
это будет приключение

Andrey
17.07.2017
11:02:51
Всё нормально, я просто аккуратно отпилю два плюса сбоку

Можно, только называется оно dbms.a и весит около 500м
а для получеия .a мне какие-то ключи нужны?

а, ну вроде оно должно быть в MAKE_STATIC_LIBRARIES

prll
17.07.2017
11:14:25
да, оно по умолчанию сделается

Andrey
17.07.2017
11:23:49
Александр
17.07.2017
13:19:01
А что за магия такая с запросом? CREATE TABLE cursometr.statements ( statementId String, eventDate Date, eventTime DateTime, verb String, objectId String, onCourse UInt8, courseId UInt16, learnerId UInt16, contextRegistration String, resultScoreRaw Float64, resultScoreMin Float64, resultScoreMax Float64, resultSuccess UInt8, resultCompletition UInt8, resultDuration UInt32, resultResponse String, contextId UInt16) ENGINE = Distributed(statements, \'cursometr\', \'r_statements\', learnerId) │ SELECT eventTime, resultScoreRaw, objectId AS entity_iri PREWHERE (courseId = 8) AND (learnerId = 27008) WHERE (verb = '...') AND (entity_iri = '...') ORDER BY eventTime ASC Received exception from server: Code: 47. DB::Exception: Received from localhost:9000, ::1. DB::Exception: Unknown identifier: verb.

Andrey
17.07.2017
13:20:11
а from где?

Amelia
17.07.2017
13:30:04
а мне подскажите, пожалуйста, я совсем затупила. переношу сервис на кликхаусе на чистый убунту-сервер, и он мне выдает при запросах через http-интерфейс "-bash: POST: command not found" . это мне что надо установить такое системное, чтобы этого не было?

Google
Vladimir
17.07.2017
13:32:14
можешь альтернативно переписать на curl например, он чаще встречается у людей

скрипт

Amelia
17.07.2017
13:33:21
да-да, я понимаю, что не в кх. спасибо, нагуглила, буду ставить!

Andrew
17.07.2017
13:39:33
POST кстати непригоден для заливания больших объемов

Vladislav
17.07.2017
14:11:01
привет. можете подсказать, почему возникает ошибка при запросе с семплированием? DB::Exception: Not found column cityHash64(piwik_id) in block. There are only columns: event_time, url, action_name, ping, piwik_id. Запрос из таблицы со следующими параметрами: ENGINE = Distributed(sports, 'analytics', 'local_clickstream', cityHash64(piwik_id)

Tima
17.07.2017
14:14:11
Почему?
Скорее всего потому, что при использовании POST все передаваемые данные будут загружены в память, и только потом переданы post-запросом (не уверен, нужно смотреть что и как делает команда POST)

Vladislav
17.07.2017
14:36:52
странно тогда, почему не ругается при создании таблицы, когда ключа для семплирования нет в первичных

Вася
17.07.2017
14:48:34
Ага. Мне тоже это было странно.

Tima
17.07.2017
15:01:24
POST это скрипт из состава LWP
Причем тут rowbinary? Насколько я понимаю, POST - команда из состава некотого пакета для перла

Tima
17.07.2017
15:03:44
Вы привели описание того, что такое POST - я привел это описание, чтобы было понятно про что речь

Vladimir
17.07.2017
15:03:55
а

Vladimir
17.07.2017
15:11:06
Ребята, можно глупый вопрос. Например есть таблица в которой определены date Date, datetime DateTime, DueTime DateTime,. Тип таблицы MergeTree. Вопрос такой - я делаю инсерт 2017-07-17 │ 2017-07-17 17:13:44 │ 2017-07-17 17:13:38 а потом делаю инсерт 2017-07-17 │ 2017-07-17 17:13:44 │ 2027-07-17 17:13:38. В запросе я делаю выборку по DueTime. Насколько будет эффективно отрабатывать данный запрос если duetime лежит в достаточно далеком временном интервале от date mergeTree.

Roman
17.07.2017
15:12:28
date вы знаете для выборки?

Vladimir
17.07.2017
15:13:29
date вы знаете для выборки?
Например нет. Идет фул скан

Google
Vsevolod
17.07.2017
15:13:45
гм, а чем мне лучше делать нагрузку вида множество select запросов на одну запись?

через http интерфейс ch спавнит треды бесконечно и адово тупит

есть возможность сделать пачку из таких селектов и вычитать результат?

Roman
17.07.2017
15:16:11
Например нет. Идет фул скан
настолько же неоптимально, насколько вы бы выбирали любое другое поле, интовое, например в целом неоптимально, но КХ сам по себе очень быстрый, и поэтому должно быстро отработать )

Andrew
17.07.2017
15:18:28
Не очень понял. Post с rowbinary нормально кладёт чанками вроде.
POST должен посчитать объем данных. и сосет все в память. Я лил неткатом.

Admin
ERROR: S client not available

Alexander
17.07.2017
15:19:53
POST должен посчитать объем данных. и сосет все в память. Я лил неткатом.
Зачем ? Это только с content-length. Чанками не надо. Ну только небольшой буффер если под текущий чанк. Он даже в libcurl захардкожен не больше 16кб.

Вопрос: а что за runningAccumulate? (в попытках посчитать moving average)

Roman
17.07.2017
16:01:34
выводит агрегатное состояние от текущей строки и предыдущими строками в выборке

Alexander
17.07.2017
16:03:40
Получается что основная проблема реализации большинства функций - merge блоков. В kdb такой проблемы получается нет.

Roman
17.07.2017
16:10:25
Интересно, почему в КХ нет функции для представления json-стринга в виде Nested поля?

Bulat
17.07.2017
17:39:47
У json схема опциональна, у nested - обязательна. Ну и есть рекомендация в доке не делать вложенных структур

Roman
17.07.2017
18:42:36
Если нужно выцепить несколько значений из json, то приходится его несколько раз парсить

Можно было бы описав структуру необходимых полей, выцепить их разом

Alexander
18.07.2017
09:02:40
Коллеги, а что означает sharding_key = rand(), если у таблицы вот такой движок? Distributed(logs, default, hits, rand()) в доке что-то не нашел про это

и есть ли в КХ возможность получить, например 500 случайных строк из таблицы селектом?

про rand нашел)

елси в запрос добавить rand64() AS rand а потом по нему отсортировать - это нормальное решение?

Vsevolod
18.07.2017
09:08:09
https://clickhouse.yandex/docs/ru/query_language/queries.html#sample - нет?

Google
Alexander
18.07.2017
09:15:25
это не для всех таблиц

там надо движок с семплирование делать

Vasiliy
18.07.2017
09:17:13
Всем привет! Подскажите, если при вставке батча одна строка была битая - CH отбросит только ее или весь батч?

Alex
18.07.2017
09:53:41
Отбросит весь батч (если батч меньше 1048576 строк). Но если включены соответствующие настройки (https://clickhouse.yandex/docs/ru/operations/settings/settings.html#input-format-allow-errors-num), то можно отдельные строки пропускать.

Вася
18.07.2017
10:56:55
Коллеги, а что означает sharding_key = rand(), если у таблицы вот такой движок? Distributed(logs, default, hits, rand()) в доке что-то не нашел про это
Это будет означать что в таблицу можно писать. При вставке будет выбираться шард в соответствии со значением переданного выражения. В данном случае рандомно.

Александр
18.07.2017
12:27:35
А если на сервере есть две базы с разными именами, но в обеих есть таблицы с одинаковыми именами

И вот в одной бд есть реплицируемая таблица

а в другой бд не реплицируемая

Никаких конфликтов не будет?

Oleg Bazdyrev
18.07.2017
13:12:37
Привет всем! Вопрос по ошибке "Table XXX is creating or attaching right now". Можно как-то понять, что мешает таблице создаться и можно ли решить данную проблему без рестарта?

о, оказывается таблица уже создалась, всего-то 15 минут прошло

Tima
18.07.2017
13:15:38
Oleg Bazdyrev
18.07.2017
13:16:32
не, тут такого и близко нет, похоже на какие-то проблемы с ZK или с недоступностью реплик

Tima
18.07.2017
13:17:17
Часто такое? Может именно в этот момент "интернет" моргнул

Oleg Bazdyrev
18.07.2017
13:19:13
не так уж и часто, но все равно неприятно

Страница 205 из 723