
Vladislav
10.11.2016
15:35:35
Кстати, а можно узнать, чем вызвана необходимость пилить свой формат SQL? Почему нельзя было взять классику?

Алексей
10.11.2016
15:40:25
Есть где то библиотека sqllib_std?

Vladislav
10.11.2016
15:41:04
есть стандарт...

Google

Vladislav
10.11.2016
15:41:17
например, SQL-92

Алексей
10.11.2016
15:42:28
Ну так к нему вроде как идти надо
Сначала часть функций потом ещё

Vladislav
10.11.2016
15:43:59
или вы сейчас описали светлое будущее, к которому CH рано или поздно придет априори?

Алексей
10.11.2016
15:45:04
Хз
Я описал как пишут софт

Igor
10.11.2016
16:06:53
гмм.. не подскажете, почему такое может быть?
SELECT id, timestamp FROM data WHERE timestamp = '2016-11-09 22:49:10';
┌─id───┬───────────timestamp─┐
│ 123 │ 2016-11-10 01:49:10 │
└──────┴─────────────────────┘
движок MergeTree, на сервере вроде часовой пояс и все такое не менялось, не уверен, могу уточнить

これはスタスか…ロマンですか
10.11.2016
16:09:22

Виктор
10.11.2016
16:09:46
Сдвиг 3 часа
Это таймзоны
А вот что именно не так - не очень понятно, да. Надо смотреть где какие настройки стоят и что менялось

Igor
10.11.2016
16:10:23
ну да, я тоже об этом подумал, но почему такое расхождение-то все равно..

Google

Виктор
10.11.2016
16:10:30
Ну 3 часа
Москва vs Гринвич

Igor
10.11.2016
16:10:56
да дело даже не в том, что 3 часа и GMT vs MSK, а в том, что странно, что время в WHERE одно, а в выводе - другое

Виктор
10.11.2016
16:10:59
btw там выше был флуд про "кликхаус не для точных данных"
Хочу заметить, что всё это ерунда
Мы храним в CH в том числе и деньги, и считаем по ним аналитику. Это работает точно до копейки.
Все гарании можно обеспечить, как я уже говорил.
Игорь, да, это странное, такого быть не должно.
Напишите на рассылку подробности, пожалуйста
Попробуем понять где проблема

これはスタスか…ロマンですか
10.11.2016
16:12:54

Igor
10.11.2016
16:13:06
копейки скорее

Виктор
10.11.2016
16:14:19
Краткий ответ: UInt32

Vladislav
10.11.2016
16:15:31

Виктор
10.11.2016
16:16:15
Предрасчитываются и записываются отдельными столбцами.
Расчет правильных сумм делается не в ClickHouse по сути.

Vladislav
10.11.2016
16:16:54
ну т.е. у вас анализ по сути по таким данным не производится...
т.к. расчет на стороне, и если делать аналитический расчет, то гарантий нет

Igor
10.11.2016
16:17:38

Виктор
10.11.2016
16:17:51
Если уверены что есть проблема, да.

Google

Alexey
10.11.2016
16:18:02

これはスタスか…ロマンですか
10.11.2016
16:18:03
what about bank operations that involve fractions of smallest currency unit?

Виктор
10.11.2016
16:18:29
we do not this kind of operations generally
but it's possible to convert your data to this smallest fractions, for example multiply your money to 1.000.000

Igor
10.11.2016
16:19:36

Виктор
10.11.2016
16:19:39
DECIMAL isn't supported for now.

Vladislav
10.11.2016
16:20:11
печаль

Виктор
10.11.2016
16:20:13
А, вот в чем дело. Понятно, да.
Тогда это сложно считать багом.

Igor
10.11.2016
16:22:27
да, но меня искренне конфузило из-за срабатывания условия WHERE и отличающихся (от условия) данных в результате. ну да ладно, спасибо еще раз!

Alexey
10.11.2016
16:23:25

Darafei
10.11.2016
16:24:32
а таймстемп парсит клиент?

Виктор
10.11.2016
16:39:49
Да, надо серверное время использовать.
Да, таймстемп парсит клиент.

これはスタスか…ロマンですか
10.11.2016
16:40:50
some kind of annotation on timestamp column?

Kirill
11.11.2016
07:58:08
Привет. А как обстоят дела с партицированием? Есть какие-то ограничения на хэш?

Виктор
11.11.2016
09:22:29
Привет!
Насколько я помню, там UInt64
Ну и можно делать expressions
Но мы рекомендуем шардировать руками, это более эффективный и контролируемый способ работы с данными

Google

Виктор
11.11.2016
09:23:28
Подробности тут: https://clickhouse.yandex/reference_en.html#Distributed

Maxim
11.11.2016
09:30:45
кстати, а есть какой-нибудь официальный гайд по использованию ClickHouse в Kubernetes?
ну то есть не обязательно именно кубернетес, ямлы нужные я и сам напишу
вопрос скорее про контейнеры, оверлей-сети и вот это все

Kirill
11.11.2016
09:32:20
Я немного не про шардирование, а именно партицирование с целью удаления кусков информации. Мы в VERTICA используем - это супер-удобно, т.к. без этого удаление становится банально невозможным.

Igor
11.11.2016
09:33:17
удаление, вроде, сказали, будет в Q2 2017
а пока можно только партишены целиком удалять в рамках таблицы, а они делятся на месяцы и пока это никак не изменить

Kirill
11.11.2016
09:34:02
Тема с произвольным ключем партиционирования действительно была бы очень крута
месяц не всегда удобно

Igor
11.11.2016
09:35:20
согласен

ptchol
11.11.2016
09:35:32
Да, там так и делается, старые данные удалить можно только удалмив партиции (или мне показалось)

Kirill
11.11.2016
09:35:59
удаление, вроде, сказали, будет в Q2 2017
Ну удаление в таких системах, имхо, не сильно востребованная фишка. А вот партицирование по произвольному ключу и возможность удаления партиций - это огонь. Пока из-за этого КХ не можем рассматривать как решения для prod'а.

Igor
11.11.2016
09:36:14
не знаю, меня очень порадовал (в плане производительности) INSERT INTO SELECT с фильтром только нужных данных

Kirill
11.11.2016
09:37:37

Виктор
11.11.2016
09:40:21
Партицирование про произвольному ключу будет, да.
Атомарный rename имеется.
Пишешь rename a -> a_old, a_new -> a;