
Dmitry
17.03.2017
09:56:31
"Отсутствует возможность удалять столбцы, входящие в первичный ключ или ключ для сэмплирования (в общем, входящие в выражение ENGINE). Изменение типа у столбцов, входящих в первичный ключ возможно только в том случае, если это изменение не приводит к изменению данных (например, разрешено добавление значения в Enum или изменение типа с DateTime на UInt32)."
В принципе можно добавить явно что добавлять нельзя
https://clickhouse.yandex/reference_ru.html#Манипуляции со столбцами

Google

Dig
17.03.2017
10:09:14
Скажите, какова вероятность получить битую буду на кх? Просто хотим выкатить MVP, и запустить кх без репликаций. А если пойдут покупатели, то шардировать в дальнейшем.
Базу имелось ввиду

Dmitry
17.03.2017
10:11:02
что такое MVP?

Fike
17.03.2017
10:11:17
minimal viable product, первая рабочая версия

Andrey
17.03.2017
10:11:22
почти готовое решение)

Dig
17.03.2017
10:11:36
Да

Dmitry
17.03.2017
10:12:15
Если не будет проблем с железом врядли будут какие-то проблемы с железом

Andrey
17.03.2017
10:12:37
логично)))

Dig
17.03.2017
10:13:27
У нас на амазоне ec2 больше двух лет без проблем сервис крутится
Ни одного падения

Dmitry
17.03.2017
10:14:36
ну тогда я думаю проблем у вас не будет.
Но конечно с репликами надежнее

Dig
17.03.2017
10:15:02
Ок, будем пробовать

Google

Dig
17.03.2017
10:35:28
А зукиперу хватить какой-нибудь t2.small? Или помощнее нужны инстансы?

Vladimir
17.03.2017
10:40:34
Доброе утро! Вопрос по сми2/кх - скачал docker pull spoonest/clickhouse-web-client. Сделал -p18000:3000. CLICKHOUSE_HOST=http://test:8123 При коннекте пишет connected to browser sync и на этом все. Пробовал без host. Эффект такой же
до этого пользовался e11it/clickhouse-frontend. Там старенько но работает.

nikoinlove
17.03.2017
10:44:50
докер это способ одной командой запустить неизвестный код из интернета под рутом
а есть официальный образ кх в докере-то?

Vladimir
17.03.2017
10:46:46
? у вас есть какие то претензии к докеру?)) У меня например нет. Это не КХ а фронтенд КХ. Кстати КХ в докере тоже есть.

nikoinlove
17.03.2017
10:49:20
ну твой вопрос выглядит как "я запустил черный ящик из интернета и у меня не работает, помогите"

Vladimir
17.03.2017
10:51:54
ну во первых давайте не тыкать ? Не помню что разрешал... Во вторых докеры - с оффициального репозитория. В третьих - могу создать докер имадж и залить с гитхаба сборку. Не проблема. Только смысл. И в четвертых - диалог получается не конструктивным, так как я не уверен что общаюсь с одним из разработчиков СМИ2

Igor
17.03.2017
10:55:12
Честно ставить докер и поднимать весь проект смысла нет - если не планируете вносить правки , есть хостенная версия , или если хостингу не доверяете в репе лежит скомпиленный проект в папке Doc , собранный index.html+js+css - можно подсунуть их любому http серверу.

Pavel
17.03.2017
10:55:16
официальный образ кх для докера есть
https://hub.docker.com/r/yandex/clickhouse-server/

nikoinlove
17.03.2017
10:56:40
уже вижу в нем apt-get install —allow-unauthenticated :)

Pavel
17.03.2017
10:57:04
это вопрос к авторам и повод для баг репорта, я так думаю
но с учетом того, что репо по https
в этом флаге лично я ничего фатального не вижу
так или иначе обычно ключи для подписи льются предварительно тоже поверх https
а тут апкеты льются по https
все ОК, имхо.

Alexey
17.03.2017
12:24:10
Выложили релиз 1.1.54188. В нём исправление проблемы с OPTIMIZE FINAL и вертикальным мержем.
В качестве бонуса также присутствуют NULLS FIRST/LAST, поддержка NULL в функции if, доработки ifNull, nullIf, coalesce. Оптимизация сравнений FixedString в случае размера 16 байт и ещё куча мелочей.

Pavel
17.03.2017
12:27:38
о, оптимизация для UUID! Спасибо :)

Google

Alexey
17.03.2017
12:28:09
По задумке - для IPv6, но и для UUID тоже :)

Pavel
17.03.2017
12:29:02
IPv6 тоже оч круто :)
а в чем оптимизация заключается?

Alexey
17.03.2017
12:30:43
Ничего интересного. Вместо memcmp с неизвестным в compile-time аргументом делается сравнение либо через xmm регистры, либо через два UInt64.

Pavel
17.03.2017
12:31:56
отлично! больше скорости для айпи в6 выборок :)

Andrey
17.03.2017
12:32:02
>присутствуют NULLS FIRST/LAST
а можно поподробнее. Что это такое?

Alexey
17.03.2017
12:33:14
ORDER BY x NULLS FIRST
- сортировать по x, но все NULL-ы идут вначале.

nikoinlove
17.03.2017
12:33:32
а как хранить ипв4 и ипв6 правильно? отконвертить в4 в в6 и все в одну колонку свалить?

Pavel
17.03.2017
12:34:50
разные колонки
отдельный флаг про версию
в4 - uint32
в6 fixedstring16

Alexey
17.03.2017
12:35:39
Один столбец нормально.
Ещё вариант - если часто аналитика только по IPv4 и их большинство, то сделать два столбца, и когда нужен только IPv4 - использовать только маленький столбец.

Dorian
17.03.2017
13:02:22
Приветсвую, коллеги!
Задача есть неодинарная
Сможет ли CH быть заменой OpenTSDB + HDBase ?
OpenTSDB даёт слишком большой оверхед... хз где оно может поломаться.

Dmitry
17.03.2017
13:04:47

Dmitry
17.03.2017
13:05:09
Я бы лучше от конечной задачи пошел

Dorian
17.03.2017
13:05:40
Логи
Нужно хранить дохера логов

Google

Fike
17.03.2017
13:06:14
текстовых логов?

Dorian
17.03.2017
13:06:22
по идее да
или "пока да" )
логи разных формтов, есть syslog, есть json

Fike
17.03.2017
13:06:50
это совсем в другую сторону просто. graylog, elk-stack, splunk (так вроде он называется?)

Dorian
17.03.2017
13:06:50
всё в кучу

Dmitry
17.03.2017
13:06:50
а какие выборки делать по этим логам?

Dorian
17.03.2017
13:07:30

Dmitry
17.03.2017
13:07:47

Dorian
17.03.2017
13:07:56
http://stackoverflow.com/questions/27054954/elasticsearch-vs-cassandra-vs-elasticsearch-with-cassandra
вот тут интересно написано
That being said, ElasticSearch works great as a search engine. And Cassandra works great as a scalable, high-performance datastore.
Кассандра сможет лечь сверху хадупа
Вот пока в раздумьях
OpenTSDB <> Cassandra (?CH)

papa
17.03.2017
13:13:40
если у вас есть фиксированный набор типизированных колонок, не меняющиеся строки и количество запросов меньше чем количество строк, которые они читают, то CH должен подойти.

Dorian
17.03.2017
13:14:27
Т.е. если я буду колонки добивать, при записи в базу, то будет оК?

Fike
17.03.2017
13:24:55
Вот пока в раздумьях
OpenTSDB <> Cassandra (?CH)
Сформулируйте сначала задачу. Кассандра не сможет вам дать ни аналитические запросы (которыми и хорош КХ), ни полнотекстовый поиск, и я до конца не понимая описание задачи все равно могу с трудом предположить, что она вам подойдет. Пытаться скрещивать вторичные индексы кассандры с эластиком без хорошего знания этих продуктов так себе идея.

Andrey
17.03.2017
13:32:58
А вот такой вопрос. Положить данные в CH это как бы не проблема да. Но как их потом оттуда все достать если они не входят в оперативку одного сервера?

papa
17.03.2017
13:33:58
а как вы это делаете с другими базами

Google

Andrey
17.03.2017
13:35:30
ну в других базах нет отграничения на то что ответ должен быть меньше доступной оперативки
т.е. в самом худшем случае утрируя можно сделать select * from table и направить вывод в файл

Pavel
17.03.2017
13:37:58
только обработка на потоке - решение
но для этого нужен какой-либо язык программирования которым можно прогнать данные и выдернуть то, что требуется
кстати, а что значит не входят в оперативку?
добавьте терабайт свопа

papa
17.03.2017
13:40:12
а вам нужно достать данные из CH чтобы что c ними делать?

Andrey
17.03.2017
13:41:34
Ну у меня вопрос скорее теоретический. Сейчас опишу.

Vladimir
17.03.2017
13:42:16
Нужно хранить дохера логов
Кто-то вроде пытался тут логи в КХ складывать. Если они хорошо структурированные, выйдет вероятно интересно

Andrey
17.03.2017
13:42:20
хотя вроде все просто. Сидел я на CH, накопил 3 ПБ данных. И тут вдруг появилась какая то другая база на которую я хочу переехать. Как данные перенести?

Pavel
17.03.2017
13:43:03
я думаю это скорее будет проблема другой базы это всосать :)
и вообще если у вас 3Пб - у вас 20 девелоперов и 4 инвестора.

Andrey
17.03.2017
13:43:18

Pavel
17.03.2017
13:43:37
собственно, очевидный вариант - вскрыть формат хранения кликахуса
и прочитать файлы данных наживую, с диска.

papa
17.03.2017
13:43:48
обычно в этом случае у вас есть а) диапазоны по времени б) работающий sample offset . одним insert select все равно вряд ли обойдется.

Pavel
17.03.2017
13:44:05
а сам кликахуса вырубить
формат хранения хорошо описан, есть магия с датами - но все вполне можно понять
в итоге у вас будет тулза которая будет блок за блоком читать данные с КФ и вгонять их в целевую базу
или наживую, опять же, конвертировать в новый формат хранения новой базы