@clickhouse_ru

Страница 34 из 723
Виктор
13.12.2016
13:47:45
Во-вторых, в статье ничего нет про поддержку стартапов

Я ничего не знаю про поддержку стартапов Яндексом и ни разу такого не встречал, кроме Startup Camp

nikoinlove
13.12.2016
13:49:05
который закопали

Igor
13.12.2016
13:54:36
А кто-нибудь знает когда будет готов issue с решардингом? https://github.com/yandex/ClickHouse/issues/198 Хотя б приблизительно)

Google
Alexey
13.12.2016
16:57:06
кстати, для форматов тоже алиасы было бы удобно :-[ "TSV" вместо "TabSeparated", например
Можешь добавить уже сейчас, см. FormatFactory.cpp. Только напиши в коментариях, что это синоним, чтобы потом никто не запутался.

ну как минимум происходит вот так: clickhouse-client —host=my_server ClickHouse client version 1.1.54046. Connecting to my_server:9000. Connected to ClickHouse server version 1.1.54080. :)
Если клиент/сервер собирали сами, то может быть проблема с номером версии. Можно обновить клиент до последней версии и посмотреть, что всё будет Ок.

Igor
13.12.2016
17:29:56
потому что уже есть TSVWithNames, TSVRaw и т.д.

Alexey
13.12.2016
18:23:18
Дело в том, что этот формат сделан давно в тестовых целях (проверить, как отличается коэффициент сжатия) и вообще всерьёз не используется.

Shine
13.12.2016
18:52:21
ребят, а у кого слайды под рукой есть с предыдущего митапа ? -) на роадмап хочется еще разок глянуть

Dmitry
13.12.2016
18:57:58
В настройках чата - Photos and Videos

Иван
14.12.2016
09:09:58
/stat@combot

=(

Добавьте @combot. Он статистику по сообщениям показывает)

Igor
14.12.2016
09:27:20
Подскажите пожалуйста насчет toStringCutToZero. в доке написано, что она "возвращает String, удаляя нулевые байты с конца строки." Но toStringCutToZero('\0test\0') возвращает в итоге пустую строку, удаляя, судя по всему, всё после первого же встретившегося NUL-байта. я надеялся получить '\0test' на выходе, с честным отрезанием подряд идущих \0 только с правой части строки.

я просто заметил, что у меня некорректно работает проверка на пустой UUID, который так получилось, что начинался с '\0', а проверялся на пустоту (16 NUL-байт подряд) с помощью toStringCutToZero(uuid) = '' как раз :(

Google
Igor
14.12.2016
09:29:34
это бага или некорректное описание в доке?

Andrew
14.12.2016
09:30:34
Описание корректное но неполное. Концом z-строки очевидно считается первый встретившийся \0

Igor
14.12.2016
09:33:17
ну это просто странно, с учетом того, что в FixedString могут храниться бинарные данные, ipv6 или uuid тот же :\

Andrew
14.12.2016
09:34:26
У бинарных данных обычно не требуется преобразовывать Z-string в string

Igor
14.12.2016
09:34:34
справедливо %)

Andrew
14.12.2016
09:35:05
И если вы с бинарными данными работаете как с z-string - кто-то сам себе злобный буратино

Igor
14.12.2016
09:39:19
ОКОК, меня значит просто смутила дока фразой "с конца строки"

Andrew
14.12.2016
09:39:45
а CutToZero не смутила? :)

Igor
14.12.2016
09:41:52
смущала первое время, да :(

Combot
14.12.2016
10:27:08
Hello! Combot is a service for community analytics. It will gather chat statistics, rate users for their activities and help admins in group management. I can share statistics link for this chat via /stat command. Link is always the same. Here's link for your chat.

Виктор
14.12.2016
10:27:14
/stat@combot

Combot
14.12.2016
10:27:15
combot.org/chat/-1001080295593

papa
14.12.2016
10:31:13
интересно, что у них в качестве базы.

Darafei
14.12.2016
10:33:37
NaN%

Roman
14.12.2016
10:39:36
Кстати об аналитике. Тут проскакивало про поддержку clickhouse в redash. Кто-нить пробовал? Я попробовал кучу разных ревизий (после той, в которой вмерджили КХ). Везде все разломано (ошибки js, неработающий функционал и тд.). Может только у меня такие проблемы?

Andrey
14.12.2016
11:57:45
Добрый день. Вопрос по INSERT (не нашёл ответа в мануле): если идёт вставка батчем и в процессе вставки происходит сбой, что произойдёт со вставляемыми данными? Вставится часть батча или ничего не вставится?

Slach
14.12.2016
11:58:36
ну там всего два дня назад последник комит по кликсахус в redash был =) там автор пуллреквеста парень из Sports.ru попробуй у него спросить что и как?

f1yegor
14.12.2016
11:59:11
Ничего, Андрей

Andrey
14.12.2016
11:59:30
Спасибо

Roman
14.12.2016
12:01:53
запустил таки redash. взял последнюю стабильную версию (v0.12.0.b2449) и натянул на нее кликхаус. так работает вроде

Google
f1yegor
14.12.2016
12:04:16
redash это наподобие zeppelin?

Slach
14.12.2016
12:14:52
redash это вроде aribnb superset или вроде metabase

ptchol
14.12.2016
12:19:03
superset вроде только в друид ходить умеет.

это же просто переименованный caravel ?

f1yegor
14.12.2016
12:19:46
superset - переименованный caravel

Slach
14.12.2016
12:20:33
он научился SQL делать а не только druid

ptchol
14.12.2016
12:20:56
через presto ?

Gleb
14.12.2016
14:16:11
друзья, привет!

намучались с ELK для логов и ивентов всяких. стоит пробовать кликхаус?

nikoinlove
14.12.2016
14:20:47
ага. а с чем намучались-то?

Gleb
14.12.2016
14:21:12
у нас пока немного данных и ивентов, но уже сейчас тяжело это всё мейнтейнить

ну, эластик плох как база

+ в него не вмещается много данных, приходится удалять старые индексы, либо переносить их на другие ноды, либо просто закрывать

хз, может мы его готовим просто плохо, но пока что от него столько боли. И так понятно, что у больших ребят для наших целей (логи + бизнес-ивенты, которые плохо кладутся в rdbms) kafka + че-нить с хадупом или кассандрой какой

на хайлоаде был на докладе про кликхаус, вот думаю попробовать

(у меня сейчас кластер yellow просто, сил нет больше)

nikoinlove
14.12.2016
14:24:59
а какие объемы в терабайтах и записях?

Gleb
14.12.2016
14:26:34
немного совсем, мы далеко не всё собиарем, что можем. у нас нет терабайтов)

записей немного, 300-400 документов в секунду

но нам бы хотелось больше

Google
Andrew
14.12.2016
14:28:56
А что такое "документ" в вашем случае?

Gleb
14.12.2016
14:29:21
json документик с информацией: логом, ивентом

но мы быстро растем, примерно в 3 раза за год

ну как быстро, скорее, прогнозируемо :)

так же у нас в пейлоаде могут быть стектрейсы, например

papa
14.12.2016
14:32:25
кликхаус лучше себя ведет в том случае, когда этот документ имеет фиксированную типизированную структуру, которую перед заливкой распарсили и разложили в отдельные колонки.

Igor
14.12.2016
14:32:27
из кликхауса так себе документоориентированная бд )

nikoinlove
14.12.2016
14:33:04
а кстати к logstash никто плагин для кликхауса не пишет?

Gleb
14.12.2016
14:33:16
да, у нас есть часть строк типизированных, согласен

но если эксепшен, то там лютый стектрейс может быть

а если их много, то ухх

Igor
14.12.2016
14:33:40
ну можно его в String хранить

Gleb
14.12.2016
14:34:07
я вот думаю, может велосипед не изобретать, а просто все ивенты аккуратно класть в mysql какой-нибудь, мы пока по нагрузке точно влезем в одну машину

а потом в эластик забирать и там уже копать логи

тут вопрос в том, использовать ли mysql или сразу тяжелой артиллерией - кассандрой какой или кликхаусом

Andrew
14.12.2016
14:35:04
А если отделить мух от котлет? логи отдельно, трейсы отдельно?

Gleb
14.12.2016
14:35:43
это надо всю систему переписать тогда. в принципе, норм идея тоже

Google
Gleb
14.12.2016
14:36:17
еще у меня плохо сделано то, что данные льются прямо в эластик, а он крайне плох в этом плане

щас обновимся на es 5.1, сделаю две ingest ноды

r
14.12.2016
14:37:56
селектов много или в основном инсерты?

Gleb
14.12.2016
14:38:20
инсерты; селекты тока от людей, их немного

и мониторинга

r
14.12.2016
14:39:04
мускуль как промежуточная стораж?

Gleb
14.12.2016
14:39:26
да. просто в эластике данные хранить очень больно

Timur
14.12.2016
14:39:30
мы сейчас переходим со связки mysql + elasticsearch на clickhouse идея была такая-же - первичку пишем в mysql (к elasticsearch нет доверия в качетсве первичного хранилища), там селектов не делаем, только перекладываем в elastic батчами. а вот elastic используем только для аналитических выборок но даже для этого с ним возникают регулярные проблемы (сейчас статус кластера - red). причем у нас тоже не очень большие объемы (50gb данных, причем оно живет на машинке с 64 гб оперативки). возможно мы его не умеем нормально готовить, но по ощущениям - очень капризный продукт

Gleb
14.12.2016
14:39:45
о, обнимемся, друг!!

а 64гб как распределены? хип у эластика 31гб?

у вас дефолт или вы настраивали? для одной машины можно убрать реплика шарды

но вообще зависит от количества шардов на эти 50гб

Timur
14.12.2016
14:41:31
у нас дефолт. но там хип по-моему больше, в районе 40-50, не помню точно

Gleb
14.12.2016
14:41:36
на одной машине держать его это антипаттерн, кстати. а на трёх это БОЛЬ

Timur
14.12.2016
14:41:49
но это в общем-то неважно пока то что clickhouse показывает на наших данных - это просто сказка. в использовании на порядок удобнее эластика (прежде всего из-за того что sql для выборок)

Gleb
14.12.2016
14:41:53
хип нельзя ставить больше 31, иначе оно переходит на неправильные поинтеры : D

Timur
14.12.2016
14:42:17
:)) ну вот может сейчас статус тоже до yellow снизим )

Gleb
14.12.2016
14:42:18
так, отлично, вот хорошо, что я к вам пришел

Страница 34 из 723