@clickhouse_ru

Страница 184 из 723
Alexander
26.06.2017
15:18:03
Может у вас версия новее. У меня 1.1.54236

Сейчас стоит пересобирать на stable ? Или стоит подождать, так как там какое-то обновление с broken-pipe скоро будет?

papa
26.06.2017
15:24:01
SELECT number FROM ( SELECT * FROM system.numbers LIMIT 100000000 ) WHERE number IN ( SELECT arrayJoin(arrayMap(x -> cityHash64(x), ['AAABBB', 'BBBCCC', 'CCCDDD'])) ) Ok. 0 rows in set. Elapsed: 0.542 sec. Processed 100.01 million rows, 800.06 MB (184.60 million rows/s., 1.48 GB/s.) SELECT number FROM ( SELECT * FROM system.numbers LIMIT 100000000 ) WHERE number IN (9061446772526811008, 5491217007787768788, 7314285464923205752) Ok. 0 rows in set. Elapsed: 0.548 sec. Processed 100.01 million rows, 800.06 MB (182.46 million rows/s., 1.46 GB/s.)

Google
papa
26.06.2017
15:32:41
у меня тоже 1.1.54236

но причина скорее всего не в arrayJoin

может по этой колонке есть индекс и он не используется, когда значения в подзапросе а не вписаны явным образом в условие

Alexander
26.06.2017
15:34:54
Ну возможно, но я не вижу причины почему, так как там ничего хитрого нет.

Индекс по sym есть

(date,sym,time)

papa
26.06.2017
15:36:39
потому что для этого нужно планировщику запроса понять что запрос дает условие на индекс и является констаной, вычислить эту константу или отложить применение индекса до вычисления запроса.

хитрого ничего нет, да

моя гипотеза - инлайн быстрее потому что по индексу, в отличие от select arrayJoin, который фуллскан.

Alexander
26.06.2017
15:38:59
Понял. Спасибо. Не понял только почему :)

papa
26.06.2017
15:39:31
потому что оптимизатор пока что недостаточно умен.

Alexander
26.06.2017
15:39:49
Ладно, я наверное вообще пойду поучусь вставлять данные в запрос. Может arrayjoin сам уйдет.

papa
26.06.2017
15:40:36
если вы можете на стороне клиента считать cityHash64, то подзапрос будет не нужен.

Google
Alexander
26.06.2017
15:41:12
потому что оптимизатор пока что недостаточно умен.
Просто не понимаю если честно. В кбд нет оптимизатора. Все что тут делается - выполняется нормальный порядок вычисления: сначала подзапрос, потом запрос.

Но я понял что оптимизатор что-то непонятное делает :) хотя по идее надо было просто вычислить в нормальной последовательности.

Александр
26.06.2017
16:20:38
В тестах, в гите можно посмотреть в какие движки втыкают. Вроде бы во всех работает, но говорили, что это пока экспериментальный функционал и по хорошему лучше воздержаться от использования

Alexander
26.06.2017
21:24:47
Такое ощущение, что любой sym in (select/функция...) отключает pk

Рулон
27.06.2017
05:58:01
Привет! ODBC драйвер для windows взлетел?

Denis
27.06.2017
06:33:51
всем привет) смотрел удаленно недавнюю встречу про ClickHouse, там намекнули, что с джойнами дела обстоят не очень. может кто в курсе в чем именно косяк и как с ним бороться?

Рулон
27.06.2017
06:35:13
Могу ошибаться, но суть такая что нельзя написать так select * from t1 left join t2 on t2.id=t1.id

Александр
27.06.2017
06:54:12
всем привет) смотрел удаленно недавнюю встречу про ClickHouse, там намекнули, что с джойнами дела обстоят не очень. может кто в курсе в чем именно косяк и как с ним бороться?
И сделать можно только один джоин на запрос, но это по сути не проблема, можно завернуть в несколько подзапросов

Roman
27.06.2017
07:10:01
Всем привет! Подскажите пожалуйста следующий момент: в доке про ReplacingMergeTree есть предупреждение; "Слияние происходят в фоне, в неизвестный момент времени, на который вы не можете ориентироваться. Некоторая часть данных может так и остаться необработанной." Про CollapsingMergeTree такого замечания нет. Правильно ли я понимаю, что механизм слияния строк в обоих движках примерно идентичный и подобное замечание также актуально для CollapsingMergeTree?

Vladimir
27.06.2017
07:45:41
Хм, там новый стейбл потегали. Кто знает что в нем нового?

Igor
27.06.2017
08:01:29
всем привет. а кто нибудь писал NULL в rowbinary формате, как там правильно NULL строку писать? Из доков непонятно: https://clickhouse.yandex/docs/en/formats/rowbinary.html В JDBC коде от NULL значений все огорожено: public void writeString(String string) throws IOException { Preconditions.checkNotNull(string); writeUnsignedLeb128(string.length()); out.write(string.getBytes()); }

Alexey
27.06.2017
08:35:30
Хм, там новый стейбл потегали. Кто знает что в нем нового?
Полно всего нового - давно не было релизов. Расскажу в Минске на митапе...

Shine
27.06.2017
08:39:00
темы интересные заявлены, повтор бы в москве потом :)

Alexey
27.06.2017
08:47:21
В Москве обязательно сделаем! Правда может быть уже осенью (хотя это пока не точно).

Vladimir
27.06.2017
08:47:45
@milovidov_an вот прям очень бы хотелось хотя бы краткие чейнджлоги

Google
Alexey
27.06.2017
08:56:37
@milovidov_an вот прям очень бы хотелось хотя бы краткие чейнджлоги
Недавно был файл changelog.md, но по факту оказалось, что мы его не поддерживаем, и пришлось удалить.

Alexander
27.06.2017
08:59:18
Наши желания не всегда совпадают с возможностями Яндекса. Я попробую по новому релизу написать что-то аналогичное https://www.altinity.com/blog/2017/5/22/clickhouse-release-notes

Alex
27.06.2017
09:01:51
Сегодня попозже напишу сюда краткие release notes

Alexey
27.06.2017
09:12:02
Алексей, а в новый билд вошло <version_query> для словарей?

Да.

Также вошла возможность посмотреть словари в виде таблицы.

Александр
27.06.2017
09:12:02
Сегодня попозже напишу сюда краткие release notes
Это было бы просто замечательно! :)

Alexey
27.06.2017
09:12:02
Отлично

Alexey
27.06.2017
10:14:14
заканчивается место, нашел в директории Distributed-таблицы 400Gb данных и 350 тысяч файлов ? это нормально?

mergetree таблица, куда пишет Distributed, 1 Tb

Andrey
27.06.2017
10:19:06
А пишете в Distributed?

Shine
27.06.2017
10:22:17
Sorry, we had to truncate this directory to 1,000 files. 20 entries were omitted from the list.

в тестах

Alexey
27.06.2017
10:23:13
да, все файлы в папке default\@шард\:9000, и все от 9 июня, я помню что была какая-то хрень при рестарте кликхаусов

как думаете, дропнуть может папочку тогда? :)

Andrey
27.06.2017
10:24:27
Если я не ошибаюсь, то это данные которые должны улететь на другой шард

У вас в логах нет случаем ошибки broken pipe?

Google
Andrey
27.06.2017
10:24:52
Шарды никакие не выключали?

Alexey
27.06.2017
10:25:25
broken pipe много в логах

Roman
27.06.2017
10:25:26
Всем привет! Кто-нибудь пробовал увеличивать значение max_bytes_to_merge_at_max_space_in_pool?

Alexey
27.06.2017
10:25:55
шарды рестартил вот тогда примерно, 9 июня, broken pipe до сих пор сыпется

Andrey
27.06.2017
10:25:58
broken pipe много в логах
ну это тогда те данные которые не улетели на тот шард. Мне помогал рестарт CH

Alexey
27.06.2017
10:26:02
что с этим делать хз

Dig
27.06.2017
10:30:25
все воюю с реплицируемыми мат.вью. https://groups.google.com/forum/#!topic/clickhouse/7yEoT_cMyJ4 У всех нормально работают реплицируемые MV? Просто пока в тесте данных мало и очень хорошо видно разбежку в цифрах. Если вьюшку делать не реплицируемой, то все ок, цифры совпадают. Куда копать даже не знаю.

Andrey
27.06.2017
10:32:16
что с этим делать хз
попробуйте рестартовать тот шард на котором эти ошибки валятся. А вообще вроде как должна быть новая версия которая это фиксит

Абрамов
27.06.2017
10:50:45
мне в таких случаях помогал рестарт того CH, где Distributed таблица создана... т.е. где bin файлы лежат...

Pavel
27.06.2017
10:50:49
вопрос, а в Grafana плагине для CH можно ли выводить array из uint32 просто списком?

Alexey
27.06.2017
10:59:02
у меня после рестарта данные начинали задваиваться

вспомнил

Andrey
27.06.2017
11:17:04
О, в репах похоже новая версия появилась. 1.1.54198. Кто нибудь может сказать, в ней есть фикс с broken pipe?

Alexey
27.06.2017
11:19:51
это же вроде версия от 29 Mar, не?

Alex
27.06.2017
11:20:28
1.1.54198 это старая версия. Новая это 1.1.54242

Alexey
27.06.2017
11:21:03
4 hours ago v1.1.54242-stable

Alex
27.06.2017
11:23:47
Пакеты можете пробовать, фикс broken pipe там есть. Disclaimer - ещё не обкатаны у нас на продакшене.

Roman
27.06.2017
11:23:47
Pavel
27.06.2017
11:24:02
ага, уже!)

сделал arrayMap(x=> IPv4NumToString(x), myarray)

Google
Andrey
27.06.2017
11:26:51
Alex
27.06.2017
11:28:02
http://repo.yandex.ru/clickhouse/trusty/pool/main/c/clickhouse/

Andrey
27.06.2017
11:31:35
http://repo.yandex.ru/clickhouse/trusty/pool/main/c/clickhouse/
А, оно еще как stable не помечено, понял, спасибо.

Igor
27.06.2017
11:39:56
а не менялись ли протоколы/взаимодействие с внешним миром? JDBC перестал работать после апгрейда, валится на любом запросе (включая select timezone()) с ошибкой ClickHouse exception, code: 27, host: 192.168.11.11, port: 8123; Code: 27, e.displayText() = DB::Exception: Cannot parse input: expected eof before: false

Denys
27.06.2017
11:47:52
Проверил - на 1.1.54236 jdbc драйвер нормально работает

Igor
27.06.2017
11:48:52
Имею ввиду вот эту версию 1.1.54242

https://github.com/yandex/ClickHouse/tree/v1.1.54242-stable

Откатился назад на 1.1.54236, JDBC работает. Просто я из jdbc выполняю какие то команды (то ли рейс drop table/create table, то ли кривой insert) которые стабильно рушат сервер в версии 1.1.54236. Я подумал что в 1.1.54242 это исправлено, но там JDBC не работает :)

Alexey
27.06.2017
12:23:09
в 236 версии есть фикс broken pipe?

Igor
27.06.2017
12:32:09
со своей проблемой разобрался. сегфолтилось вот поэтому ttps://github.com/yandex/ClickHouse/issues/875, то есть в 1.1.54242 пофикшено. Осталось понять почему JDBC в 1.1.54242 поломался :)

Страница 184 из 723