
Slach
09.05.2017
14:26:18
Народ, а где core dumps для КХ создаются?

Maksim
09.05.2017
14:26:48

Alex
09.05.2017
14:28:50

Slach
09.05.2017
14:31:40
|/usr/share/apport/apport %p %s %c %P
и куда смотреть?

Google

Alex
09.05.2017
14:43:48
Хм. Вот тут пишут, что core_pattern на контейнер установить нельзя: http://stackoverflow.com/questions/39136601/changing-proc-sys-kernel-core-pattern-file-inside-docker-container Соответственно он взялся из хост-системы. Такой паттерн значит, что запускается программа apport и core-файл отправляется на её стандартный вход. Поскольку в контейнере она не установлена, видимо core-файл потерян.

Slach
09.05.2017
14:52:46
а я сейчас попробую это сейчас исправить
так, обычные MergeTree создаются нормально
падает только на ReplicatedMergeTree ...
сейчас попробую запрос упростить как можно сильнее
а я сейчас попробую это сейчас исправить
так дело точно не в кол-ве свободной памяти
щас попробую zetcd на zookeper заменить

Igor
09.05.2017
15:21:37

Slach
09.05.2017
15:21:44
да, проблема в zetcd
=( рано я вчера порадовался

Igor
09.05.2017
15:22:00
:(

Slach
09.05.2017
15:24:10
щас посмотрим что там по сети ходит... интересно же
никто случайно для wireshark не подскажет нормального анализитора пакетов для zookeeper protocol ??

Igor
09.05.2017
15:26:12
сходу такой не гуглится
можно исходники клиентов посмотреть
http://www.arinkverma.in/2013/05/understanding-zookeeper-protocols.html вот обзорная статья какая-то нашлась

Slach
09.05.2017
15:30:23
https://github.com/twitter/zktraffic
щас это попробую как то прикрутить
хмм...
я не знаю что я сделал
но оно заработало
<Debug> zetcd_test.test_replicated (StorageReplicatedMergeTree, RestartingThread): Activating replica.
https://github.com/Slach/clickhouse-zetcd

Google

Slach
09.05.2017
17:19:59
если у кого то есть время поиграться со стендом ... сообщите результаты в личку пожалуйста?
=(( ай блин это все стандартный zookeeper
https://github.com/yandex/ClickHouse/issues/777
в общем ребята, посмотрите если не сложно стенд который я собрал на досуге

Aleksey
10.05.2017
07:53:52
Добрый день! коллеги а никто не сравнивал производительность КХ с СУБД на ГПУ (типа MAPD)?...

Konstantin
10.05.2017
08:00:06
Aleksey была статья выше
с обсуждением
в районе 9го мая

Aleksey
10.05.2017
08:05:25
с обсуждением
спсб видел... но там скажем так заинтересованное лицо было (ибо железо странное в тестах...)... а независимые (ну или условно независимые) тесты никто не делал? и что сами ребята из яндекса по поводу такого движка как ГПУ думают? не спрашивали в кулуарах?

Alexey
10.05.2017
08:40:01
если я правильно понял, то результаты заоблачные в mapd получаются тогда, когда данные в памяти GPU размещаются

Рулон
10.05.2017
08:40:19
Это же сколько надо видях воткнуть чтобы 1 тб прогрузить?

Vladimir
10.05.2017
08:40:58

Рулон
10.05.2017
08:41:04
кстати, кликвью тоже все в памяти хранит )

Alexey
10.05.2017
08:41:37
те кому нужны эти микросекунды, те готовы приобретать такое оборудование
т.е. это достаточно нишевый продукт получается

Pavel
10.05.2017
08:41:55
Угу
В обалке эти теслы стоят космических денег

Alexey
10.05.2017
08:42:53
может какой-то микротрейдинг с реалтайм аналитикой и подобное

Maksim
10.05.2017
08:45:55
Ребят а вообще существует драйвер java для clickhouse чтобы его внедрить в какую нибудь migrate tool ?

Vladimir
10.05.2017
08:46:54

Vladislav
10.05.2017
08:48:31

Google

Maksim
10.05.2017
08:49:08

Shine
10.05.2017
08:50:54
Я там ваше кидал
цитату овнера
mapd
But having said that, Mostak was willing to put some error bars on the top-end price. On a system with eight Tesla K80s, which might cost somewhere between $60,000 to $70,000, the license for the MapD stack would be “a small multiple” of this hardware cost.

Maksim
10.05.2017
08:52:21
причем тут mapD ?

Shine
10.05.2017
08:52:34
см выше
там про мапд
спрашивали

Maksim
10.05.2017
09:04:09
а сори

Shine
10.05.2017
09:11:40

Pavel
10.05.2017
09:12:37
кошмар ваще

Vladimir
10.05.2017
09:16:24
Ребята подскажите, есть запрос который возвращает аггрегат avg(score). Можно ли как то воспользоватся полученным и вычислить min и max от avg с наименьшим ресурсопотреблением? ну то есть min (avg (score)) и включить в общий вывод

Vitaliy
10.05.2017
09:18:29
Vladimir SELECT min(avg_score) FROM ( SELECT avg(score) FROM ... GROUP BY .. ) t ?

Vladimir
10.05.2017
09:18:49

papa
10.05.2017
09:20:00

Vladimir
10.05.2017
09:20:56


papa
10.05.2017
09:41:30
в стандартные возможности это вряд ли укладывается, т.к. с точки зрения реляционной алгебры максимумы минимумы - это такая функция из отношения в отношние (из одной строки и 2n столбцов), и добавление их к основному ответу превращает обычный прямоугольный ответ в объединение цифр с некоторым соглашением про их смысл. в json их можно выдать, т.к. он поддерживает произвольную структуру, в tsv например начинаются неоднозначности.
поэтому либо plain old sql несколько раз, либо какие-то расширенные флажки и форматы. а как вы такие вещи делаете не в clickhouse?

Google

Vladimir
10.05.2017
09:48:41

papa
10.05.2017
09:49:48
и размножать одно значение для каждой строки?

Vladimir
10.05.2017
09:50:03

f1yegor
10.05.2017
10:38:37
@ztlpn возможнов в таблицу system.dictionaries стоит добавить колонку обновления конфига?

Vladimir
10.05.2017
10:41:10
Было бы шикарно

Andrew
10.05.2017
11:14:54
Пытаюсь скрещивать между собой Ch и pentaho DI. Наткнулся на такую неприятную багу:
2017/05/10 14:09:45 - Table input.0 - ERROR (version 7.0.0.0-25, build 1 from 2016-11-05 15.35.36 by buildguy) : org.pentaho.di.core.exception.KettleDatabaseException:
2017/05/10 14:09:45 - Table input.0 - Couldn't get row from result set
2017/05/10 14:09:45 - Table input.0 - java.text.ParseException: Unparseable date: "2016-05-18"
т.е. столбцы с датой парсятся некорректно. Есть идеи как это побороть?

Mike
10.05.2017
11:18:35

Andrew
10.05.2017
11:18:52
Не, Talend не хотелось бы)
ибо а) pentaho-server б) интерфейс у talend-а рисовали какие-то инопланетяне
Сам по себе pentaho работает - не работает table input из ClickHouse для столбцов с датами
toString() как бы спасает, но хотелось бы более прямого способа

papa
10.05.2017
11:35:37
а какой формат дат у pentaho?

Andrew
10.05.2017
11:39:10
YYYY/MM/DD

papa
10.05.2017
11:40:10
https://xkcd.com/1179/

Vladimir
10.05.2017
11:47:55

Vladislav
10.05.2017
11:52:26

Andrew
10.05.2017
11:55:55
https://xkcd.com/1179/
Там все малость сложнее. DateTime обрабатывается корректно. в любом формате. проблема именно с Date. и мне пока не ясно кто тут крайний - pentaho или сама жаба

Dmitriy
10.05.2017
12:05:36
Доброго времени суток, может кто то соорентировать что будет быстрее:
Изходя из того что данных в кликхаусе 10ТБ
вариант первый:
CPU 8 Потоков
RAM 8
1ТБ RAID-1
replication factor 2
всего 20 Серверов
Вариант второй
CPU 16 потоков
RAM 8
2ТБ RADI-1
replication factor 2
всего 10 Серверов

Alexey
10.05.2017
12:07:07
по теме не отвечу, но бросается в глаза то, что сервера вроде неслабые, а памяти с гулькины слезы

Google

Alexey
10.05.2017
12:07:16
как-то не по современому

Andrew
10.05.2017
12:08:23

Dmitriy
10.05.2017
12:08:35
по памяти скажу так, что надо много памяти там где делаются запросы. на тех серверах что не обрабатввают запросы память практически не расходуется.
по крайней мере заметил такое на нашей конфигурации
постоянная запись. и редкое чтение

Alexey
10.05.2017
12:09:10
возможно вы и правы
но это уже тонкое понимание вашей конфигурации

Dmitriy
10.05.2017
12:09:26
по памти планирую два сервера с 64ГБ памяти под запросы
вопрос что лучше концептуально - много маленьких или поменьше но чуть жирных,
из ходя из того что дисковая подсистема это RAID1 и для маленьких и для жирненьких. это вероятно уже медленно на наше время но все же.

Alexey
10.05.2017
12:14:35
если диски одинаковые, если сеть одинаковая (1Gb) и ваш коммутатор держит общую возможную нагрузку, то выходит 20 серверов лучше масштабируются по сетевому IO
при всяких ребалансировках и, наверное, некоторых запросах надо будет передавать меньшее кол-во данных через сеть с одного сервера

Alexander
10.05.2017
12:37:27

f1yegor
10.05.2017
13:51:08
проблема ALTER TABLE <table> ADD COLUMN <new> String DEFAULT <old> AFTER <old>;

Vladimir
10.05.2017
13:58:33

papa
10.05.2017
14:01:32
в профиле по-моему можно, для драйвера - это как? ClickHouseQueryParam такой есть, в ClickHouseProperties можно задать.

Vladimir
10.05.2017
15:30:21