
Alexey
08.05.2017
15:52:56
я сейчас костылю свою балалайку
по мотивам sqitch на базе ansible
но есть ощущение, что что зря так сделал
надо будет выносить на что-то более независимое

Google

Maksim
08.05.2017
15:55:07

Alexey
08.05.2017
15:56:29
в логах множество записей вида:
2017.05.08 18:52:27.437686 [ 52 ] <Warning> mprobe.sccp_msu_sharded (StorageReplicatedMergeTree, CleanupThread): Couldn't remove 20170508_20170508_4220883_4220883_0 from ZooKeeper: no node
Есть предположение от чего такое? что нужно с этим делать?

papa
08.05.2017
15:56:36
>а java разрабы не будет ставить себе php им нужен какой-то инструмент чтобы накатить и откатиь миграции
так может они его сделают?

Maksim
08.05.2017
15:59:55

Igor
08.05.2017
16:05:35
ну можно CLI-утилитку на том же пхп сделать, вон phabricator (arcanist) как-то же используется непхпшниками

Maksim
08.05.2017
16:07:44
хз. буду думать

Uncel
08.05.2017
16:27:08
Ох, https://www.mapd.com/blog/2017/05/08/mapd-open-sources-gpu-powered-database/

Maksim
08.05.2017
16:37:47

Dmitry
08.05.2017
16:42:30
@milovidov_an Добрый вечер. Я вижу, Вы смотрели pull request. Там все нормально ?

Alexander
08.05.2017
17:15:08
Это просто mapd, оно действительно очень быстрое, но довольно узкоспециализированно.

Maksim
08.05.2017
17:18:56

Alexander
08.05.2017
17:19:16
Конечно, оно даже быстрее kdb

Sergey
08.05.2017
17:19:21

Google

Maksim
08.05.2017
17:20:43

Alexander
08.05.2017
17:21:04
Только хотел эту ссылку :) по мне так кажется, что дотянуть КХ до схожих порядков можно создав engine с индексами в памяти. О чем я чуть выше писал.

Maksim
08.05.2017
17:21:28
Сейчас придут ребята с яндекс и забанят всех ))

Alexander
08.05.2017
17:21:38

Maksim
08.05.2017
17:23:00
круто. но мы только вот вот переезжаем на прод кликхаус пока переписывали часть функционала
а вы тут со своим mapd )) может когда нибудь )))
я так понимаю через GPU это нехилые сервера нужны

Alexander
08.05.2017
17:25:11
Для gpu не нужны нехилые сервера.

Maksim
08.05.2017
17:25:32
я в плане дороговизны обработки через gpu
такие машинки не дешевые

Kem
08.05.2017
17:26:14

Alexander
08.05.2017
17:29:08
Gpu не особо дорогие вроде. Около 4к.

Maksim
08.05.2017
17:29:38
намного дороже чисто процессорной обработки
если уже и переходить то из-за безысходности

Shine
08.05.2017
17:30:16
осталось еще сюда цену mapd прибавить

Kem
08.05.2017
17:30:31
и скалируется гораздо сложнее, но зато можно майнить битки во время простоя

Shine
08.05.2017
17:30:41
и там он на теслах гоняет
которые по 800 тысяч руб стоят
за карточку
400-800

Google

Dmitry
08.05.2017
17:32:42
тесла за 800k всяк дешевле 20 лишних серверов

Shine
08.05.2017
17:32:55
так у него там не одна карточка
если что )

Dmitry
08.05.2017
17:33:12
и?

Shine
08.05.2017
17:33:13
а 8

Alexander
08.05.2017
17:34:05
Ну xeon топовый вроде тоже под 3k.

Dmitry
08.05.2017
17:34:06
энергетика тоже денег стоит

Shine
08.05.2017
17:34:21
подозреваю что цена мапд
будет как 20 серверов )

Vitaliy
08.05.2017
17:35:25
как я понимаю mapd distributed вообще только появился (3.0) ? т.е. до этого было single machine
и вообще доступен только в их enterprise версии

Shine
08.05.2017
17:36:46
But having said that, Mostak was willing to put some error bars on the top-end price. On a system with eight Tesla K80s, which might cost somewhere between $60,000 to $70,000, the license for the MapD stack would be “a small multiple” of this hardware cost.

Alexander
08.05.2017
17:37:20
Если посмотреть на тот блог, то видно, что в тесте после gpu идёт база на cpu с несильно отстающими результами.

Shine
08.05.2017
17:37:24
а он с юмором

Igor
08.05.2017
20:15:35

Igor
08.05.2017
20:35:32

Alexey
08.05.2017
20:52:14

Hamed
08.05.2017
23:29:32
Hey

f1yegor
09.05.2017
08:32:14
1.1.54159

Google

f1yegor
09.05.2017
10:17:43
DB::Exception: There is no column with name user_agent_device. There are columns: ts, event_id, event_type, ..., user_agent_browser, user_agent_browser_version, user_agent_device, user_agent_os
т.е. поиском в этом же сообщеини я ее нахожу

Slach
09.05.2017
11:43:21
всем привет
объясните за тему макросов??
https://clickhouse.yandex/reference_ru.html#Creating%20replicated%20tables ?
можно ли все таки вместо имени реплики и id шарда что то использовать кроме как определять macros в каждом отдельном конфиге для каждого сервера?

Alex
09.05.2017
11:50:32
Использовать макросы необязательно - можно просто писать ReplicatedMergeTree('/clickhouse/tables/table', 'replica1', ...). Даже zk-путь таблицы в принципе может быть любой (префикс /clickhouse/tables это соглашение).
Преимущество макросов в том, что DDL получается одинаковым на всех серверах.

Slach
09.05.2017
11:56:05
уточню вопрос, то что хочется уникальный путь в пределах шарда, это понятно
но может просто можно этот самый {shard} не из макросов брать? а через какой нибудь запрос из SELECT shard_id FROM system.clusters ??

Alex
09.05.2017
12:09:56
Всё равно же придётся на основании чего-то вычислять номер шарда для конкретного хоста. Можно например на основании хостнейма. То есть получается что-то вроде ReplicatedMergeTree(concat('/clickhouse/tables/', someFunction(hostName()), '/table'), ...). Вы о таком говорите?
Уточню - сейчас так сделать нельзя :)

Slach
09.05.2017
12:25:33
да, я об этом говорю
а нельзя как то macros.xml
например сделать шаблоном? чтобы можно было например там значения переменных окружения использовать??
очень не хочется городить свой docker образ поверх стандартного
Алекс =) кстати мы с вами будет похоже вместе на clickhouse вопросы на stackoverflow отвечать =) я там подписался, чтобы доку чаще перечитывать, отвечая людям

Alex
09.05.2017
12:34:38
Да, stackoverflow отличная платформа, надо нам активнее там отвечать.
С docker можно вот так поступить - замапить директорию с хост-системы в /etc/clickhouse-server/config.d/, и положить туда macros.xml каким-нибудь ansible-ом. Немного отходит от идеологии контейнеризации, ну да ладно.

Pavel
09.05.2017
12:39:31
а у вас там просто свой тег или отдельно как-то под проект получили свое место там?

Alex
09.05.2017
12:42:56
Просто тег, насколько я знаю
https://stackoverflow.com/tags/clickhouse

Slach
09.05.2017
13:22:35
странно а почему не работают подстановки?
в /etc/clickhouse-server/config.xml
стоит
<macros incl="macros" optional="true"/>
делаю
/etc/clickhouse-server/macros.xml
<?xml version="1.0"?><macros><shard>ru</shard><replica>clickhouse-ru-1.local</replica></macros>
а в config-preprocessed.xml
получаю вместо macros пустоту
почему?

Alex
09.05.2017
13:26:13
Подстановки выполняются из /etc/metrika.xml, а дополнительные файлики надо класть в /etc/clickhouse-server/config.d/


Slach
09.05.2017
13:37:33
спасибо
заработало
но почему то падает при создании таблицы
clickhouse-us-1.local_1 | 2017.05.09 13:34:59.661461 [ 5 ] <Debug> ga2clickhouse.hits_replicated (StorageReplicatedMergeTree): Creating table /clickhouse/tables/us/hits
clickhouse-us-1.local_1 | /home/robot-metrika-test/jenkins/workspace/clickhouse-packages-build@2/sources/contrib/libtcmalloc/src/tcmalloc.cc:286] Attempt to free invalid pointer 0x7f127c972b60
clickhouse-us-1.local_1 | 2017.05.09 13:34:59.665835 [ 9 ] <Error> BaseDaemon: ########################################
clickhouse-us-1.local_1 | 2017.05.09 13:34:59.666192 [ 9 ] <Error> BaseDaemon: (from thread 8) Received signal Aborted (6).
clickhouse-us-1.local_1 | 2017.05.09 13:34:59.668073 [ 9 ] <Error> BaseDaemon: 1. /lib/x86_64-linux-gnu/libc.so.6(gsignal+0x38) [0x7f127ee0e428]
clickhouse-us-1.local_1 | 2017.05.09 13:34:59.668207 [ 9 ] <Error> BaseDaemon: 2. /usr/bin/clickhouse-server(Poco::ThreadImpl::runnableEntry(void*)+0xa5) [0x33fb245]
clickhouse-us-1.local_1 | 2017.05.09 13:34:59.668220 [ 9 ] <Error> BaseDaemon: 3. /lib/x86_64-linux-gnu/libpthread.so.0(+0x76ba) [0x7f127f8be6ba]
clickhouse-us-1.local_1 | 2017.05.09 13:34:59.668224 [ 9 ] <Error> BaseDaemon: 4. /lib/x86_64-linux-gnu/libc.so.6(clone+0x6d) [0x7f127eedf82d]
clickhouse-us-1.local_1 | Aborted (core dumped)
ENGINE = ReplicatedMergeTree('/clickhouse/tables/{shard}/hits', '{replica}', date, cityHash64( userId), (trackerId, date, cityHash64(userId), timestamp), 8192)
вот такое пытался создать

Google

Slach
09.05.2017
13:38:30
1.1.54198
версия сервера

Alex
09.05.2017
13:55:12
Ужас какой. А так падает только при создании replicated таблиц с макросами/любых replicated таблиц/любых merge tree таблиц? Образ - официальный yandex/clickhouse-server? Ещё интересен конфиг docker-compose (через него же запускаете?) и полный CREATE TABLE. Ещё круто было бы достать core-файл и снять с него бэктрейс.
Можем переместиться в github issues, чтобы тут не флудить :)

Slach
09.05.2017
13:56:37
Да сейчас попробую все достать и сделать issue
Возможно памяти не хватает в докере просто там 8 контейнеров в 2gb
Ну и я это дело пытаюсь с zetcd запустить вместо zookeeper

Alexander
09.05.2017
14:03:22
Вопрос: вопрос производительности buffer - хочется попытаться положить realtime данные через buffer без предварительной буферизации. Вопрос: где узкое место при таком подходе будет - парсинг? Может надо какой-то специфичный format указать?

Igor
09.05.2017
14:11:51
всем привет
подскажите, может у кого-либо есть опыт использования Druid в продакшене? Интересует сравнение с CH на маштабе 200 млрд событий/сутки, примерно. Либо может где-то уже есть сравнения, а я просто не могу найти?

Vladimir
09.05.2017
14:21:07
А кликхаус - база данных для аналитики

Igor
09.05.2017
14:21:36
ну не совсем про разное, на мой взгляд

Vladimir
09.05.2017
14:21:42
Самолёт с картошкой тоже можно конечно сравнить, но смысл?

f1yegor
09.05.2017
14:21:43
точных цифер не скажу, но я друид до прода не довел. было все слишком сложно и медленно(в сравнении с кх)

Vladimir
09.05.2017
14:21:45
Друид не предназначен для хранения сырых данных
А кх заточен под аналитику по сырым данным
Это разные подходы со своими особенностями

Vasiliy
09.05.2017
14:22:52
Всем привет! Подскажите, пожалуйста - а КХ читает все колонки, которые в подзапросе указаны?
К примеру, select date,event,count() from (select date,event,url) as t group by date,event;
В данном случае колонка url не нужна, будет ли она все-таки прочитана? Судя по тестам - да, она читается. Хотелось бы просто уточнить этот момент. Благодарю.