@clickhouse_ru

Страница 589 из 723
Alexey
13.07.2018
19:26:57
ClickHouse Meetup в Санкт-Петербурге: https://events.yandex.ru/events/ClickHouse/16-aug-2018/ Открываем регистрацию.

Sergey
13.07.2018
19:28:16
???

Google
Alexey
13.07.2018
19:59:16
Да (если за месяц ничего не изменится)

Konstantin
13.07.2018
20:05:46
?

antuan
13.07.2018
21:56:37
а как таблицу то апдейтить ?
Как именно вы хотите её "апдейтить"?

Timur
14.07.2018
03:43:22
кто пробывал запустить pentaho olap server(mondrian) в связке с ClickHouse?

Андрей
14.07.2018
07:03:55
Oleg Bazdyrev
14.07.2018
09:06:17
Делаю запрос "rename table db_name.table_name to db_name.old_table_name". Получаю ошибку File not found: /var/lib/clickhouse//data/db_name/old_table_name Как так? Зачем он ищет файл таблицы, которой еще нет?

prll
14.07.2018
10:29:03
А полный трейс можно? Может быть попытка создать директорию провалилась. И какие файлы-директории есть с old в data и metadata ?

max zhylochkin
14.07.2018
16:09:46
всем привет! подскажите, пожалуйста, насколько clickhouse подходит для хранения метрик IoT устройств во времени? то есть можно ли (есть ли смысл) использовать ее как time-series базу данных? Стоит задача - хранить метрики и делать выборки во времени с возможностью аггрегации данных. Например, выбрать показание температуры за год с определенной дискретностью (шагом) и применением функции усреднения (макс, мин) промежуточных значений

max zhylochkin
14.07.2018
16:22:39
нужно сделать выборку типа: (на примере запроса из Timescale) SELECT time_bucket('15 minutes', time) AS fifteen_min, location, COUNT(*), MAX(temperature) AS max_temp, MAX(humidity) AS max_hum FROM conditions WHERE time > NOW() - interval '3 hours' GROUP BY fifteen_min, location ORDER BY fifteen_min DESC, max_temp DESC;

max zhylochkin
14.07.2018
16:41:12
температура, давление, влажность, шум, вибрация...и т.д. в общем более 1000 метрик в секунду

Google
max zhylochkin
14.07.2018
16:42:45
в timescale набегает более 1 Gb в день

Stanislav
14.07.2018
16:44:45
гигабайты тут не канают, если есть куда их сложить ?

Вот то, что 1000 метрик в секунду - может иметь значение. Там потребуется посредник, который их сложит в один батч и будет засовывать в базу большими кусками

Andrey
14.07.2018
16:47:12
в timescale набегает более 1 Gb в день
CH их еще пожмет и может вообще оказаться что в нем это всего лишь 100-200 Mb ?

max zhylochkin
14.07.2018
16:48:15
сложить как раз не проблема, проблема выбрать данные с какой-то дискретизацией, например, нарисовать изменение какого-то показателя за год. Количество данных по сенсору за год может быть огромное

Stanislav
14.07.2018
16:49:46
Огромное - это сколько?

max zhylochkin
14.07.2018
16:51:15
60*60*24*365=31536000 по каждому сенсору в год

Andrey
14.07.2018
16:51:17
сложить как раз не проблема, проблема выбрать данные с какой-то дискретизацией, например, нарисовать изменение какого-то показателя за год. Количество данных по сенсору за год может быть огромное
Если у вас есть понимание уровней аггрегации. Т.е. например вы 100% уверены что вы при запросе за год, аггрегируете по месяцу/неделе/дню то можно рядышком поставить MAT VIEW с двидком AggregatingMegreTree и тогда у вас будет быстрая таблица с атоаггрегацией и прочими прелестями

max zhylochkin
14.07.2018
16:57:14
это система телеметрии с возможностью подключения любых сенсоров. Сенсоры и частота получения данных определяются индивидуально для каждого проекта

Evgeny
14.07.2018
16:57:30
понятно

а как решаете вопрос с разнородными сенсорами?

Michal
14.07.2018
22:02:42
нужно сделать выборку типа: (на примере запроса из Timescale) SELECT time_bucket('15 minutes', time) AS fifteen_min, location, COUNT(*), MAX(temperature) AS max_temp, MAX(humidity) AS max_hum FROM conditions WHERE time > NOW() - interval '3 hours' GROUP BY fifteen_min, location ORDER BY fifteen_min DESC, max_temp DESC;
Для описанной задачи кликхаус подходит, более того это именно то для чего он придуман. Запрос с минимальными изменениями будет работать, и почти наверняка будет работать быстрее чем вы можете ожидать :) можете потом какие-то цифры для сравнения скорости кликхауса и таймскалы написать на ваших данных, т.к. вроде пока сравнения никто не делал.

30 млн значений в год с сенсора - это для кликхауса не страшные цифры. В Яндексе - сотни тысяч / миллионы событий в секунду. На одном среднем сервере с кликхаусом можно с относительно небольшими задержками (десятки секунд-минуты) делать аналитику для миллиардов записей. Если допустимы задержки в минуты / десятки минут - то можно и десятки миллиардов данных перемалывать на одном сервере. Если ответы на запросы нужны без видимых задержек - то потребуется больше одного сервера (с шардингом), или преагрегация данных. Но для начала - попробуйте на одном сервере.

Sergey
16.07.2018
06:26:45
А здесь есть кто-нибудь, раскативший ClickHouse на c5-инстансах в AWS? Вам норм живётся, машины не висят?

Wolf
16.07.2018
06:27:29
а что с ними должно быть не так ?

вообще в амазоне не висят машины

Sergey
16.07.2018
06:30:43
Во-первых, у m5 и c5 была (есть?) хитрая бага, которая зимой косила ряды. Там в случае с интенсивной работы i/o машина просто висла. Мы на это напоролись, пошли форумы читать амазоновые, оказались не уникальными. Ровно та же фигня, ровно на m5/c5 у ряда контор выстрелила. Во-вторых... Скажу словами поддержки Amazon, когда у нас за одну неделю три инстанса ушли в небеса: "железо иногда ломается".

Т.ч. про "не висят" не надо. :)

Google
Wolf
16.07.2018
06:31:52
хз облако как раз ориентировано на то что оно может умереть в любой момент и его надо как то подняться

Sergey
16.07.2018
06:35:21
В теории да. На практике "любой момент" не должен означать регулярные частые проблемы. И мой вопрос про актуальный опыт с c5 был именно об этом.

Maksim
16.07.2018
06:38:36
Вот мне все интересно, в каких случаях кроме резкого всплеска амазон интересен. Как мне видится, на Кликхаус идет ровная нагрузка и под него можно планировать железо. Вам амазон был выгоднее железа или просто привычнее?

Sergey
16.07.2018
06:39:02
Просто мы на нём давно живём.

Oleg Bazdyrev
16.07.2018
07:32:47
Привет Сервер упал с таким сообщением в логе: https://pastebin.com/cbAtw3b1

это с чего он так?

Michal
16.07.2018
08:10:57
Вот мне все интересно, в каких случаях кроме резкого всплеска амазон интересен. Как мне видится, на Кликхаус идет ровная нагрузка и под него можно планировать железо. Вам амазон был выгоднее железа или просто привычнее?
Облака... белогривые лошадки :) Главная проблема железа - оно медленно прибавляется / убавляется, и железные проблемы (типа упавший диск) становятся проблемами которые нужно решать тебе самостоятельно или в "полуручном" режиме (руками админов ДЦ). В случае AWS об этом голова не будет болеть, зато может болеть о каких-то других (порой странных) вещах - типа cpu throttle, роскомнадзор, какие-то неожиданные для тебя работы в ДЦ с рестартом серверов и т.п.

Андрэ
16.07.2018
08:19:35
...или с оплатой траффика) Что нас пока останавливает

Sergey
16.07.2018
08:24:49
Там межзональный дорогой, остальные терпимо. Но зависит от, конечно.

Андрэ
16.07.2018
08:28:45
Да, конечно, все индивидуально. У нас просто при расчетах какие-то негуманные числа получались. Но это уже оффтоп

prll
16.07.2018
09:06:26
Привет Сервер упал с таким сообщением в логе: https://pastebin.com/cbAtw3b1
какая версия? какие были запросы? как часто бывает?

Oleg Bazdyrev
16.07.2018
09:07:03
какая версия? какие были запросы? как часто бывает?
да это при запуске один раз повторилось, на всякий случай лог скинул версия 1.1.54388

Maksim
16.07.2018
09:24:18
Облака... белогривые лошадки :) Главная проблема железа - оно медленно прибавляется / убавляется, и железные проблемы (типа упавший диск) становятся проблемами которые нужно решать тебе самостоятельно или в "полуручном" режиме (руками админов ДЦ). В случае AWS об этом голова не будет болеть, зато может болеть о каких-то других (порой странных) вещах - типа cpu throttle, роскомнадзор, какие-то неожиданные для тебя работы в ДЦ с рестартом серверов и т.п.
> В случае AWS об этом голова не будет болеть вот эта фраза всё таки у меня вызывает легкий скепсис =) Не, бесспорно пара минут на запуск в амазоне против 3 дней ожидания кастомной конфигурации — это разница. Но вот сколько будет стоить двухголовый E5 с 8 SSD на 500 Гб в амазоне? Полагаю, что сильно дороже, чем беру я

Kirill
16.07.2018
09:25:13
Яндекс скоро облако с ClickHouse выкатит, наверное подешевле будет

nikoinlove
16.07.2018
09:27:00
Сильно это мягко сказано. Один порядок разницы будет точно:)

Daniel
16.07.2018
09:29:09
Яндекс скоро облако с ClickHouse выкатит, наверное подешевле будет
И Алиса заговорит словами ваших клиентов ?

Michal
16.07.2018
09:29:37
Но в кликхаусе на самом деле это сложновато...

Maksim
16.07.2018
09:34:36
Но в кликхаусе на самом деле это сложновато...
вот я именно в контексте кликхауса. Плюс как ни верти, а хочется покупать не только абстрактную бесконечную масштабируемость, а ещё и хорошее время отклика

Google
Michal
16.07.2018
09:35:34
Кликхаус не удобен в динамическом расширении и сужении. Много ручной работы требует из-за того что серверы - участиники сети не сами в сети регистрируются, а вручную добавляются в конфиги.

Mike
16.07.2018
10:16:06
Коллеги, подскажите плиз, никак не могу загрузить внешний словарь из pgsql, dsn создан по ману, через isql туда нормально заходит. конфиг сделал с именем xxx_dictionaries.xml, положил в conf.d, при изменении КХ его перечитывает (в логах есть упоминания), ошибок нет, но и в system.dictionaries пусто. Куда посмотреть еще? КХ перезагружать очень уж не хочется

Michal
16.07.2018
10:18:36
А как настроен <dictionaries_config> ?

Он по умолчанию не ищет конфиги словарей в conf.d.

только на верхнем уровне файлы словарей читает (т.е. если не изменяли <dictionaries_config> то конфиги словарей должны лежать просто в /etc/clickhouse-server/ )

И ещё сам файл с конфигурацией словаря - лучше всего обернуть тэгами <yandex>. Типа такого: <?xml version="1.0"?> <yandex> <comment>...</comment> <dictionary> <name>...</name> ... </dictionary> </yandex>

Mike
16.07.2018
10:27:09
И ещё сам файл с конфигурацией словаря - лучше всего обернуть тэгами <yandex>. Типа такого: <?xml version="1.0"?> <yandex> <comment>...</comment> <dictionary> <name>...</name> ... </dictionary> </yandex>
https://pastebin.com/7ufK6MNK конфиг, dictionaries_config дефолтный, в лог сыпет <Warning> ExternalDictionaries: /etc/clickhouse-server/dnl_dictionary.xml: unknown node in file: 'listen_host', expected 'dictionary' и тому подобное, как будто структура xml порушена, уже голову сломал - не могу понять где

Michal
16.07.2018
11:48:59
Хм. Хз. Попробуйте <dictionaries_config>dictionaries/*.xml</dictionaries_config> , создать папку /etc/clickhouse-server/dictionaries (обратите внимание на chmod / acl, чтоб кликхаус мог оттуда читать/писать), и переложите туда ваш файл.

Mike
16.07.2018
11:52:17
Так вообще не реагирует на файл словарей :) Чудеса

antuan
16.07.2018
12:07:07
а что у вас вообще прописано в /etc/clickhouse-server/config.xml, в настройке dictionaries_config?

Michal
16.07.2018
12:21:45
Так вообще не реагирует на файл словарей :) Чудеса
а, изменение <dictionaries_config> скорее всего требует рестарта

Так уж вышло
16.07.2018
12:26:12
Всем добрый день! А кто чем мониторит ch?

Mike
16.07.2018
12:26:18
а, изменение <dictionaries_config> скорее всего требует рестарта
так я могу положить кофиг словаря наверх, и он его видит - но ошибки пишет

Всем добрый день! А кто чем мониторит ch?
icinga - рабочие процессы, память, диски, grafana - уже более детальные данные

Michal
16.07.2018
12:27:27
/me потянулся за бубном.

Попробуйте тэги <yandex> в начале и конце заменить на <dictionaries>

А что в файле -processed?

Так уж вышло
16.07.2018
12:33:29
icinga - рабочие процессы, память, диски, grafana - уже более детальные данные
более детальные - самописные скрипты, которые выдергивают из кх метрики, и рисуем в графане?

Google
Bogdan
16.07.2018
12:34:12
Коллеги, подскажите пожалуйста есть кластер кликхауса с 2 шардами и двумя репликами создана distributed таблица в случае если один из четырёх инстансов кликхауса недоступен, то запись в distributed таблицу через гошный клиент github.com/kshvakov/clickhouse не работает в качестве ошибки пишет 'dial tcp 127.0.0.1:9012: connect: connection refused' при этом в другой инсталяции кликхауса при потере одного инстанса запись продолжается без ошибок подскажите пожалуйста по какой причине такое может происходить?

Mike
16.07.2018
12:36:39
А что в файле -processed?
В preprocessed помимо нужного еще куча всего дописывается из других вставок из conf.d (конф зукипера и прочее). на вот эти лишние параметры как раз и ругается конфиг-парсер

Files used to generate this file: /etc/clickhouse-server/dnl_dictionary.xml /etc/clickhouse-server/conf.d/listen_hosts.xml /etc/clickhouse-server/conf.d/logger.xml /etc/clickhouse-server/conf.d/memory.xml /etc/clickhouse-server/conf.d/settings.xml /etc/clickhouse-server/conf.d/zookeeper.xml /etc/metrika.xml -->

antuan
16.07.2018
12:39:41
config.xml дифолтный, не трогаю его
<dictionaries_config>*_dictionary.xml</dictionaries_config>

Mike
16.07.2018
12:39:57
да все так

antuan
16.07.2018
12:40:05
у вас файлик же называется dnl_dictionary.xml

пральна?

Страница 589 из 723