@clickhouse_ru

Страница 162 из 723
Pavel
06.06.2017
15:23:31
сейчас насколько я понимаю, кликхаусу нельзя скормить 24 3Тб жестких диска, чтобы он самостоятельно разместил данные на них равномерно.

nikoinlove
06.06.2017
17:31:56
кажется использовать зфс чтобы объединить диски это оверкилл

Egor
06.06.2017
17:33:35
всем привет. полечите по фотографии пожалуйста. КХ жрёт проц как не в себя, в show processlist висят инсёрты, приложение легло. Как понять, почему инсёрты висят?

Google
Egor
06.06.2017
17:33:47
в логах что-то непонятное, щас на пастебин выложу

место на диске есть

https://pastebin.ca/3828789

Alex
06.06.2017
17:52:38
sudo perf top что показывает?

в логах ошибки просто означают, что селекты тормозят и не укладываются во временной лимит

Egor
06.06.2017
18:18:38
есть какой-нибудь аналог эксплэйна мускулевского?

Alex
06.06.2017
18:22:06
Неким аналогом является то, что в логе после <Debug> executeQuery: Query pipeline:. Но эта информация обычно имеет мало ценности, потому что запрос почти однозначно преобразуется в план.

Felixoid
06.06.2017
18:44:56
nikoinlove
06.06.2017
18:47:21
нуда 32 харда в рейд 10. мистер бесконечные деньги:)

Александр
06.06.2017
19:52:02
Кто-нибудь использовал Clickhouse в Laravel5? Как поступили с миграциями?
Мы напилили свой элоквент билдер и свой клиент. Могу на гитхаб вывалить. Для миграций простой query runner через artisan. Список серверов настраивается через конфиг. Не стали мудрить с грамматикой и прочим в их схеме с миграциями.

Aleksey
06.06.2017
20:50:12
всем привет, собираю стату по кликам, нужно пометить через некоторое время конверсионный, по сути нужен апдейт по номеру клика одного поля как тут лучше быть?

Pavel
06.06.2017
22:02:15
выше спрашивал почему зфс

а не md или что-то еще

Google
Pavel
06.06.2017
22:02:47
основная проблема не отсуствие возможности объединенное блочное устройство сделать, для этого есть lvm, dm, md и аппаратные рейды

скорее вопрос в том, какую файловую систему ставить поверх этого 10-60 терабайтного блочного устройства

ext4 и прочие - идут мимо. был приятный опыт недельного fsck в оффлайн режиме на 20тб, больше не хочется :)

а ZFS On Linux с центосом 6 и 7м прекррасно хранил по 60 тб без единой проблемы почти 3 года, но это были бэкапы с довольно своеобразным паттерном записи (в основном последовательная)

отсюда и вопрос, был у кого опыт или нету)

Ilya
06.06.2017
22:04:50
Могу соврать, но у нас на сколько я помню часто ставят xfs на дисковые полки. Но это не для КХ.

Pavel
06.06.2017
22:05:32
вполне возможно, но все равно на таких объемах файловую систему без self-healing как зфс страшно :(

XFS я как-то совершенно упустил из практики, лет 7 назад были потери данных, а после этого "осадок остался" и везде был экст3 ну и потом экст4, с сопутствующим им приколами

Maksim
06.06.2017
22:28:46
вот никак не могу найти ответ в мануале: а почему count() возвращается в json как строка?

papa
07.06.2017
00:01:54
uint64/int64 по умолчанию сериализуется в json как строка чтобы не ломаться у людей без целых 64-битных типов. отключается настройкой output_format_json_quote_64bit_integers

Александр
07.06.2017
06:30:06
Выложите пожалуйста
Сегодня точно выложу клиент, который можно использовать отдельно. Пока там нет поддержки —external файла для использования в условиях where in / not in, но в ближайшие пару дней добавим. Билдер элоквента сегодня в течение дня постараемся покрыть тестами и тоже выложить на гитхаб.

Иван
07.06.2017
07:34:48
Всем привет! Не появился еще odbc под windows?

Alexey
07.06.2017
08:20:28
сейчас постоянно сыпит такое в лог: 2017.06.07 11:19:08.089529 [ 13 ] <Error> mprobe.sccp_msu_sharded (StorageReplicatedMergeTree): checkPartAndAddToZooKeeper: node /clickhouse/tables/s3_r2_03/mprobe/sccp_msu_sharded/replicas/xdray-9/parts/20170607_20170607_3608084_3614891_1627 already exists 2017.06.07 11:19:08.096770 [ 13 ] <Error> DB::StorageReplicatedMergeTree::queueTask()::<lambda(DB::StorageReplicatedMergeTree::LogEntryPtr&)>: Code: 235, e.displayText() = DB::Exception: Part 20170607_20170607_3608084_3614891_1627 already exists, e.what() = DB::Exception, Stack trace: 0. clickhouse-server(StackTrace::StackTrace()+0x16) [0x27a44c6] 1. clickhouse-server(DB::Exception::Exception(std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> > const&, int)+0x1f) [0xfe082f] 2. clickhouse-server(DB::MergeTreeData::renameTempPartAndReplace(std::shared_ptr<DB::MergeTreeDataPart>&, SimpleIncrement*, DB::MergeTreeData::Transaction*)+0xee3) [0x28cee63] 3. clickhouse-server(DB::StorageReplicatedMergeTree::fetchPart(std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> > const&, std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> > const&, bool, unsigned long)+0x3a3) [0x288ee83] 4. clickhouse-server(DB::StorageReplicatedMergeTree::executeLogEntry(DB::ReplicatedMergeTreeLogEntry const&)+0x7b7) [0x28903a7] 5. clickhouse-server() [0x289362e] 6. clickhouse-server(DB::ReplicatedMergeTreeQueue::processEntry(std::function<std::shared_ptr<zkutil::ZooKeeper> ()>, std::shared_ptr<DB::ReplicatedMergeTreeLogEntry>&, std::function<bool (std::shared_ptr<DB::ReplicatedMergeTreeLogEntry>&)>)+0x3b) [0x293e08b] 7. clickhouse-server(DB::StorageReplicatedMergeTree::queueTask()+0x132) [0x28735d2] 8. clickhouse-server(DB::BackgroundProcessingPool::threadFunction()+0x3cc) [0x28b9b9c] 9. clickhouse-server() [0x3174adf] 10. /lib64/libpthread.so.0(+0x7dc5) [0x7f083e96bdc5] 11. /lib64/libc.so.6(clone+0x6d) [0x7f083c23d21d] При этом данные вроде доступны. Есть идеи что с этим делать?

Alexander
07.06.2017
08:38:36
привет! нужно округление времени до границы в 20 минут (как timeSlot, только 20 минут) (и за этот интервал буду брать среднее значение value) intDiv(ts, 1200) будет прекрасно работать или у timeSlot есть какая-то дополнительная магия (типа преагрегации)?

Alexey
07.06.2017
08:47:13
Коллеги, а что обычно делают, когда на двух репликах получилось разное кол-во строк

ну и сыпится постоянно вот та ошибка, что выше приведена?

Vladislav
07.06.2017
10:41:01
привет. столкнулся со странной ошибкой. запрос такой: SELECT screen_name, count(*) FROM ( SELECT screen_name, session_id, event_time FROM analytics.apps_clickstream LIMIT 2 BY session_id ) GROUP BY screen_name LIMIT 50 фейлится с ошибкой DB::Exception: Not found column session_id in block. There are only columns: screen_name, e.what() = DB::Exception подзапрос при этом выполняется и отображает все колонки.

Maksim
07.06.2017
10:46:19
можешь по-другому это сделать:

select screen_name, uniqExact((session_id, event_time)) from analytics.apps_clickstream group by screen_name

Google
Maksim
07.06.2017
10:46:56
так не лучше?

Vladislav
07.06.2017
10:51:59
так не лучше?
да это я для примера такой запрос сделал, чтобы показать проблему. изначальная задача вообще определить второй экран в сессии. )

Александр
07.06.2017
12:01:30
Кстати в КХ есть неприятный баг, который неправильно оптимизирует запрос и выкидывает какие то блоки данных

Мне из-за этого пришлось считать среднеквадратичное отклонение на прикладном уровне блин...а там бывает по 100 000 строк в результате запроса

Александр
07.06.2017
12:04:58
Нет еще, руки не дошли, но в гугл группах мне кто-то из команды КХ подсказал как этот баг обойти, но этот костыль не всегда работает

Vladimir
07.06.2017
12:07:08
Нет еще, руки не дошли, но в гугл группах мне кто-то из команды КХ подсказал как этот баг обойти, но этот костыль не всегда работает
так все-таки пусть руки дойдут ? Просто наверняка многие с этим столкнуться/сталкивались.

Александр
07.06.2017
12:07:33
Да, я думаю многие, но никто еще не написал ) В течение пары часов постараюсь добраться и описать баг

Александр
07.06.2017
12:46:38
Нет, есть у меня запрос в котором есть несколько вложенных подзапросов. И поверх всех типа select * from (куча подзапросов вложенных). Дак вот самый верхний ругается мол "column learnerHash not found in block"

Хотя если сделать select *, count(learnerHash) from (куча подзапросов вложенных), то все ок

Igor
07.06.2017
12:47:42
а джойнов нет? звездочка только по левой таблице столбцы выбирает

Александр
07.06.2017
12:47:44
Речь про Float в первичном ключе или что-то другое?
https://groups.google.com/d/msg/clickhouse/tzLZG-FWbvE/siX-Df9tBAAJ вот тут я описывал проблему

а джойнов нет? звездочка только по левой таблице столбцы выбирает
Есть и джоины. Про звездочку не знал, но там не в это дело. learnerHash изначально имеется в левой таблице

Igor
07.06.2017
12:48:35
а. хм. прикольно

Александр
07.06.2017
12:48:56
Например даже если я делаю select median(duration) from (куча подзапросов вложенных) то валится ошибка

А если к медиане припишу еще count(learnerHash), то все ок работает )

Речь про Float в первичном ключе или что-то другое?
Мне там Николай Кочетов ответил как решить проблему, но это решение не всегда работает и не всегда удобно его использовать в запросах

Andrey
07.06.2017
13:06:49
Ребят, а есть простой способ пронумеровать строки в выводе?

Google
Igor
07.06.2017
13:08:23
rowNumberInAllBlocks() только лучше основной запрос обернуть в подзапрос (а эту функцию запихнуть снаружи) и ORDER BY timestamp какой-нибудь в подзапросе указать, но могу ошибаться

Pavel
07.06.2017
13:08:26
Всем привет! Не появился еще odbc под windows?
https://github.com/yandex/clickhouse-odbc/releases

Vladislav
07.06.2017
13:14:32
Alex
07.06.2017
13:15:59
Добавил презентацию с РИТ++: https://github.com/yandex/clickhouse-presentations/tree/master/rit2017

Для опытных пользователей нового мало, но есть красивые схемки

Vladislav
07.06.2017
13:18:03
Combot
07.06.2017
13:52:19
combot.org/chat/-1001080295593

Тефтеля
07.06.2017
14:08:15
Ребят, подскажите, пожалуйста, где почитать как развернуть свой tabix proxy

Александр
07.06.2017
14:09:45
Добавил презентацию с РИТ++: https://github.com/yandex/clickhouse-presentations/tree/master/rit2017
Запостил issue в гитхаб по поводу бага с которым я столкнулся https://github.com/yandex/ClickHouse/issues/859

Alex
07.06.2017
14:10:27
Всё-таки не блоки, а столбцы :)

Если бы ещё и строки выкидывались, это гораздо серьёзнее баг

Тефтеля
07.06.2017
14:12:17
https://tabix.io/doc/Install/
клиент - tabix - ch без прямого коннекта к ch не работает

Evgenii
07.06.2017
14:12:50
вкладка tabix.server интересует

в данном клиенте. Она работает через tabix.proxy

а доков по нему нет, не официальных, не подпольных. Ни кто не задавался вопросом? Чтобы не открывать порты clickhouse наружу

Igor
07.06.2017
14:16:33
Tabix.Server - это закрытая пока разработка, она не в паблике и сильно не доделана Если нужно прикрыть СH могу посоветовать nginx в котором proxypass на ch. но сам такое не использовал еще

Dmitrii
07.06.2017
14:26:22
у нас такое используется примерно так

location /api/v666 { proxy_pass http://localhost:8123; proxy_redirect off; proxy_set_header Host $host; proxy_set_header Authorization "Basic tralala"; }

Google
Тефтеля
07.06.2017
14:39:08
tabix на location можно посадить или обязательно с отдельным server_name?

Igor
07.06.2017
14:40:48
нужно пробовать, я использую ui.tabix.io )

Vladimir
07.06.2017
14:41:29
tabix на location можно посадить или обязательно с отдельным server_name?
Без разницы. Главное скопировать с архива папку с сайтом tabix. Там все достаточно просто

Александр
07.06.2017
14:48:18
Вывалил на github клиент для CH на PHP. https://github.com/the-tinderbox/ClickhouseClient

Pavel
07.06.2017
14:53:50
тру!

Александр
07.06.2017
14:58:32
Планировал сегодня выложить билдер запросов в CH для Laravel/Lumen, но к сожалению нам не удалось завершить его сегодня. Полагаю до конца недели мы с ним закончим и выложу на гитхаб.

Страница 162 из 723