
papa
29.12.2017
14:25:09
в сообщении выше видимо имеется в виду что к любому *MergeTree можно дописать Replicated, и получить название движка который поддерживает репликацию.

Andrey
29.12.2017
14:25:43
все *MergeTree реплицируются
Ну тогда и потестируем скорость, плюсом плюшка на будущее - репликация. Никто не спорит об оценки целесообразности репликации, но если есть возможность сделать базовое в среде которая в дальнейшем позволит перейти достаточно быстро и просто на репликацию, то некотрыми вещами можно и пожертвовать.

Alexey
29.12.2017
15:34:36
Выложено видео с последнего митапа:
https://events.yandex.ru/events/meetings/12-dec-2017/
Все 7 докладов.

Vyacheslav
29.12.2017
16:02:04
Нет, для нескольких одновременных запросов - не оптимизирует.
а можно что-то придумать? ну или может пнуть меня в нужном направлении, для графаны?
суть такая: есть дцать серверов, на каждом по дцать дисков. хочется в графане получить дашборд в котором на каждый сервер по ROW и в row некторая статистика по всем дискам одного сервера. если так сделать тупо -- то графана отправит в кликхаус дцать отдельных запросов (по каждому серверу отдельный), что очевидно более чем неэффективно и будет тормозить адски, скорее всего. меня, впрочем. устроит и двойная группировка на одном графике, если одним кликом можно будет менять сервер, но кажется графана такого не умеет.

Google

Андрей
29.12.2017
16:09:17
Графана умеет выбирать одним запросом несколько графиков. В частности, в плагине - это макрос $columns.

Vyacheslav
29.12.2017
18:53:26
я говрил про другое.

Yura
29.12.2017
18:53:29

Александр
29.12.2017
18:53:56
Аля, если дропнуть кеш в редисе, то ниче не помрет

Yura
29.12.2017
18:55:34
Ок... Т.е. "сохраняем в редисе то, без чего можем прожить, а fault tolerant сохраним еще где-нибудь"
Простите, у меня ни чем не обоснованная аллергия на редис :-(

Александр
29.12.2017
18:56:07
На самом деле у нас редис падал один раз за год ) И то...случайно натолкали больше чем он может на диск сбросить. Это больше косяк был со стороны администрирования.
Начал ругаться, что не может дампнуть снепшот и поэтому "извините, я на запись ничего не принимаю"

Alexey
29.12.2017
20:51:59
я говрил про другое.
Есть довольно большая задача на похожую тему - чтобы одни выполняющиеся запросы могли брать промежуточные результаты обработки из конвейера других запросов. Но сейчас эта задача не делается.

Vyacheslav
29.12.2017
21:03:24
тут мне кажется даже сложнее

R-omk
29.12.2017
21:51:54
@milovidov_an ping

Alexey
29.12.2017
22:04:48

Google

R-omk
29.12.2017
22:05:31

Alexey
29.12.2017
22:09:14
Вижу. Посмотрим...

Kirill
29.12.2017
23:19:58
Посмотрел видео с митапа с @alexanderzaitsev, у меня вопрос меркантильного характера: вдруг мы захотим выйти на Российский рынок консалтинга по КХ, что нас ждет, а на европейский ?

Дмитрий
30.12.2017
01:45:52
В копилку цитат Алексея: Хочу обрадовать - теперь этим не занимается никто :))
о )) Я не один тут туплю в монитор ))

Alexey
30.12.2017
01:58:56

Дмитрий
30.12.2017
02:00:10
Я так и думал, что это Вы, Алексей (тот кто в 5 утра сидит у компа)
Вот отличная фраза: Вы можете доверять нам, но не нужно это делать на 100%. В точку!

Alexander
30.12.2017
09:39:28

Andrey
30.12.2017
21:18:07
Всем предновогоднего настроения ))) Спасите, не могу мозг перевести в состояние Новогодний Релакс. Есть табличка в ней 100млн точек с gps координатами IdTochki, lon, lat. Необходимо с помощью CH создать табличку где будет поле с количеством соседей в радиусе 799 метров. Для вычесленя количества соседей для одной точки в радиусе 799метров использую запрос: select count(1) from gpstable where (pow(lon - 37.621837, 2) + pow(lat - 55.750213, 2)) < pow(180*799/(6371*1000*pi()), 2);

kamish
30.12.2017
21:37:04
в кх есть какие-то недокументированные функции для проверки координат внутри круга
поищите в истории сообщений здесь

Andrey
30.12.2017
21:44:40
не нашел к сожалению, как не искал. Повторюсь из таблички IdTochki, lon, lat надо сделать IdTochki, lon, lat, CountSosedi

f1yegor
30.12.2017
21:55:27
SELECT *
FROM system.functions
WHERE name LIKE 'point%'
ORDER BY name ASC
┌─name───────────────────┬─is_aggregate─┐
│ pointInEllipses │ 0 │
│ pointInPolygon │ 0 │
│ pointInPolygonCrossing │ 0 │
│ pointInPolygonFranklin │ 0 │
│ pointInPolygonWinding │ 0 │
└────────────────────────┴──────────────┘
@SergeyK007
чего-то я уже не соображаю, а что есть pow(180*799/(6371*1000*pi()), 2)?
я не знаю ответа на вопрос, сейчас пытаюсь сам разобраться. есть пример https://github.com/yandex/ClickHouse/blob/35215d077ee65d1ab13c0e91972679b0f7b46a63/dbms/tests/queries/0_stateless/00429_point_in_ellipses.sql

Andrey
30.12.2017
22:02:54
R = 6371 // radius of the earth in km

Google

f1yegor
30.12.2017
22:03:06
ага, уже заметил https://en.wikipedia.org/wiki/Great-circle_distance

Andrey
30.12.2017
22:03:13
https://carto.com/blog/inside/geospatial-processing-with-clickhouse/
можно конечно и на nodejs сделать, но запрос на нахождение соседей одной точки используя вышеописанные селект занимает 2 секунды (пока не оптимизировано) * 100милл и целой жизни не хватит ))

f1yegor
30.12.2017
22:09:15
а если сделать как они описывают - индекс по тайлам quadkey

Andrey
30.12.2017
22:11:14
думаю уже об этом, но понятия не имею как тайлы создать в этой табличке

f1yegor
30.12.2017
22:12:17
думаю можно найти где-то формулу расчета тайла, и потом создать новую колонку с дефаултом = этой формуле?

kamish
30.12.2017
22:12:36
да

f1yegor
30.12.2017
22:13:49
тогда потом построив индекс по тайлам можно будет находить соседей в пределах квадратной окрестности и дальше считать радиусное расстояние до соседей?

Andrey
30.12.2017
22:16:40
В принципе подходит искать количество соседей в заданном размере тайла - думаю будет существенно быстрее, не так точно конечно - но для моих задач вполне подходит

f1yegor
30.12.2017
22:16:47
возможно это конечно легче на ЯП написать, но все-равно придется строить какой-то индекс по локальности точек, иначе это O(n**2)?

Andrey
30.12.2017
22:17:21
тут вопрос не легче ))) а вопрос времени )))
400 лет как то ждать не хочется )))

f1yegor
30.12.2017
22:21:16
ну в смысле надо локальность точек примерную знать, иначе это перебор On**2
тут вроде есть математика(ссылка из начальной статьи) https://msdn.microsoft.com/en-us/library/bb259689.aspx
?

Andrey
30.12.2017
22:23:37
не силет в этом ((
задача такая - понять где находится точка. Грубо - в густонаселенной местности или в поле.

Vladimir
30.12.2017
23:35:08
Подскажите, а можно ли как-то отфильтровать элементы массива? Мне нужно оставить только элементы, которые like '%user%'
Удивительно, что кто-то сейчас онлайн :)

Google

Виталий
30.12.2017
23:36:52

Vladimir
30.12.2017
23:40:32
посмотрите в сторону функции has
Не совсме то, во первых, мне нужно на выходе получить опять же массив, но содержащий только элементы нужные элементы. А во-вторых has ищет по точному соответствию, а мне нужно по содержанию.

Alexey
30.12.2017
23:54:01

Vladimir
30.12.2017
23:55:35
arrayFilter
Спасибо большое! То, что нужно! А неизменность последовательности гарантируется?

Alexey
31.12.2017
00:00:33
Да, отфильтрованные элементы будут в том же порядке.

V
31.12.2017
14:49:35
У кого есть желание отпраздновать НГ в ресторане в центре Москвы?
Собственно, вышло так, что я остался наедине со своим пластиком и макбуком.
Если есть среди присутствующих ещё иллитка в такой же ситуации, предлагаю отпраздновать вместе.
Предполагаемое метро: Третьяковская, т.к. там всегда много жрален на любой вкус.
P.S. Нищебродов, которые не могут себе даже ресторан позволить, прошу не беспокоить. :)

Vladimir
31.12.2017
15:06:06

Егор
31.12.2017
15:07:23
Желание есть но мне до Москвы часа 4 ехать )

Сергей
31.12.2017
15:08:32
Тут люди юзают опенсорс, мы все нищеброды, короче сообщение явно не нашло целевую аудиторию

Anatoly
31.12.2017
15:09:28
мы по-нищебродски, но зато не в одиночестве. Повод задуматься)))

Anton
31.12.2017
15:10:11
Илитные проблемы))

Сергей
31.12.2017
15:11:13
Могу сдать в аренду жену, она за хорошую плату знатно испоганит Новый год)

Vladimir
31.12.2017
15:11:58
)))

Anton
31.12.2017
15:22:32
???
Дедушка мороз. Положи под ёлку апдейты в кх))

Lex
31.12.2017
15:24:45

?
31.12.2017
15:27:40
а мне понравилось, все по делу. ТЗ норм.

Trushakov
31.12.2017
15:46:47

?
31.12.2017
15:49:31
вот поэтому я и нищебро ?

Google

Sune4ka
31.12.2017
21:26:26
С новым годом!!! Ура!!!!

kamish
01.01.2018
05:05:48

Sune4ka
01.01.2018
10:30:10
Как мило☺️

molo4ko
01.01.2018
18:44:58
а как кто с датами борется при использовании JDBC?
я имею в виду, что если записать unix timestamp 0, база возвращает 0000-00-00 00:00:00, и на выхлопе jdbc получается непонятно что
на ум приходит разве что toUInt64(days), где days Date, и потом что-то с этим делать локально
мне одному кажется ™©, что система типов КХ не очень ложится на jdbc?
//inb4 jdbc отстой, а что делать.

Egor
02.01.2018
14:04:08
Коллеги, а HTTP source в dictionary не поддерживает следование 302 редиректам? Или какая то крутилка есть?

Sergey
03.01.2018
09:01:42
Добрый день! Подскажите, пожалуйста такой момент. Из документаци https://clickhouse.yandex/docs/en/table_engines/kafka.html - есть возможность publish\subscribe для kafka. Я вижу пример как читать из топика, а есть ли пример как писать в топик?

kamish
03.01.2018
14:44:06
можете посмотреть запросы или примеры среди тестов в каталоге репозитория
но если что, интеграция с кафкой сделана, ЕМНИП, сообществом, а точнее, одной зарубежной компанией, и ей, в основном, и поддерживается