@clickhouse_ru

Страница 149 из 723
papa
21.05.2017
19:50:00
1,0,1?

Roman
21.05.2017
19:51:20
не вернет ничего. и не должен по условию

papa
21.05.2017
19:52:29
точно, я прочитал как дату первой единицы после нуля.

Vitaliy
22.05.2017
10:40:30
Вопрос к контрибютерам репы repo.yandex.ru Хочу поднять у себя публичный mirror

Google
Pavel
22.05.2017
10:40:56
это хостнейм от mirror.yandex.ru

я думаю можно даже не зеркало, а прокси

Vitaliy
22.05.2017
10:41:18
Кому писать для доступов для rsync-a?

Pavel
22.05.2017
10:41:37
ведь проблема не с доступностью, а с блокировкой

Vitaliy
22.05.2017
10:42:21
прокся не канает

хочется раз вписать в CI пути и забыть

ну и попутно в CD

Felixoid
22.05.2017
10:52:22
Вопрос к контрибютерам репы repo.yandex.ru Хочу поднять у себя публичный mirror
я не контрибьютор, но просили передать rsync://mirror.yandex.ru/yandexrepo/

Vitaliy
22.05.2017
11:08:23
@Felixoid thanks!

кому нужно - http://mirror.jotcdn.net/yandex/clickhouse/

Felixoid
22.05.2017
11:30:47
анонсик бы куда, уверен, украинским коллегам сейчас очень актуально

Aloneibreak
22.05.2017
11:32:40
подскажите, есть ли возможность что бы КХ в запросе на COUNT() таки возвращала ноль? пустой ответ как-то не очевиден

papa
22.05.2017
11:36:04
в будущем.

Google
Vyacheslav
22.05.2017
11:39:40
Кто б еще доку по кликхаузу зазеркалил, для украиских коллег...

Vitaliy
22.05.2017
11:40:21
если дадут доступ для rsync-а - без проблем

Vyacheslav
22.05.2017
11:48:47
Спасибо!

Felixoid
22.05.2017
11:50:17
а что, https://clickhouse.yandex даже заблокировали?

Vitaliy
22.05.2017
11:51:57
вся AS13238 в блекхоле

Pavel
22.05.2017
11:52:28
жесть

Maksim
22.05.2017
12:11:55
вся AS13238 в блекхоле
Решили не морочиться с dpi :(

Andrey
22.05.2017
12:16:01
Решили не морочиться с dpi :(
ага, такой dpi для бедных))

Denys
22.05.2017
12:20:57
а зачем там dpi?

Vitaliy
22.05.2017
12:22:08
https://groups.google.com/forum/#!topic/clickhouse/HtNtQAn_OKs

Denys
22.05.2017
12:22:57
Отлично, спасибо

Pavel
22.05.2017
12:23:07
супер!

Alexander
22.05.2017
18:49:22
Всё же buffer очень небыстрый если по одной строке класть :(

Maksim
22.05.2017
19:02:31
немножко непонятно по словарям. У меня в /etc/clickhouse-server/config.xml дефолтная строчка: <dictionaries_config>*_dictionary.xml</dictionaries_config>

я создал файл /etc/clickhouse-server/hostnames_dictionary.xml который начинается с: <dictionary> <name>hostnames</name>

это правильно ?

Alexey
22.05.2017
19:05:43
Всё Ок. Можно посмотреть подгруженные словари с помощью SELECT * FROM system.dictionaries

Maksim
22.05.2017
19:09:41
вот вопрос в том: надо ли <dictionary> заворачивать внутрть <dictionaries> ?

Google
Alexey
22.05.2017
19:11:30
Надо, так как в одном файле можно объявить несколько словарей.

Maksim
22.05.2017
19:12:44
ага, вот это не очень очевидно было из документации

дальше там по select * from system.dictionaries вроде можно разобраться

Alexander
22.05.2017
19:23:02
Вопрос: можно ли общаться с КХ с помощью RowBinary но не через http?

Alexey
22.05.2017
19:23:44
Нет. Нативный интерфейс использует обмен данными только блоками как в Native формате.

Alexander
22.05.2017
19:25:26
Можно ли ожидать ускорение на порядки в сравнении с rowbinary+Post?

Alexey
22.05.2017
19:30:50
Какая скорость сейчас и что ожидаете? Только от замены RowBinary на Native разницы на порядки, скорее всего, не будет. Тем не менее, это возможно в экстремальных случаях, когда отправляете много типов фиксированной длины. Если скорость недостаточная, то, как правило, есть другие причины.

Alexander
22.05.2017
19:34:19
Я ориентируюсь на kdb, где удаётся вставить порядка 50к/с при одиночной записи. Сейчас в КХ всего около 3к (на прошлой неделе я похоже ошибся) , хотелось бы не меньше 20к.

Причина для этого - 1) хочется избавиться от внешних буферов 2) иметь данные близкие к realtime

Alexey
22.05.2017
19:36:37
На типичных данных скорость вставки должна быть от 50 000 строк в секунду до 2 000 000 строк в секунду. Минимум - на широких таблицах с сотнями столбцов. Максимум - на таблицах с несколькими столбцами.

Alexander
22.05.2017
19:37:09
Пробовал вставку в memory а не в buffer - ничего особо не меняется -> похоже горлышко где-то в http.

Alexey
22.05.2017
19:37:35
Что показывает top и perf top?

Alexey
22.05.2017
19:37:52
Блоками. По одному - вообще не вариант.

Alexander
22.05.2017
19:38:59
Ну вот тут и загвоздка. Kdb быстрее, хотя в целом всё похоже.

Я надеялся, что buffer спасёт

Alexey
22.05.2017
19:41:08
По одной строке без буфера на своей стороне можно вставлять так: - делаете POST запрос и начинаете писать данные; - не заканчиваете отправку тела пока не записали в него достаточное количество строк или пока не прошло достаточно времени. Таким образом, вы пишете по одной строке и буферизация данных происходит на стороне сервера (без использования таблиц типа Buffer). Главное - делать мало отдельных HTTP запросов.

Alexander
22.05.2017
19:42:46
Использовать сетевой буфер - понятно. Спасибо.

Но всё равно не буду оставлять попытки разогнаться. Может быть http-чанки помогут.

Alexey
22.05.2017
19:46:04
Это не совсем сетевой буфер. Данные могут сразу уходить на сервер. Но сервер формирует из них блок до max_insert_block_size.

Google
Alexander
22.05.2017
19:47:36
Может я не понимаю, а в чём потенциально замедление класть большое количество мелких строк на стороне КХ, если используется buffer. Я предполагал, что это просто сохранение в память. В kdb я делаю тоже самое. + думал что buffer позволит разогнаться даже быстрее.

Alexey
22.05.2017
20:02:01
Если на каждую строчку делается отдельный HTTP запрос с INSERT, то сложностью является обработка HTTP запроса и INSERT-а. Можно легко посмотреть в perf top, что именно тормозит. Обычно это всякий мусор типа создания временных объектов std::string, std::shared_ptr, аллокация буферов и т. п. Такие вещи, как оверхед на один запрос, вообще не оптимизировались.

Alexander
22.05.2017
20:06:45
Понял, спасибо, да, мне тоже кажется что скорее всего это и тормозит. Из-за этого и думал сбежать на нативный (не очень хочется) Или чанки.

Alexey
22.05.2017
20:15:28
Понял, спасибо, да, мне тоже кажется что скорее всего это и тормозит. Из-за этого и думал сбежать на нативный (не очень хочется) Или чанки.
В любом формате будет быстрее, если отправлять чанками, переходить на нативный не обязательно.

Alexander
22.05.2017
20:17:32
Да, ясно, спасибо. На kdb всё летает и из-за этого хочется чего-то похожего.

Andrey
22.05.2017
20:18:30
Ребят, а есть ли у кого пример создания таблицы на движке File ?

Alexander
22.05.2017
20:27:18
^^^^ Эффективная ваставка "по 1 строке" #faq
Извиняюсь, я переспрошу, так как не видел ответа - чанками это как-то можно осуществить чтобы не закрывать соединение?

Потому как при формирование такого пакета надо context-size передавать

Alexey
22.05.2017
20:28:36
Можно Transfer-Encoding: chunked

Alexander
22.05.2017
20:29:35
Т.е. он каждый чанк тогда не будет обрабатывать как запрос? Ок

Alexey
22.05.2017
20:31:09
Ребят, а есть ли у кого пример создания таблицы на движке File ?
При создании на сервере, единственный аргумент - имя формата. Пример: File(TabSeparated) Будет использоваться файл в директории таблицы. Его имя - data.TabSeparated. С другими форматами - аналогично. Для чтения готового файла, заранее подложите его в директорию таблицы. Обычно движок таблиц FIle используется для программы clickhouse-local. В этом случае ему можно передать второй параметр - произвольный путь к файлу или файловый дескриптор. Файловый дескриптор в виде 0, 1 или stdin, stdout. Пример: File(TabSeparated, stdin)

Alexey
22.05.2017
20:33:10
Схема нужна. CREATE TABLE table (схема) ENGINE = File(TabSeparated)

Andrey
22.05.2017
20:47:31
Ага, вроде понял. Завтра проверю. Большое спасибо!

Alexander
22.05.2017
21:02:58
sha_transform из kernel до 40%, даже не знаю что это.

Pavel
22.05.2017
21:03:24
а покажите perf top целиком?

sha_tranform из кернел - это оооочень странно

в ядре оно используется разве что для SYN cookie

Google
Pavel
22.05.2017
21:03:50
да и-то в последних ядрах заменили на ситихэш

Alexander
22.05.2017
21:04:15


только в таком виде пока.

Так, есть мысль, что надо обновиться.

У нас похоже для internal не самая свежая версия.

Pavel
22.05.2017
21:29:04
а это точно из ядра, а не из clickhouse?

да, похоже с ядра http://elixir.free-electrons.com/linux/latest/ident/sha_transform

загааадкааа

Alexey
22.05.2017
21:29:42
В ClickHouse не используется просто так SHA.

Alexander
22.05.2017
21:41:19
=> кидаться собрать последнюю версию смысла нет?

Let Eat
22.05.2017
21:41:57
только в таком виде пока.
там с —callgraph или как-то так можно видеть дерево вызовов

Pavel
22.05.2017
21:42:06
я бы лучше тыкнул энтер в perf top и посмотрел, откуда идет вызов этой функции

а в dmesg нет ничего в стиле "syn flood" ?

Alexander
22.05.2017
21:42:44
Pavel
22.05.2017
21:43:32
а файловая система случаем не ZFS?

Let Eat
22.05.2017
21:48:56
Alexander
22.05.2017
21:54:48


Let Eat
22.05.2017
21:55:53
ого, из /dev/urandom читает?

Pavel
22.05.2017
21:55:58
похоже на то

Страница 149 из 723