
Danz
16.03.2018
16:32:03
Мне сейчас приходится делать http запрос, сохранять результаты во временный csv, а потом pandasом читать уже из csv

Stanislav
16.03.2018
16:33:57
Тогда pandahouse вам подойдёт

Danz
16.03.2018
16:35:16

Google

Stanislav
16.03.2018
16:35:49
ставится и подключается отдельно
Только неделю назад ещё считало, что бд - всегда default
Патч есть, если что

Михаил
16.03.2018
18:05:15
Подскажите, пожалуйста, возможно ли как-то реализовать приватный ключ по значению элемента из массива?
Необходимо чтоб при каждом запросе не искать по всей таблице развертывая регулярно через ARRAY JOIN. На тестовых данных таблица состоит из 40к записей, а при развертывания 1.4 млн записей.

GithubReleases
16.03.2018
18:59:49
yandex/ClickHouse was tagged: v1.1.54370-stable
Link: https://github.com/yandex/ClickHouse/releases/tag/v1.1.54370-stable
Release notes:
v1.1.54370-stable

Slava
16.03.2018
19:03:43

Kirill
16.03.2018
19:27:16

Slava
16.03.2018
19:27:50

molo4ko
16.03.2018
19:59:57
А разве jdbc-клиент не умеет стримить жирные ответы?

Sergey
16.03.2018
20:04:20
Хороший вопрос

Kirill
16.03.2018
20:55:31
Добавил в telegraf input плагин для ClickHouse, можно попинать PR (https://github.com/influxdata/telegraf/pull/3894), а то ребята из InfluxData могут на него подзабить если решат что оно мало кому надо )

Андрей
17.03.2018
13:21:39
Коллеги, давайте добьёмся, чтобы в графану добавили алерты для CH.
Для этого нужно, как я понимаю, чтобы плагин vertamedia добавили в апстрим, в плагины по-умолчанию. А потом уже можно будет сделать доработку для алертов (как понимаю, у vertamedia оно уже даже есть).
Я готов создать issue на добавление, но логичнее это будет сделать от имени vertamedia.

f1yegor
17.03.2018
13:39:16
?

Google

Kirill
17.03.2018
15:10:12
Может быть я что-то не так запомнил, но к 5-й версии графаны обещали что это можно сделать, в 4-й версии её нужно было пересобрать для поддержки алёртов, более точно может сказать @hagen1778. С графаной есть еще одна проблема, их очень сложно в чем-нибудь убедить, а тем более как-то подтолкнуть разработчиков

Андрей
17.03.2018
15:12:55
Про перенес движок алертов в плагины - писал я здесь давно уже (это у них в роадмапе, собственно), но пока он всё ещё в планах.
А по поводу подтолкнуть - на вид, они добавляют новые плагины, алерты для них делают, судя по issues. Может не так быстро, но тем не менее.

Kirill
17.03.2018
15:18:20
Я за, мы достаточно активно используем этот плагин, давайте issue заведем

Андрей
17.03.2018
15:21:56
Вы из Vertamedia?

Kirill
17.03.2018
15:25:22
Нет

Андрей
17.03.2018
15:27:14
Тогда предлагаю подождать, возможно, они увидят. Через некоторое время создам и подниму тему, если будет тихо.

Kirill
17.03.2018
15:29:21
Не надо надеяться на то что увидят или нет, нужно призвать разработчика плагина @hagen1778 ;)

Roman
17.03.2018
15:52:30
Поддержка алертов плагином будет означать полный перенос фронт и бэк части в репозиторий графаны, а значит и его поддержка тоже станет заботой разработчиков графаны. Текущая реализация плагина может отличаться от их стандартов и подходов (например, от реализации потсгрес плагина), что потребует внесения дополнительных изменений. В чатике "Церковь метрик" есть автор плагина для zabbix @alexanderzobnin, он входит в команду разработчиков графаны - можно еще спросить его экспертного мнения.

Vitaliy
17.03.2018
18:01:25
W: Conflicting distribution: http://repo.yandex.ru/clickhouse/deb/stable main/ Release (expected main/ but got clickhouse stable)
как можно это починить?

Вася
17.03.2018
18:08:09
Вроде адрес репозитория менялся. В закрепленном сообщении инфа.

Vitaliy
17.03.2018
18:14:42
так это новый репозиторий
на новой вм-ке

Вася
17.03.2018
18:16:52
Поиском по чату что-то находится.

Ivan
17.03.2018
18:22:41
Никак, пока репа такая универсальная будет

Vitaliy
17.03.2018
22:54:08
уничерсальную репу можна сделать без такого костыля.....

Roman
18.03.2018
02:25:10
Подскажите пожалуйста, как можно увидеть clickhouse из mssql server. Или хотя бы где в каком направлении смотреть

Вася
18.03.2018
02:38:10
В направлении ODBC драйвера.

Google

Гаврилов
18.03.2018
04:07:57

Valery
19.03.2018
00:46:22
Приветствую. Подскажите, а как часто мержатся куски в таблицах с движками MergeTree семейства? Где в конфиге это прописано?
И есть ли способ узнать, что оптимизировать больше нечего?

Maksim
19.03.2018
04:30:33

Ivan
19.03.2018
07:19:48
Добрый день,
Сталкивался ли кто с такой проблемой?
Materialized view на основе ReplicatingAggregateMergeTree c запросом на локальную таблицу ReplicateMergeTree
Вставляем данные в Buffer который смотрит на ReplicateMergeTree
Потом сравниваем погрегность по количеству евентов ReplicateMergeTree с Materialized view и внешней системой
Получается количество евентов в ReplicateMergeTree совпадает полностью с внешней системой, а вот в Materialized view не хватает примерно 3%

Tima
19.03.2018
07:28:30

Ivan
19.03.2018
07:30:27
Если упростить, то такой:
ReplicatedAggregatingMergeTree('/clickhouse/tables/{shard0}/events_agg_partition', '{replica0}')
PARTITION BY event_date
ORDER BY (install_date,
event_name)
SETTINGS index_granularity = 512
AS SELECT event_date,
event_name,
install_date,
countIfState(event_type = 'impressions') AS impressions_count
GROUP BY event_date,
event_name,
install_date

Andrey
19.03.2018
07:33:25

Danz
19.03.2018
07:36:52
Привет, бандиты, а есть документация по pandahouse?
Либо существует ли какая-то инструкция, как правильно настроить pandas для запросов из clickhouse

Gubaydullin
19.03.2018
07:58:22
Добрый день
я пытаюсь сгенерировать 1 миллион тестовых записей используя php и https://github.com/sanchezzzhak/kak-clickhouse
скрипт падает Out of memory, htop показывает, что съедено 2Гб оперативки
никто не сталкивался с подобным?
/** @var \kak\clickhouse\Connection $client */
$client = \Yii::$app->clickhouse;
$client->createCommand($this->batchInsert('hit', $data))->execute();
как я понимаю эта библиотека при выполнении команды отправляет данные курлом

Maksim
19.03.2018
08:02:17

Алексей
19.03.2018
08:02:56
У всех собирается из докера.
У меня ошибка
The repository 'https://repo.yandex.ru/clickhouse/xenial dists/stable/main/binary-amd64/ Release' does not have a Release file.
E: Failed to fetch https://repo.yandex.ru/clickhouse/xenial/dists/stable/main/binary-amd64/Packages 404 Not Found
E: Some index files failed to download. They have been ignored, or old ones used instead.
[0mThe command '/bin/sh -c apt-get update && apt-get install -yq gettext && apt clean && rm -rf /var/lib/apt/lists/* /var/cache/debconf' returned a non-zero code: 100


Stanislav
19.03.2018
08:03:10
Либо существует ли какая-то инструкция, как правильно настроить pandas для запросов из clickhouse
Минимальный скрипт:
import pandas as pd
from pandahouse import read_clickhouse
ch = {'host': 'http://clickhouse:8123', 'database': 'dbname', 'user': 'dbuser', 'password': 'dbpassword'}
QUERY = "SELECT datetime, data FROM table WHERE ... ORDER BY datetime"
df = read_clickhouse(QUERY, connection=ch, index_col='datetime')
df.plot()
pandahouse - слегка правленная, так как неправленная не даёт возможности обратиться к указанной БД (не форвардит указание БД в кликхаус)
Вот дальше я пока не продвинулся.

Gubaydullin
19.03.2018
08:03:49
php -i|grep memory_limit -> -1

Stanislav
19.03.2018
08:04:34
Хм... Упирается в 2Гб... 32 бита чтоль?

Gubaydullin
19.03.2018
08:04:54
64
кто нибудь работал с clickhouse и php?

Ilya
19.03.2018
08:05:44

Google

Гаврилов
19.03.2018
08:07:16
я 2 гига одним файлом в post запрос кидал

Gubaydullin
19.03.2018
08:07:39
при более тысячи записей в массиве
курл ругается

Гаврилов
19.03.2018
08:08:02
ну я не курлом конешно кидал

Gubaydullin
19.03.2018
08:08:21
вопрос в том почему столько оперативы он кушает

Гаврилов
19.03.2018
08:08:31
2 гига немного же

Gubaydullin
19.03.2018
08:08:39
но все же

Гаврилов
19.03.2018
08:08:44
что такое 2 гига оп в наши времена

Stanislav
19.03.2018
08:09:05
обычный лимит на недорогой вдс, если что :-)

Gubaydullin
19.03.2018
08:09:32
для скрипта который просто генерит 1 миллион записей
по тысяче записей отправляя с помощью библиотеки kak-clickhouse курлом в clickhouse

Гаврилов
19.03.2018
08:10:17
ну может тогда проблема в скрипте)

Stanislav
19.03.2018
08:10:31
Где-то что-то не освобождается.

Gubaydullin
19.03.2018
08:10:32
он элементарный

Гаврилов
19.03.2018
08:10:34
я формировал просто tsv файлы и целиком кидал

Gubaydullin
19.03.2018
08:12:14
кто-нибудь работал с библиотекой kak-clickhouse?
или с другой библиотекой написанной для php (yii2)?

Valery
19.03.2018
08:28:48

Andrey
19.03.2018
08:30:41

Tima
19.03.2018
08:30:55

Google

Valery
19.03.2018
08:33:12
Понял, спасибо

Edgars
19.03.2018
09:08:11
Всем привет, вопросы про BI тулзы наверняка уже задавались, в поиске не нашёл ответов. Есть ли в мире что-то, что работает из коробки для КХ? Редаш хорош, но вдруг альтернативы есть. Looker/Sisense не способны работать напрямую, хотя для BI смотрели на них.

Konstantin
19.03.2018
09:08:35

Andrey
19.03.2018
09:11:56

Edgars
19.03.2018
09:12:27
tableau к сожалению не вариант, про суперсет спасибо, гляну

Konstantin
19.03.2018
09:17:43

Edgars
19.03.2018
09:18:13
он же только десктопный? Я просто никогда с ним не сталкивался)

Konstantin
19.03.2018
09:19:15

Gubaydullin
19.03.2018
09:22:09
После отправки insert 1000 записей в цикле (1000 итераций) используя http интерфейс
htop показывает, что съедено 2Гб оперативки
это нормально?
не течет ли память, когда используется http интерфейс?

Andrey
19.03.2018
09:24:13

Gubaydullin
19.03.2018
09:24:19
да

Andrey
19.03.2018
09:24:55
да
Посмотрите в логи, CH скорее всего мержить пошел ваши инсерты. Лучше жирнее инсерты и меньше реквестов
ну и да, сколько данных? 2Гб как то не серьезно выглядит для CH. Не потому что он прожерливый, скорее потому что для тех обьемов для которых он предназначен это слегка маловато)

Gubaydullin
19.03.2018
09:26:03
на проде сервер с 32 Гб
это тестовый дроплет