@clickhouse_ru

Страница 636 из 723
Александр
25.08.2018
15:20:57
а вставка не проходит из-за каких-то случайностей или из-за неверных данных?
Могут быть битые данные (отлавливать сложно), может быть проблема с сетью, например в момент вставки что-то случилось с КХ или ООМ шлепнул процесс кторый пишет данные и пр.

Combot
26.08.2018
14:25:10
combot.org/c/-1001080295593

Igor
26.08.2018
15:01:48
Админы, добавьте терминатора в чат, плз.

@Cyberdyne_Systems_bot

Google
Igor
26.08.2018
15:02:59
Убирает ботов и пустые акки из чата

Иван
26.08.2018
17:16:24
Возможно невнимательно прочитал документацию, но как корректно создать на основе CollapsingMergeTree таблицы любую агрегирующую(например SummingMergeTree) materialised view? Т.е. возможно ли как-нибудь учесть новые строки со знаком "-1" при обновлении данных в исходной таблице. И вообще какое будет поведение у view. Если такой вопрос уже был - тките пальцем где =)

Иван
26.08.2018
18:01:43
Как я понимаю данные и для строки со знаком "+" попадут в MV и для строки со знаком "-" и для сохранения всех метрик мне строку с "-" надо заполнять отрицательными значениями замещаемой строки (сейчас я отправляю ключ + знак "-", все остальные строки default) чтобы а MV это корректно сагрегировалось. Так?

Иван
26.08.2018
18:56:26
Таблица довольно большая, но, в принципе, тоже вариант

Жека
27.08.2018
05:30:46
Может ктото обьяснить, почему при использовании any left join, меняется количесвто строк в запросе(если несколько раз запустить этот запрос)?

Wolf
27.08.2018
05:35:01
может дистрибьютед таблица и не равноценные реплики?

Dmitri
27.08.2018
07:11:14
Извините за возможный оффтоп, но, возможно, есть отдельный чат по catboost? Интересует одно из значений, которое может принимать параметр eval_metric обучаемой модели

Khabib
27.08.2018
07:18:50
Привет. В кликхаусе есть возможность использовать результаты запроса как источник для другого запроса? Мне нужен аналог WITH из Postgres'а

Denis
27.08.2018
07:19:17
несколько раз?

Wolf
27.08.2018
07:19:30
селект из селекта можно

Google
Daniel
27.08.2018
08:48:45
А можно как-то сделать, чтобы кликхаус при попытке вставить невставляемое не прекращал вставку, а скипал плохую строку и шёл дальше по файлу? Какой-нибудь механизм скипа вот таких вот ошибок Code: 27. DB::Exception: Cannot parse input: expected

Daniel
27.08.2018
09:04:15
clickhouse-client --help | grep input_format_allow_errors
Супер, звучит как то, что надо. А как считаются относительные и абсолютные числа ошибок? И что они из себя представляют. Относительное - это накопленное с какого-то момента (какого, всё время работы clickhouse-client в том числе для других вставок, или только в рамках одного вставляемого файла?), а абсолютное - накопленное с момента начала одной вставки? В общем что-то тёмный лес в описании простых на первый взгляд параметров ?

Vladimir
27.08.2018
09:05:03
думаю, это в рамках одного вызова clickhouse-client

Alexander
27.08.2018
09:06:46
Коллеги, всем привет! Подскажите, кто как добавляет в существующие таблицы новые колонки с индексами? В голове пока только создать "рядом" новую таблицу со всеми нужными полями и индексами и залить туда данные из старой таблицы. Возможно, есть какой-то более быстрый путь?

Daniel
27.08.2018
09:08:47
думаю, это в рамках одного вызова clickhouse-client
Попробуем, спасибо. А вы пользовались этим параметром? Кликхаус как-то показывает warning, когда пропускает строки при использовании input_format_allow_errors, или нет? Чтобы в конце можно было глянуть, что же он там пропустил

Alexander
27.08.2018
09:19:26
Нет, пока это единственный путь
Кирилл, большое спасибо!

Materalized View вам в помошь
Алексей, подскажите, пожалуйста – можно ли после создания MView убить родительскую таблицу?

Алексей
27.08.2018
09:21:20
Алексей, подскажите, пожалуйста – можно ли после создания MView убить родительскую таблицу?
Я предполагаю что да, можно. MV - это как триггер на вставку данных. Правда я так не делал. Кстати если вам не надо добавлять больше новые данные, то проще сделать просто еще набор таблиц с нужными индексами

Konstantin
27.08.2018
09:25:48
Все привет. Опять про ODBC + PSQL. Протестировал несколько версий КХ, простое обновление на стабильные версии. Так как в чейнжлоге вообще ничего не сказано про изменение чего либо в отношении ODBC то хочется понять куда копать. 1.1.54385 ++ 1.1.54388 ++ 1.1.54390 ++ 1.1.54394 [unixODBC]could not create SSL context: library has no ciphers 18.1.0 [unixODBC]could not create SSL context: library has no ciphers 18.4.0 ++ 18.5.1 [unixODBC]could not create SSL context: library has no ciphers 18.6.0 [unixODBC][Driver Manager]Data source name not found, and no default driver specified 18.10.3 [unixODBC][Driver Manager]Can't open lib 'psqlodbcw.so' : file not found Сама настройка ODBC не менялась. В документации сказано что может потребоваться указать прямой путь к либе psqlodbcw.so (менял в файле /etc/odbcinst.ini ). Но это не помогает, тогда вообще все падает ?

Konstantin
27.08.2018
09:44:00
library has no ciphers может, openssl не залинковался?
а что поменялось кроме версии КХ? Потом посреди версий вдруг заработало и опять отвалилось ? пока на 18.4.0 обновляюсь. Пока все хорошо.

Denis
27.08.2018
09:44:55
не знаю, я из сорсов собирал 1 раз, тоже на чём-то застрял. но потом пакеты доставил и заработало.

Konstantin
27.08.2018
09:45:42
я из сорцов не собираю, ставлю deb пакеты

Google
Pavel Tyavin
27.08.2018
10:20:35
Подскажите, а как выбрать primary key для таблицы? На что нужно обратить внимание?

Wolf
27.08.2018
10:21:15
ну это доджен быть основной критерий для ваших запросов который будет минимизировать выборку для всех остальных критериев

Pavel Tyavin
27.08.2018
10:22:33
то есть то, что я чаще всего пишу в where в запросах и ставить в primary key?

Wolf
27.08.2018
10:23:09
ну не то что чаще а то что снизит выборку минимально в среднем

Pavel Tyavin
27.08.2018
10:23:33
ок, спасибо. А порядок следования полей в композитном ключе имеет значение?

Kirill
27.08.2018
10:26:24
ок, спасибо. А порядок следования полей в композитном ключе имеет значение?
https://groups.google.com/forum/#!searchin/clickhouse/%D0%B8%D0%BD%D0%B4%D0%B5%D0%BA%D1%81%7Csort:relevance/clickhouse/eUrsP30VtSU/p4-pxgdXAgAJ

Алексей, подскажите, пожалуйста – можно ли после создания MView убить родительскую таблицу?
Можно, но лучше создавать VIEW с TO на сущствующую таблицу, чтоб проще обслуживать удалять было

Andrew
27.08.2018
11:35:30
Имеем столбец t с DateTime. Есть ли какой-нибудь простой способ получить выборку с двумя столбцам - собственно t(i), и интервал между двумя соседними строками в секундах t(i+1)-t(i)?

Andrew
27.08.2018
11:54:49
runningDifference
Не работает │ 2018-08-27 14:38:08 │ 0 │ │ 2018-08-27 14:40:07 │ 0 │ │ 2018-08-27 14:42:08 │ 0 │ │ 2018-08-27 14:44:07 │ 0 │

Stanislav
27.08.2018
11:58:48
SELECT datetime, runningDifference(datetime) FROM ( SELECT datetime FROM disk GROUP BY datetime ORDER BY datetime ASC LIMIT 10 )

У меня так работает

Alexey
27.08.2018
12:00:25
Про вопросы по catboost.

если просто вопросы на посоветоваться, то на stackoverflow. Если ошибки, то на гитхаб делать issues

Vladimir
27.08.2018
12:06:55
подскажите, что с функцией округления, вижу округление вверх, вниз, но округление в зависимости от 0.5 нет, как так?

Dmitri
27.08.2018
12:07:03
^
спасибо

Andrew
27.08.2018
12:11:52
SELECT datetime, runningDifference(datetime) FROM ( SELECT datetime FROM disk GROUP BY datetime ORDER BY datetime ASC LIMIT 10 )
Очевидно у вас другой расклад в блоках данных. runningDifference работает в пределах блока

Stanislav
27.08.2018
12:12:30
Обратите внимание - у меня два селекта и runningDifference применяется к результатам первого

Google
Denis
27.08.2018
12:12:50
Очевидно у вас другой расклад в блоках данных. runningDifference работает в пределах блока
можно сначала селект сделать, а потом из него брать дифференс - будет один блок

а вот Станислав уже опередил

Alexey
27.08.2018
12:15:18
подскажите, что с функцией округления, вижу округление вверх, вниз, но округление в зависимости от 0.5 нет, как так?
Среди trunc, ceil, round, это обычный round. https://clickhouse.yandex/docs/ru/query_language/functions/rounding_functions/#roundx91-n93

Alexey
27.08.2018
12:19:05
он до чётного округляет
Имеется ввиду - округление вверх в случае 0.5? Такого нет.

Dmitry
27.08.2018
13:02:35
по каким причинам может не происходить ALTER TABLE ... FREEZE PARTITION? в system.parts партиции для нее есть, данные в таблице тоже, но после FREEZE в shadow/../data/database партиции для этой таблицы не появляются? во время FREEZE ошибок нет

Alexey
27.08.2018
13:22:35
Посмотрите в логе сервера всё после вашего запроса. Freezing parts with ... и ниже сообщения с тем же номером потока.

Dmitry
27.08.2018
14:01:43
Посмотрите в логе сервера всё после вашего запроса. Freezing parts with ... и ниже сообщения с тем же номером потока.
я сейчас посмотрел логи и увидел что партиции одной таблицы фризятся в $CLICKHOUSE_DIR/shadow/1, а партиции другой в $CLICKHOUSE_DIR/shadow/3 - и стало непонятно, я думал что это порядковый номер инкрементальной копии. Стало вообще неочевидно как работает freeze

я думал что фриз делает хардлинк на файл партиции, но тогда почему у меня в чистой shadow создается 15 директорий (одна копия, как я понимаю мастер - другие инкрементальные)?

Alexey
27.08.2018
14:12:44
я думал что фриз делает хардлинк на файл партиции, но тогда почему у меня в чистой shadow создается 15 директорий (одна копия, как я понимаю мастер - другие инкрементальные)?
Если я правильно помню, это - инкрементальный номер операции freeze. То есть, делаете freeze два раза - будут две директории. Также есть возможность написать FREEZE PARTITION ... WITH NAME 'name' - явно указать имя директории для бэкапа.

Konstantin
27.08.2018
14:55:53
Как отлаживать Logical Error's, которые возникают при слиянии частей через какое-то время после вставки? Пишет, например, что длина структуры в файле с длинами массива и с самим массивом не совпадает

Означает ли это, что часть данных была потеряна?

Konstantin
27.08.2018
15:08:55
Версия новая, но собирал сам

Alexey
27.08.2018
15:19:36
Версия новая, но собирал сам
Сделайте небольшой тест кейс. Потом надо проверить, если ли различия между собранной версией и версией из готового пакета.

Konstantin
27.08.2018
15:26:57
С кейсом проблема — всё пару часов на большой (для одного сервера) работает нормально, пока не начинает сыпать трейсбэки в логах

Google
Alexey
27.08.2018
15:29:19
С кейсом проблема — всё пару часов на большой (для одного сервера) работает нормально, пока не начинает сыпать трейсбэки в логах
Имеет смысл перечислить все особенности данного кейса. Типа таких: какие виды MergeTree используются; есть ли многомерные массивы...

Konstantin
27.08.2018
15:33:47
Обычный MergeTree, массивы не многомерные — двух типов, с числами и строками, кастомное паптицирование - почасовое

primary key из небольшого числа (функция от id) и большого - милисекундный таймстемп

Страница 636 из 723