@clickhouse_ru

Страница 258 из 723
Александр
12.09.2017
10:05:07
В файле ~/.clickhouse-client-history
Супер! Спасибо! Пойду шерстить

В файле ~/.clickhouse-client-history
Нашел все что нужно! Спасибо еще раз

Google
Yurij
12.09.2017
10:43:54
Представим, что есть select ... where <условие1>. Мне нужно выполнить сразу 500 подобных запросов. Что кликхаусу не рекомендуется. Но в целом select ... where <условие1> or <условие2> ... <условие 500> меня устроит. Только я вот думаю, так нормально или этим способом КХ не обмануть.

Alexey
12.09.2017
10:45:22
не могу из ReplicatedMergeTree дропнуть партицию, на drop partition и detach partition не реагирует, партиция остается на месте, никто с таким не сталкивался?

на обеих репликах несколько раз вчера и сегодня дропал, нифига

1.1.54236

Yurij
12.09.2017
10:48:41
Алексей, вот и думаю, почитав этот чат, может заврапить репликацию через кафку, правда, пока мыслями не делятся.

Alexey
12.09.2017
10:51:17
почему-то помогло выполнить команду drop partition 5-6 раз подряд, дропнулась :\

Александр
12.09.2017
10:51:55
Что бы в запрос не толкать 500 where userId = N

А сделать where user id in temp_table

Yurij
12.09.2017
10:52:40
А сделать where user id in temp_table
Не. У меня <= в основном.

prll
12.09.2017
10:57:47
Добрый вечер. Наткнулся на непонятное поведение Enum. :) select * from Order where Rebill='yes'; SELECT * FROM Order WHERE Rebill = 'yes' Received exception from server: Code: 49. DB::Exception: Received from localhost:9000, 127.0.0.1. DB::Exception: Unknown element 'yes' for type Enum8('no' = 0, 'yes' = 1). 0 rows in set. Elapsed: 0.068 sec. :) select Rebill,Count(*) from Order group by Rebill; SELECT Rebill, Count(*) FROM Order GROUP BY Rebill ┌─Rebill─┬─Count()─┐ │ no │ 390136 │ │ yes │ 302973 │ └────────┴─────────┘ 2 rows in set. Elapsed: 0.011 sec. Processed 693.11 thousand rows, 693.11 KB (61.00 million rows/s., 61.00 MB/s.) Что может быть?
из документации: Большинство операций с числами и со строками не имеет смысла и не работают для Enum-ов: например, к Enum-у нельзя прибавить число. Для Enum-а естественным образом определяется функция toString, которая возвращает его строковое значение. кажется, что все верно, и нужно использовать toString

Google
Yurij
12.09.2017
11:37:33
А зачем делать 500 запросов за раз?
Вопрос больше не в том зачем ( мне 500 or условий даже лучше ), а как с точки зрения разработчиков субд это может повлиять на производительность, ибо для сотен запросов в секунду база не предназначена, а ситуация с or условиями весьма похожа на отдельные запросы.

Tima
12.09.2017
11:39:00
Вопрос больше не в том зачем ( мне 500 or условий даже лучше ), а как с точки зрения разработчиков субд это может повлиять на производительность, ибо для сотен запросов в секунду база не предназначена, а ситуация с or условиями весьма похожа на отдельные запросы.
Я делал один запрос с достаточно большим WHERE, порядка нескольких тысяч условий (OR и AND). Работало медлено, но всё равно сильно быстрее чем несколько сотен отдельных запросов

Oleg
12.09.2017
12:03:47
Всем привет, если я делаю запрос select a,b,c from t where .. таблица t имеет первичный ключ (a,b). то данные гаранированно буду отсортированы по a,b? т.е. смысла дописывать order by a,b нет?

Александр
12.09.2017
12:06:10
Всем привет, если я делаю запрос select a,b,c from t where .. таблица t имеет первичный ключ (a,b). то данные гаранированно буду отсортированы по a,b? т.е. смысла дописывать order by a,b нет?
Не факт. Смотря сколько блоков данных прочитается. Они всегда могут быть в случайном порядке, но внутри блока должны быть отсортированы по ключу, да.

Я с таким сталкивался уже

Когда из большой таблицы выбирал данные и например КХ читал несколько блоков данных и данные всегда были вперемешку

Возможно это применительно только к чтению из Distributed таблиц

На локальных таблицах не проверял

N
12.09.2017
12:08:41
Подскажите, пожалуйста, два шарда по две реплики. Очень редко, но бывает "part *** is lost forever". Посмотрел комментарии в исходниках. Сеть не падала, сервер не выключался и тому подобное. Интересует дальнейший механизм. Скажем, сервер написал "lost forever", допустим part-данных удалилась с реплики. Происходит какая-то проверка в дальнейшем, которая автоматически (средствами КХ) определит расхождение в данных на репликах шарда и восстановит "утраченное"? Или нужно что-то придумывать после того, как увидел подобную ошибку в логах?

N
12.09.2017
12:15:41
https://clickhouse.yandex/docs/ru/table_engines/replication.html#id3
Да, спасибо, еще раз посмотрел, но сервер продолжает работать штатно, проблем в зукипере не наблюдается, detached - пустая. Можно ли считать обнадеживающим в этом случае (циатата из мана) "Если имеются небольшие несоответствия, то система устраняет их, синхронизируя данные с реплик" ?

Petr
12.09.2017
13:10:52
Что за ошибка Expected end of line это в конце файла не хватает _eof или в конце строки?

Alexander
12.09.2017
13:12:27
не хватает '\n'

Petr
12.09.2017
13:14:09
через head вывел первые строки, переносятся строки

hulponot
12.09.2017
13:15:57
у меня так curl ругался, пока —data-binary не указал

Petr
12.09.2017
13:17:45
ну —data-binary это curl'a фишка

Google
Александр
12.09.2017
14:21:46
Что за ошибка Expected end of line это в конце файла не хватает _eof или в конце строки?
У меня такое было когда я пихал на инсерт зажатый файл, а заголовок о том, что он зажат не передавал

Petr
12.09.2017
14:23:28
Да не у меня просто csv

Александр
12.09.2017
14:23:49
Да не у меня просто csv
А формат входных данных точно указан как CSV?

Petr
12.09.2017
14:23:55
Да

Я через head 1 строку заимпортил нормально

Mike
12.09.2017
14:25:39
Получилось вылечить ? vi /usr/local/lib/python2.7/site-packages/sql/run.py изменить как на скриншоте и rm /usr/local/lib/python2.7/site-packages/sql/run.pyc потом перезапустить ipython



Andrew
12.09.2017
14:57:00
ВАУ! Спасибо, это решило проблему!! Давайте предложим тем ребятам pull request if 'mssql' not in str(conn.dialect) and 'clickhouse' not in str(conn.dialect):

Alex
12.09.2017
16:07:14
День добрый! Мощно инсертим в клик, и наблюдаем следующую картину: Load average высокий, а общее потребление не очень высокое. В htop вижу попеременно BackgrProcPool и ParalInputProc. С какими настройками поиграться, чтобы LA отбросить? Тюнятся размеры этих пулов?



Vsevolod
12.09.2017
16:09:11
в LA входит IO

(если это линукс, конечно)

Alex
12.09.2017
16:15:51
(если это линукс, конечно)
Линукс, iowait меньше процента

В iops тоже не упираемся (ssd)

nikoinlove
12.09.2017
16:19:55
а сеть ?)

Alex
12.09.2017
16:27:30
Alexey
12.09.2017
16:30:38
@milovidov_an спасибо за odbc драйвер
Хорошо, что сейчас удаётся пользоваться. Последние несколько месяцев разработкой драйвера целиком занимается Павел https://github.com/artpaul

Google
Alexey
12.09.2017
16:35:48
почему-то помогло выполнить команду drop partition 5-6 раз подряд, дропнулась :\
DROP PARTITION удаляет партицию из рабочего набора. Но в течение 8 минут она остаётся на файловой системе и в списке не active parts. После этого времени удаляется окончательно.

Alexey
12.09.2017
16:37:43
Так что приходите и приглашайте коллег, кому будет удобно!

Vsevolod
12.09.2017
16:40:36
было бы в UK...

Alexey
12.09.2017
16:41:00
было бы в UK...
А там ведь недалеко и должны быть дешёвые билеты.

Alexandr
12.09.2017
16:41:22
+1 за UK, но может заглянем и в Берлин

Alexey
12.09.2017
16:41:56
было бы в UK...
И конечно имеет смысл пригласить коллег. Можно хотя бы одного человека отправить вместо делегации :)

Vsevolod
12.09.2017
16:42:12
недалеко, но виза кончилась недавно

Alexey
12.09.2017
16:42:33
недалеко, но виза кончилась недавно
Как правило за неделю можно сделать.

Vsevolod
12.09.2017
16:42:46
а вы подаваетесь на фосдем в этом году, кстати?

Vladimir
12.09.2017
16:42:51
И конечно имеет смысл пригласить коллег. Можно хотя бы одного человека отправить вместо делегации :)
В UK нужна виза если ты по работе в ЕС и наоборот, нужен Шенген если ты работаешь в UK. Только гражданам ес хорошо

Vsevolod
12.09.2017
16:43:00
уже CFP

я сам думаю, но не знаю пока, об чем бы таком интересном расказать :)

Vladimir
12.09.2017
16:43:37
Там в прошлом году был отдельный на keynote и track

Google
Alexey
12.09.2017
16:44:11
уже CFP
У меня стоит пункт, что надо податься. Ещё ничего не продумал и не смотрел. Спасибо, что напомнили про CFP. А то в прошлый раз было довольно грустно - огромная толпа народа, а возможности по-нормальному рассказать нет.

Vladimir
12.09.2017
16:44:21
@milovidov_an а ещё на монитораму в eu открыт cfp

Vsevolod
12.09.2017
16:44:25
да, есть там такая фигня

но фосдем еще ценен кулуарным общением, как и любая конференция, впрочем

Alexey
12.09.2017
16:46:01
20 сентября - это что? Чтобы сказать - я буду делать свой devroom или чтобы вписаться в существующий?

Vladimir
12.09.2017
16:46:15
16 октября они объявят какие деврумы будут

Alexey
12.09.2017
16:46:53
До 20 сентября можно организовать деврум
Скорее всего это не вариант для нас.

Vladimir
12.09.2017
16:47:14
Скорее всего это не вариант для нас.
Вы я думаю в традиционный db devroom впишитесь

Впрочем может будет что то прям совсем тематическое

Vsevolod
12.09.2017
16:47:38
я бы подался на main track

Страница 258 из 723