
Alexander
02.04.2018
15:45:24
alias - нет
есть такие вот, и на них судя по всему, ругань и идет
ssid │ UInt64 │ DEFAULT │ cityHash64(session_id)
в них даныне не вставляются из TabSeparated явно, но эти дефолты прописаны и в локальной, и в дистрибутед таблице
причем, такое ощущение, что работать перестало после обновления до последней версии

Denis
02.04.2018
15:50:24

Google

Alexander
02.04.2018
15:53:31
в общем, когда и в distributed, и в локальных таблицах есть одни и те же дефолты, и когда их не указываешь при инсерте - ругань. если из дистрибутед убрать неуказываемые столбцы, то все работает


?
02.04.2018
17:12:27
а кроме цепочки селектов есть возможность дубли по некоторым колонкам отфильтровать или, другими словами, делать выборки только по уникальным строкам?
пример, есть сырые данные с дублями
IP | UA |
127.0.0.1 | 123 |
127.0.0.1 | 123 |
127.0.0.1 | 123 |
127.0.0.2 | 234 |
127.0.0.2 | 234 |
127.0.0.2 | 345 |
127.0.0.2 | 345 |
надо выбирать из сгруппированных по ip+ua, в данном случае из такой таблицы
127.0.0.1 | 123 |
127.0.0.2 | 234 |
127.0.0.2 | 345 |
в чем разница: в первом случае COUNT(*) .... GROUP BY IP будет
3
4
а во втором
1
2

Wolf
02.04.2018
17:14:20
Не знаю как в кх но в SQL можно группировать по двум полям в гроупбай

?
02.04.2018
17:17:09
это вроде бы немного другой случай, если сделать GROUP BY IP, UA по первой таблице то все равно будет не 1,2, а 3,2,2
то есть мне надо по одному результату от каждой "уникальной" строки получить, и с этим уже работать

Wolf
02.04.2018
17:19:12
Не очень понял почему у вас должно получиться 1, 2

Гаврилов
02.04.2018
17:19:13
select max(ua) from table group by ip
или наоборот min

antuan
02.04.2018
17:19:30
"посчитай мне количество строк, относящихся к группе 127.0.0.1-123"
"посчитай мне количество строк, относящихся к группе 127.0.0.2-234"
"посчитай мне количество строк, относящихся к группе 127.0.0.2-345"

Гаврилов
02.04.2018
17:19:42
и это в подзапрос

antuan
02.04.2018
17:19:48
вот и получается 3, 2, 2

?
02.04.2018
17:23:33

Google

Гаврилов
02.04.2018
17:26:01
select ip,ua, count(*) from table group by ip,ua чем не подходит?
в случае он 3 2 2 и вернет
во втором 1 1 1
почему там 1,2 то должно быть?

?
02.04.2018
17:28:00
потому что там SELECT COUNT(*) ... GROUP BY IP
без UA

Гаврилов
02.04.2018
17:28:22
а нужно то сколько получить?
1,2 ?
я всеравно ничего не понял)

?
02.04.2018
17:29:38
ага, то есть мне нужно сначала выбрать уникальные по некоторым колонкам, например IP+UA, а потом уже с этой выборкой работать :)
двойным селектом то можно это все сделать, но думал есть способы отфильтровать сразу дубли

Гаврилов
02.04.2018
17:30:01
я не понял смысла
почему нельзя добавить в group by ua

?
02.04.2018
17:34:29
ну это пример синтетический, у меня таблица на сотню колонок в реальности.
потому что, если, выражаясь в терминах веб-сессий, у меня записано много хитов, а потом надо посчитать количество уникальных пользователей с IE, например, то группируя по IP, UA я все равно получу их хиты.
поэтому мне надо сначала свернуть их до уникальных пользователей, а их уже считать.

Konstantin
02.04.2018
17:37:00
можно сделать группировку по конкатенации двух полей, не?
что-то вроде select max(ip), max(ua), count(*) from table group by ip || ua;

?
02.04.2018
17:41:20
сейчас попробую, спасибо

Serge
02.04.2018
17:44:17
Друзья, всем привет
есть простая таблица вида
url_hash | value_type | value
делаю преобразование в столбцы по value_type вида
SELECT url_hash,
sumIf(value, value_type = 1) AS count_value_type_1,
sumIf(value, value_type = 2) AS count_value_type_2,
sumIf(value, value_type = 3) AS count_value_type_n
from data_raw
group by url_hash
подскажите, как подобное провернуть, когда value - это массив?

Alexey
02.04.2018
17:52:46
sumIf поменять на sumArrayIf

?
02.04.2018
17:56:17

Serge
02.04.2018
17:58:07

papa
02.04.2018
17:59:50

Google

Tima
02.04.2018
18:00:17

Denis
02.04.2018
18:03:22
Есть идеи как поискать утечки памяти в СH ?
Два тестовых сервера (1.1.54343) один clickhouse-server --daemon сожрал 60 ГБ, его реплика 30ГБ
1. VIRT 66GB RES 35GB
(сюда идет бесконечная загрузка create TinyLog , insert into TinyLog from TSV, insert into *MergeTree select from TinyLog, drop TinyLog, таблиц много (соответственно заливающих запросов тоже много), данных ТБ-ы)
2. VIRT 30GB RES 12GB
(реплика первого).
mem type: 1 / 2
Dictionaries: memory taken: 6.15 GB / 6.15 GB
PK allocated memory: 2.26 GB / 2.07 GB
PK in memory : 1.35 GB / 1.35 GB
на графике 1-го (VIRT) есть ступеньки вверх +~10GB


Nikolai
02.04.2018
18:18:34
можно посмотреть на значения метрик generic.current_allocated_bytes и generic.heap_size из system.asynchronous_metrics. heap_size должен быть близок к размеру потребляемой памяти. если current_allocated_bytes небольшой, то память просто занимается кучей для экономии
еще можно посмотреть на memory_usage таблице system.query_log. возможно, что память занимают выполняющиеся запросы

Denis
02.04.2018
18:37:51

Nikolai
02.04.2018
18:38:48
Похоже, что все нормально.
то есть мы не получили подтвержения, что утечка есть :)

Denis
02.04.2018
18:40:16

Vladimir
02.04.2018
19:50:02
Кажется мне нужно лямбда выражение, а не очень понимаю как это работает. Мне нужно подсчитать количество элементов массива, удовлетворяющих определенной регулярке, может быть есть какой-то мануал, который по полочкам у меня в голове всё расставит?

Alexey
02.04.2018
19:50:09
Опубликована презентация с Субботника по базам данных: https://clickhouse.yandex/presentations/database_saturday_2018/

Vladimir
02.04.2018
19:54:17

Беслан
02.04.2018
19:54:22
есть еще arrayExists , если подойдет булевый результат. вроде как работает шустрее

Vladimir
02.04.2018
19:57:20

Артемий
03.04.2018
05:44:48
Добрый день
Будет ли резервныый канал на случай, если телеграм закроют?

Ivan
03.04.2018
05:45:31

Артемий
03.04.2018
05:46:03
За исключением прокси, VPN и т.п.

Гаврилов
03.04.2018
05:46:17
группа в гугле есть)

Ivan
03.04.2018
06:35:02

Google

Yuri
03.04.2018
08:05:33
Добрый день!
Наткнулся на странное поведение. Есть таблица на 16 миллонов строк. Делаю запрос
SELECT count(), uniq(tr_viol_id) FROM default.simple_tmp
получаю результат 16299674 и 16285919
Делаю второй запрос
SELECT tr_viol_id FROM default.simple_tmp group by tr_viol_id having count() > 1
получаю пустой результат. Поле не ключевое. Как такое может быть?
P.S. Запрос
select count() from (
SELECT tr_viol_id FROM default.simple_tmp group by tr_viol_id)
дает 16299674

Александр
03.04.2018
08:06:18
А кто-то может подсказать как для ReplicatedReplacingMergeTree использовать новый синтаксис с партиционированием? Там просто есть колонка version

Alexey
03.04.2018
08:06:55
ну значит они всем там у вас разные не больше 1 по кол-ву, uniq считает приближенно
uniqExact точно считает

Yuri
03.04.2018
08:08:37
Спасибо

Alexey
03.04.2018
08:09:08

Александр
03.04.2018
08:09:38

Alexey
03.04.2018
08:11:07
сорян, про версию пропустил как-то

Александр
03.04.2018
08:11:40
Вижу, доку, там пишут, что вроде просто version передают после номера реплики

Kirill
03.04.2018
08:11:42
А как version указать?
ReplicatedReplacingMergeTree('/clickhouse/tables/{shard}/table_local', '{replica}', ver)

Александр
03.04.2018
08:11:51
Спасибо!


Alexander
03.04.2018
08:36:02
Всем привет!
Хочу обновить КХ. Возникает такая проблема
alexm93@alexm93-VirtualBox:~/chtest$ sudo apt-get update
Ign:1 http://repo.yandex.ru/clickhouse/xenial stable InRelease
Hit:2 http://ru.archive.ubuntu.com/ubuntu xenial InRelease
Ign:3 http://repo.yandex.ru/clickhouse/deb/stable main/ InRelease
Hit:4 http://ru.archive.ubuntu.com/ubuntu xenial-updates InRelease
Hit:5 http://ru.archive.ubuntu.com/ubuntu xenial-backports InRelease
Ign:6 http://repo.yandex.ru/clickhouse/xenial stable Release
Hit:7 http://ppa.launchpad.net/webupd8team/java/ubuntu xenial InRelease
Hit:8 http://repo.yandex.ru/clickhouse/deb/stable main/ Release
Ign:9 http://repo.yandex.ru/clickhouse/xenial stable/main amd64 Packages.diff/Index
Ign:10 http://repo.yandex.ru/clickhouse/xenial stable/main i386 Packages.diff/Index
Ign:11 http://repo.yandex.ru/clickhouse/xenial stable/main all Packages
Ign:12 http://repo.yandex.ru/clickhouse/xenial stable/main Translation-en_US
Ign:13 http://repo.yandex.ru/clickhouse/xenial stable/main Translation-en
Hit:14 http://security.ubuntu.com/ubuntu xenial-security InRelease
Ign:15 http://repo.yandex.ru/clickhouse/xenial stable/main amd64 DEP-11 Metadata
Ign:16 http://repo.yandex.ru/clickhouse/xenial stable/main DEP-11 64x64 Icons
Ign:17 http://repo.yandex.ru/clickhouse/xenial stable/main amd64 Packages
Ign:18 http://repo.yandex.ru/clickhouse/xenial stable/main i386 Packages
Ign:11 http://repo.yandex.ru/clickhouse/xenial stable/main all Packages
Ign:19 https://repo.mongodb.org/apt/ubuntu xenial/mongodb-org/3.6 InRelease
Ign:12 http://repo.yandex.ru/clickhouse/xenial stable/main Translation-en_US
Ign:13 http://repo.yandex.ru/clickhouse/xenial stable/main Translation-en
Hit:20 https://repo.mongodb.org/apt/ubuntu xenial/mongodb-org/3.6 Release
Ign:15 http://repo.yandex.ru/clickhouse/xenial stable/main amd64 DEP-11 Metadata
Ign:16 http://repo.yandex.ru/clickhouse/xenial stable/main DEP-11 64x64 Icons
Ign:17 http://repo.yandex.ru/clickhouse/xenial stable/main amd64 Packages
Ign:18 http://repo.yandex.ru/clickhouse/xenial stable/main i386 Packages
Ign:11 http://repo.yandex.ru/clickhouse/xenial stable/main all Packages
Ign:12 http://repo.yandex.ru/clickhouse/xenial stable/main Translation-en_US
Ign:13 http://repo.yandex.ru/clickhouse/xenial stable/main Translation-en
Ign:15 http://repo.yandex.ru/clickhouse/xenial stable/main amd64 DEP-11 Metadata
Ign:16 http://repo.yandex.ru/clickhouse/xenial stable/main DEP-11 64x64 Icons
Ign:17 http://repo.yandex.ru/clickhouse/xenial stable/main amd64 Packages
Ign:18 http://repo.yandex.ru/clickhouse/xenial stable/main i386 Packages
Ign:11 http://repo.yandex.ru/clickhouse/xenial stable/main all Packages
Ign:12 http://repo.yandex.ru/clickhouse/xenial stable/main Translation-en_US
Ign:13 http://repo.yandex.ru/clickhouse/xenial stable/main Translation-en
Ign:15 http://repo.yandex.ru/clickhouse/xenial stable/main amd64 DEP-11 Metadata
Ign:16 http://repo.yandex.ru/clickhouse/xenial stable/main DEP-11 64x64 Icons
Ign:17 http://repo.yandex.ru/clickhouse/xenial stable/main amd64 Packages
Ign:18 http://repo.yandex.ru/clickhouse/xenial stable/main i386 Packages
Ign:11 http://repo.yandex.ru/clickhouse/xenial stable/main all Packages
Ign:12 http://repo.yandex.ru/clickhouse/xenial stable/main Translation-en_US
Ign:13 http://repo.yandex.ru/clickhouse/xenial stable/main Translation-en
Ign:15 http://repo.yandex.ru/clickhouse/xenial stable/main amd64 DEP-11 Metadata
Ign:16 http://repo.yandex.ru/clickhouse/xenial stable/main DEP-11 64x64 Icons
Ign:17 http://repo.yandex.ru/clickhouse/xenial stable/main amd64 Packages
Ign:18 http://repo.yandex.ru/clickhouse/xenial stable/main i386 Packages
Ign:11 http://repo.yandex.ru/clickhouse/xenial stable/main all Packages
Ign:12 http://repo.yandex.ru/clickhouse/xenial stable/main Translation-en_US
Ign:13 http://repo.yandex.ru/clickhouse/xenial stable/main Translation-en
Ign:15 http://repo.yandex.ru/clickhouse/xenial stable/main amd64 DEP-11 Metadata
Ign:16 http://repo.yandex.ru/clickhouse/xenial stable/main DEP-11 64x64 Icons
Err:17 http://repo.yandex.ru/clickhouse/xenial stable/main amd64 Packages
404 Not Found [IP: 213.180.204.183 80]
Ign:18 http://repo.yandex.ru/clickhouse/xenial stable/main i386 Packages
Reading package lists... Done
W: The repository 'http://repo.yandex.ru/clickhouse/xenial stable Release' does not have a Release file.
N: Data from such a repository can't be authenticated and is therefore potentially dangerous to use.
N: See apt-secure(8) manpage for repository creation and user configuration details.
E: Failed to fetch http://repo.yandex.ru/clickhouse/xenial/dists/stable/main/binary-amd64/Packages 404 Not Found [IP: 213.180.204.183 80]
E: Some index files failed to download. They have been ignored, or old ones used instead.


Wolf
03.04.2018
08:36:48
Сто лет как сменился репо , смотрите закрепленный пост

Alexander
03.04.2018
08:36:48
использую репозиторий из https://clickhouse.yandex/#quick-start

Wolf
03.04.2018
08:37:32
даже по ссылке которую вы дали уже измененный репо

Alexander
03.04.2018
08:37:49
делаю как раз по этой интсрукции
sudo apt-key adv —keyserver keyserver.ubuntu.com —recv E0C56BD4 # optional
sudo apt-add-repository "deb http://repo.yandex.ru/clickhouse/deb/stable/ main/"
sudo apt-get update
sudo apt-get install -y clickhouse-server clickhouse-client
sudo service clickhouse-server start
clickhouse-client

Wolf
03.04.2018
08:38:22
Ну а кто старый то репо удалять будет )
Err:17 http://repo.yandex.ru/clickhouse/xenial stable/main amd64

Google

Wolf
03.04.2018
08:38:36
этол откуда у вас ?

Nata
03.04.2018
08:53:52
Привет! Подскажите пожалуйста, кто-нибудь использует Clickhouse в воркбуках Tableau через web-интерфейс tableau?

Mikle
03.04.2018
09:23:06
Всех приветствую.
Вопрос: можно ли использовать КХ для полнотекстового поиска по комментариям и постам из вк????

Konstantin
03.04.2018
09:24:43

Wolf
03.04.2018
09:24:59
не лучшая идея , все таки не тот юзкейс, вам в еластик сфинкс

Дмитрий
03.04.2018
09:27:22

Alexander
03.04.2018
09:43:48
Возникла такая же ошибка при поиске по полю типа UUID в таблицах семейства MergeTree. При запросе вылехает ошибка DB::Exception: Bad type of Field.
https://github.com/yandex/ClickHouse/issues/1770
Если кто сталкивался, скажите как решали проблему?

Mikle
03.04.2018
10:19:37
Искать по постам, комментам, инфе в профиле по ключевым словам

Гаврилов
03.04.2018
10:24:14
постгрес, разложить по вектору и повесить GIN индекс

?
03.04.2018
10:27:11
тут еще надо уточнять – какой объем данных и какие требования к отчетам

Mikle
03.04.2018
10:54:17
Объём : пользователи ~10 млн
Посты ~5 млн
Комменты~50*посты
Лайки~1000*посты
Хотел с этого начать, но не хочу чтобы это было верхней границей
Отчёты::
Текстовые поля
1) все посты с ключевыми словами (в идеале с морфологией)
Числовые и даты
1)все агрегации и джойны

prll
03.04.2018
10:58:10
в кликхаусе нет полнотекствого индекса - значит любой like %% будет читать-сравнивать слишком много данных

Гаврилов
03.04.2018
10:58:57

Mikle
03.04.2018
11:02:32
Всем спасибо, что подняли веки)))