
Andrey
28.05.2017
13:16:16
А есть ли в ClickHouse возможность хранить в поле массивы Key => Value ?

Igor
28.05.2017
13:18:35
https://clickhouse.yandex/reference_ru.html#Функции%20для%20работы%20с%20JSON%2F только так вроде

Maksim
28.05.2017
13:25:12
можете подсказать по словарям которые через executable
указал как CSVWithNames и получаю такую ругань:

Google

Maksim
28.05.2017
13:25:28
Code: 27, e.displayText() = DB::Exception: Cannot parse input: expected , before: useragent","os_family","os_type","os_version_major","os_manufacturer","browser_family","browser_type","browser_version_major","browser_manufacturer"",,,0,,,,0,\n:
Could not print diagnostic info because two last rows aren't in buffer (rare case)
: (at row 1), e.what() = DB::Exception
при этом:
# echo "Lavf53.32.100" | /opt/retroview/scripts/useragents.erl dict
"useragent","os.family","os.type","os.version_major","os.manufacturer","browser.family","browser.type","browser.version_major","browser.manufacturer"
"Lavf53.32.100",,,0,,"mag","stb",0,"infomir"
что должен отдавать скрипт?

Alisa
28.05.2017
14:47:32

Andrey
28.05.2017
15:08:23
ИМХО, если планируется данные с бирж потом чистить, то ClickHouse для этого кейса не оч подходит.

Maksim
28.05.2017
15:19:41
На входе

Andrey
28.05.2017
15:19:57
Не всегда это возможно

Vladislav
28.05.2017
16:15:50
Всем привет.
Подскажите, пожалуйста, возможно ли как-то посмотреть % сжатия данных по определенным столбцам в таблицы?
Что-то такое ощущение, что колонки типа array практически не жмутся

Alisa
28.05.2017
16:19:24
я подумал и выбрал influxdb если что?

Alexander
28.05.2017
16:22:06

Google

Vladislav
28.05.2017
16:25:25
Что-то такое ощущение, что колонки типа array практически не жмутся
Нашел в system.columns, в сжатом виде в 10 раз меньше, оригинального. Но все-равно, мне кажется мало. Массивы строковые, и значения практически одинаковые(на 200м эвентов(массивов), всего 1-2к уник строковых значений, с длинной 20-25 симоволов, в массиве в среднем 40 элементов)
Помню в конфигах были какие-то настройки по сжатию. Они могут помочь? или не значительно?

Maksim
28.05.2017
16:29:40
Вот незадача: cache executable наплодил зомбей, cache http жалуется на connection refused

Vladimir
28.05.2017
18:00:39

Pavel
28.05.2017
18:02:44
двадцать мегабайт =)

Mikhail
28.05.2017
18:03:36
сорок мегабайт, может даже больше... может даже шестьдесят

Maksim
28.05.2017
18:08:56
может кто-нибудь посоветовать, как отладить ситуацию с тем, что кликхаус говорит, что не может подключиться при исполнении запроса, в котором участвует доступ к http dictionary?

Igor
28.05.2017
18:10:27
tcpdump/wireshark?

Igor
28.05.2017
18:17:45

Алексей
28.05.2017
18:21:16
@the_real_jkee 700! поздравляю.

Виктор
28.05.2017
18:23:10
Ага, уже 700. Всех поздравляю!

Pavel
28.05.2017
18:27:31
Ура!)

Maksim
28.05.2017
19:26:03

papa
28.05.2017
19:58:22

f1yegor
28.05.2017
22:07:46
data_compressed_bytes─┬─data_uncompressed_bytes
select table, name, data_uncompressed_bytes * 1.0 / data_compressed_bytes AS c from system.columns where data_compressed_bytes > 0 order by c desc ;

Maksim
29.05.2017
06:11:50
так, насчёт словарей такие замечания:

Google

Maksim
29.05.2017
06:12:03
1) во-первых в http источник КХ засовывает несколько раз один и тот же ключ
2) во-вторых какая-то проблема с превращением 127.0.0.1 в [::1]
3) следующее — не очень понятно какой был рассчетный паттерн использования executable: запускается на очень маленькое количество ключей и часто дохнет. Хорошо бы поднимать процесс и долго его кормить

Igor
29.05.2017
06:15:39
^ насчет ipv4/ipv6 недавно обсуждали
может с этим как-то связано

Maksim
29.05.2017
06:17:36
у меня софтина не слушает на ipv6

Igor
29.05.2017
06:18:11
а в конфиге КХ какой интерфейс на прослушивание указан?
если [::1], попробуйте на 127.0.0.1 поменять

Igor
29.05.2017
06:24:09
обновил tabix, fix'ы и новые фичи
https://tabix.io/doc/Changelog/#2017-05-29

Maksim
29.05.2017
06:24:37

Igor
29.05.2017
06:25:15

Maksim
29.05.2017
06:25:45
я пока сделал по-другому: я дал не 127.0.0.1, а внешний хостнейм, который разрезолвился в ipv4
а с dictionary и кешем ещё вопрос в том, что вот как бы так сделать, что бы кеш можно было сделать персистентным, т.е. хорошо бы что бы был файл, а если ключа нет в файле, тогда идти за executable к http серверу


Pavel
29.05.2017
10:48:41
Received exception from server:
Code: 359. DB::Exception: Received from localhost:9000, 127.0.0.1. DB::Exception: Table fastnetmon.host_metrics was not dropped.
Reason:
1. Table size (57.24 GB) is greater than max_table_size_to_drop (50.00 GB)
2. File '/var/lib/clickhouse/flags/force_drop_table' intedned to force DROP doesn't exist
How to fix this:
1. Either increase (or set to zero) max_table_size_to_drop in server config and restart ClickHouse
2. Either create forcing file /var/lib/clickhouse/flags/force_drop_table and make sure that ClickHouse has write permission for it.
Example:
sudo touch '/var/lib/clickhouse/flags/force_drop_table' && sudo chmod 666 '/var/lib/clickhouse/flags/force_drop_table'.
0 rows in set. Elapsed: 0.222 sec.
занятная защита :)

Igor
29.05.2017
10:50:23
тоже недавно наткнулся, офигел
ну, можно по партишенам удалять

Pavel
29.05.2017
10:50:42
не, мне нравится)
типа данные менее 50 гигов не шибко ценны, а вот больше - не смей, мужик!)

Ivan
29.05.2017
10:58:03
Привет всем! Можно ли в CH получить табличные данные на лету? Что-то вроде такого запроса в postgres:
=> select * from (values (1,2),(3,4)) v(a,b);
a | b
---+---
1 | 2
3 | 4
(2 rows)

Maksim
29.05.2017
11:11:50
Добрый день скажите плиз можно ли какие-то метрики с кликхаус снять для графита? может есть какая-то тулза ?

Google

Vlad
29.05.2017
11:12:28
Есть https://github.com/yandex/graphouse/

Vladimir
29.05.2017
11:13:27
если именно с кликхауса - в настройках можно указать )

Maksim
29.05.2017
11:13:41

Vladimir
29.05.2017
11:14:14
там не так много метрик

Maksim
29.05.2017
11:14:54

Vladimir
29.05.2017
11:16:36
<graphite> в clickhouse-server/config.xml
там можно указать root_path (префикс метрик в графите)
host/port, interval
и 3 параметра
@maksim_melnichuk оно дампит в общем system.metrics, system.events и system.asynchronous_metrics

Maksim
29.05.2017
11:17:52
мне только одну расскоментить и порт поменять

Vladimir
29.05.2017
11:19:57
Ага

Maksim
29.05.2017
11:22:51

Yury
29.05.2017
11:27:57
Привет!
Как на КХ лучше написать запрос, который на большой таблице фактов посчитает по выбранному измерению сумму последних (по времени) N фактов?

Maksim
29.05.2017
11:33:38
@Civiloid смотрю в графане все статы по нулям, хотя запросы идут. там две секции метрики и события

Vladimir
29.05.2017
11:34:20

Google

Maksim
29.05.2017
11:35:09

Vladimir
29.05.2017
11:35:37
у меня есть все статы )
они правда с дырами иногда )
то есть у меня за 8 часов есть 3-4 пропущенные точки

Maksim
29.05.2017
11:36:58

Vladimir
29.05.2017
11:37:04
во всех метриках одинаковые )

Maksim
29.05.2017
11:37:27
@Yandex дайте доку по метрикам )
MarkCacheBytes MarkCacheFiles вот по этим только есть. какой-то кеш

Salim
29.05.2017
13:19:08
Всем привет! Может кто подсказать, как скормить в словарик данные через АПИ проекта, отдавая JSON?
или там только tsv?

Maksim
29.05.2017
13:20:21
https://clickhouse.yandex/reference_ru.html#Форматы
CSV, TSV и куча другого

Salim
29.05.2017
13:25:12
А вниешние словари то соберутся если указать "кучу всего"?

Nikolai
29.05.2017
13:39:20
должны собраться