@clickhouse_ru

Страница 154 из 723
Andrey
28.05.2017
13:16:16
А есть ли в ClickHouse возможность хранить в поле массивы Key => Value ?

Igor
28.05.2017
13:18:35
https://clickhouse.yandex/reference_ru.html#Функции%20для%20работы%20с%20JSON%2F только так вроде

Maksim
28.05.2017
13:25:12
можете подсказать по словарям которые через executable

указал как CSVWithNames и получаю такую ругань:

Google
Maksim
28.05.2017
13:25:28
Code: 27, e.displayText() = DB::Exception: Cannot parse input: expected , before: useragent","os_family","os_type","os_version_major","os_manufacturer","browser_family","browser_type","browser_version_major","browser_manufacturer"",,,0,,,,0,\n: Could not print diagnostic info because two last rows aren't in buffer (rare case) : (at row 1), e.what() = DB::Exception

при этом:

# echo "Lavf53.32.100" | /opt/retroview/scripts/useragents.erl dict "useragent","os.family","os.type","os.version_major","os.manufacturer","browser.family","browser.type","browser.version_major","browser.manufacturer" "Lavf53.32.100",,,0,,"mag","stb",0,"infomir"

что должен отдавать скрипт?

Andrey
28.05.2017
15:08:23
ИМХО, если планируется данные с бирж потом чистить, то ClickHouse для этого кейса не оч подходит.

Andrey
28.05.2017
15:19:57
Не всегда это возможно

Vladislav
28.05.2017
16:15:50
Всем привет. Подскажите, пожалуйста, возможно ли как-то посмотреть % сжатия данных по определенным столбцам в таблицы?

Что-то такое ощущение, что колонки типа array практически не жмутся

Alisa
28.05.2017
16:19:24
я подумал и выбрал influxdb если что?

Alexander
28.05.2017
16:22:06
а есть бд, которая для этого лучше подходит?
Конечно. Есть база заточенная под стоки - кдб. Собственно во многих банках именно она.

Google
Vladislav
28.05.2017
16:25:25
Что-то такое ощущение, что колонки типа array практически не жмутся
Нашел в system.columns, в сжатом виде в 10 раз меньше, оригинального. Но все-равно, мне кажется мало. Массивы строковые, и значения практически одинаковые(на 200м эвентов(массивов), всего 1-2к уник строковых значений, с длинной 20-25 симоволов, в массиве в среднем 40 элементов) Помню в конфигах были какие-то настройки по сжатию. Они могут помочь? или не значительно?

Maksim
28.05.2017
16:29:40
я подумал и выбрал influxdb если что?
Для поиграть сгодится

Вот незадача: cache executable наплодил зомбей, cache http жалуется на connection refused

Vladimir
28.05.2017
18:00:39
я подумал и выбрал influxdb если что?
Это оффтоп, но инфлакс не работает с мало мальски большими базами и запросами. Можешь погуглить какие в среднем проблемы с ним у людей сейчас.

Pavel
28.05.2017
18:02:44
двадцать мегабайт =)

Mikhail
28.05.2017
18:03:36
сорок мегабайт, может даже больше... может даже шестьдесят

Maksim
28.05.2017
18:08:56
может кто-нибудь посоветовать, как отладить ситуацию с тем, что кликхаус говорит, что не может подключиться при исполнении запроса, в котором участвует доступ к http dictionary?

Igor
28.05.2017
18:10:27
tcpdump/wireshark?

Igor
28.05.2017
18:17:45
я подумал и выбрал influxdb если что?
я думал он уже умер давно))) база теряющая данные...

Алексей
28.05.2017
18:21:16
я думал он уже умер давно))) база теряющая данные...
ой. а есть прувы ? если не против давайте на эту тему в @metrics_ru тут не релевантно.

@the_real_jkee 700! поздравляю.

Виктор
28.05.2017
18:23:10
Ага, уже 700. Всех поздравляю!

Pavel
28.05.2017
18:27:31
Ура!)

Maksim
28.05.2017
19:26:03
tcpdump/wireshark?
помог strace. Я прописал 127.0.0.1, а коннект идет к [::1]

papa
28.05.2017
19:58:22
А есть ли в ClickHouse возможность хранить в поле массивы Key => Value ?
можно хранить Nested с массивами Keys и Values, для некоторых задач подходит.

f1yegor
28.05.2017
22:07:46
data_compressed_bytes─┬─data_uncompressed_bytes

select table, name, data_uncompressed_bytes * 1.0 / data_compressed_bytes AS c from system.columns where data_compressed_bytes > 0 order by c desc ;

Maksim
29.05.2017
06:11:50
так, насчёт словарей такие замечания:

Google
Maksim
29.05.2017
06:12:03
1) во-первых в http источник КХ засовывает несколько раз один и тот же ключ

2) во-вторых какая-то проблема с превращением 127.0.0.1 в [::1]

3) следующее — не очень понятно какой был рассчетный паттерн использования executable: запускается на очень маленькое количество ключей и часто дохнет. Хорошо бы поднимать процесс и долго его кормить

Igor
29.05.2017
06:15:39
^ насчет ipv4/ipv6 недавно обсуждали может с этим как-то связано

Maksim
29.05.2017
06:17:36
у меня софтина не слушает на ipv6

Igor
29.05.2017
06:18:11
а в конфиге КХ какой интерфейс на прослушивание указан?

если [::1], попробуйте на 127.0.0.1 поменять

Igor
29.05.2017
06:24:09
обновил tabix, fix'ы и новые фичи https://tabix.io/doc/Changelog/#2017-05-29

Maksim
29.05.2017
06:24:37
Igor
29.05.2017
06:25:15
<listen_host>::</listen_host>
ага, поможет, если 127.0.0.1 будет?

Maksim
29.05.2017
06:25:45
я пока сделал по-другому: я дал не 127.0.0.1, а внешний хостнейм, который разрезолвился в ipv4

а с dictionary и кешем ещё вопрос в том, что вот как бы так сделать, что бы кеш можно было сделать персистентным, т.е. хорошо бы что бы был файл, а если ключа нет в файле, тогда идти за executable к http серверу

Pavel
29.05.2017
10:48:41
Received exception from server: Code: 359. DB::Exception: Received from localhost:9000, 127.0.0.1. DB::Exception: Table fastnetmon.host_metrics was not dropped. Reason: 1. Table size (57.24 GB) is greater than max_table_size_to_drop (50.00 GB) 2. File '/var/lib/clickhouse/flags/force_drop_table' intedned to force DROP doesn't exist How to fix this: 1. Either increase (or set to zero) max_table_size_to_drop in server config and restart ClickHouse 2. Either create forcing file /var/lib/clickhouse/flags/force_drop_table and make sure that ClickHouse has write permission for it. Example: sudo touch '/var/lib/clickhouse/flags/force_drop_table' && sudo chmod 666 '/var/lib/clickhouse/flags/force_drop_table'. 0 rows in set. Elapsed: 0.222 sec.

занятная защита :)

Igor
29.05.2017
10:50:23
тоже недавно наткнулся, офигел

ну, можно по партишенам удалять

Pavel
29.05.2017
10:50:42
не, мне нравится)

типа данные менее 50 гигов не шибко ценны, а вот больше - не смей, мужик!)

Ivan
29.05.2017
10:58:03
Привет всем! Можно ли в CH получить табличные данные на лету? Что-то вроде такого запроса в postgres: => select * from (values (1,2),(3,4)) v(a,b); a | b ---+--- 1 | 2 3 | 4 (2 rows)

Maksim
29.05.2017
11:11:50
Добрый день скажите плиз можно ли какие-то метрики с кликхаус снять для графита? может есть какая-то тулза ?

Google
Vlad
29.05.2017
11:12:28
Есть https://github.com/yandex/graphouse/

Vladimir
29.05.2017
11:13:27
если именно с кликхауса - в настройках можно указать )

Maksim
29.05.2017
11:13:41
эт про другое )
привет)) ты понял о чем я спрашиваю)

если именно с кликхауса - в настройках можно указать )
как-то снять нагрузку количество запросов и т.д. чтобы в графане мониторить. где в кликхаус искать?

Vladimir
29.05.2017
11:14:14
там не так много метрик

Maksim
29.05.2017
11:14:54
там не так много метрик
и все же. какие именно? где рыть? может я в доке упустил про это

Vladimir
29.05.2017
11:16:36
<graphite> в clickhouse-server/config.xml

там можно указать root_path (префикс метрик в графите)

host/port, interval

и 3 параметра

@maksim_melnichuk оно дампит в общем system.metrics, system.events и system.asynchronous_metrics

Maksim
29.05.2017
11:17:52
и 3 параметра
вижу. там две секции

мне только одну расскоментить и порт поменять

Vladimir
29.05.2017
11:19:57
Ага

Maksim
29.05.2017
11:22:51
Ага
спасиб

Yury
29.05.2017
11:27:57
Привет! Как на КХ лучше написать запрос, который на большой таблице фактов посчитает по выбранному измерению сумму последних (по времени) N фактов?

Maksim
29.05.2017
11:33:38
@Civiloid смотрю в графане все статы по нулям, хотя запросы идут. там две секции метрики и события

Vladimir
29.05.2017
11:34:20
@Civiloid смотрю в графане все статы по нулям, хотя запросы идут. там две секции метрики и события
я пока не дошел до мониторинга кликхауса ) пока просто играюсь

Google
Maksim
29.05.2017
11:35:09
Vladimir
29.05.2017
11:35:37
у меня есть все статы )

они правда с дырами иногда )

то есть у меня за 8 часов есть 3-4 пропущенные точки

Maksim
29.05.2017
11:36:58
у меня есть все статы )
а где можно глянуть описание по этим ключам стат? а то не совсем понятно что есть что

Vladimir
29.05.2017
11:37:04
во всех метриках одинаковые )

Maksim
29.05.2017
11:37:27
@Yandex дайте доку по метрикам )

MarkCacheBytes MarkCacheFiles вот по этим только есть. какой-то кеш

Salim
29.05.2017
13:19:08
Всем привет! Может кто подсказать, как скормить в словарик данные через АПИ проекта, отдавая JSON?

или там только tsv?

Maksim
29.05.2017
13:20:21
https://clickhouse.yandex/reference_ru.html#Форматы

CSV, TSV и куча другого

Salim
29.05.2017
13:25:12
А вниешние словари то соберутся если указать "кучу всего"?

Nikolai
29.05.2017
13:39:20
должны собраться

Страница 154 из 723