@clickhouse_ru

Страница 77 из 723
Alex
28.02.2017
18:10:45
там есть описание архитектуры от Лёши и стайлгайд

Vladimir
28.02.2017
18:28:41
Ребят тыкните носом как называется словарик с композитными составным ключиком)) Коль Алексей сказал что есть.

prll
28.02.2017
18:29:26
cd dbms/tests/external_dictionaries; ./generate_and_test.py

Google
prll
28.02.2017
18:29:26
it will fail, but create files in ./generated

all *_complex_* is working configs

Vladimir
28.02.2017
18:34:24
Хм. У меня нет py) КХ в докере как бы. Issue открыть?

Igor
28.02.2017
18:39:29
> КХ в докере как бы. apt-get install python?..

Vladimir
28.02.2017
18:41:05
Угу. Плюс дистр скачать. Это нетрудно. Но хотелось бы чтоб в доках было а не танцы с бубном

Igor
28.02.2017
18:42:06
> Угу. Плюс дистр скачать. Зачем? о_О

в докер-контейнере уже убунта ведь

Vladimir
28.02.2017
18:45:15
Дистр Кх

))

Alex
28.02.2017
18:50:26
Угу. Плюс дистр скачать. Это нетрудно. Но хотелось бы чтоб в доках было а не танцы с бубном
Трудно не согласиться - открывайте issue. А лучше, конечно, pull request... ;)

Alexander
28.02.2017
18:56:56
<layout> <complex_key_hashed /> </layout> <structure> <key> <attribute> <name>uid</name> <type>UInt64</type> </attribute> <attribute> <name>order_id</name> <type>UInt32</type> </attribute> </key> <attribute> <name>has_access</name> <type>UInt8</type> <null_value>0</null_value> </attribute> </structure>

в функции доступа указываете tuple. Типы в этом случае могут быть любые

Vladimir
28.02.2017
18:58:31
? огромное спасибо.

Google
Alexander
28.02.2017
18:58:53
Можно также через этот механизм в качестве ключа использовать одну колонку с произвольным типом, то есть не обязательно UInt64

Vladimir
28.02.2017
19:00:45
Вопрос я так понимаю можно тот же String?

Alexander
28.02.2017
19:01:49
А я вопрос не понимаю :) В чем вопрос?

Vladimir
28.02.2017
19:06:58
Да просто в доке которая у Я выложена ограничение на ключи)) вот поэтому и спросил. Тем более ключи у них там только UInt были указаны

Alexander
28.02.2017
19:13:20
В механизме с обычным ключом -- тип только UInt64, если использовать сomplex_key_hashed, как в примере выше, то можно использовать любые типы, в том числе tuple из одного элемента любого типа, включая String.

Timur
28.02.2017
19:41:44
@milovidov_an А какая статистика использования кликхауса по другим городам? После мск и спб кто еще есть?

hamper ?
28.02.2017
19:46:22
Да мне кажется много где кликхаусом сейчас пользуются. Постоянно вокруг о нем все говорят.

Константин
28.02.2017
19:52:05
Латвия, Рига - собираем в КХ рекламную статистику ?

Ivan
28.02.2017
19:53:35
Литва, Вильнюс - собираем аксесс логи для аналитики

Константин
28.02.2017
19:53:36
уже 3 месяца

Ivan
28.02.2017
19:56:39
а мы разрабатываем

prll
28.02.2017
20:15:05
и производит http запрос не по домену, а по ip
https://github.com/yandex/ClickHouse/commit/5cf6f4d8c13005a12f6aed2285389b6f7a7a69e6

Andrey
28.02.2017
20:17:25
Латвия, Рига - собираем в КХ рекламную статистику ?
Я уже выше спрашивал - расскажите - как кладёте в КХ стату? на митапе даже вопрос озвучили)

hamper ?
28.02.2017
20:19:59
Мы например в отдельном приложении буферизуем в течение секунды запросы и скидываем пачками.

Но у нас просто почти реалтайм и поэтому так удобнее, а то бы кафку взяли например.

Andrey
28.02.2017
20:25:35
вот у меня кафка есть

а КХ хочу запробовать

т.к. переодически вопросы у менеджеров возникают

аналитические

Google
Andrey
28.02.2017
20:26:39
просто учитывая трафик там очень много данных будет

@p_hamper у вас тоже rtb?

hamper ?
28.02.2017
20:28:10
Понятие "очень много" у всех разное ) Для кого-то это сотни гигабайт, для кого то десятки петабайт.

Andrey
28.02.2017
20:29:01
ну да) - согласен - десятки гигов в сутки

hamper ?
28.02.2017
20:29:25
@p_hamper у вас тоже rtb?
И rtb есть (там правда только в одном проекте кх как замена инфлакса используется) и в других проетах тоже впиливаем.

Alexey
28.02.2017
20:30:17
Привет! Спасибо авторам CH за сегодняшние доклады.

Не подскажет кто, есть сравнение ClickHouse и Tarantool?

Скорость, работа с индексами и т.п.

Если нужно сложить в базу 500 млн ивентов (из десятка числовых полей и пары коротких строковых) в сутки?

Выборки по ним разнообразные, но простые нужно делать (желательно real time)

Алексей
28.02.2017
20:31:37
Это антипаттерн для кх

Alexey
28.02.2017
20:32:49
Можно поподробней?

Алексей
28.02.2017
20:33:00
Нет смысла в сравнении

Alexey
28.02.2017
20:33:25
А если забить на сравнение и подбирать просто под описанную задачу?

Алексей
28.02.2017
20:33:34
Ну на митапе прям был ответ что кх не ключ значение

Alexey
28.02.2017
20:33:35
Кого стоит выбрать и почему?

Igor
28.02.2017
20:35:45
> Alexey Если нужно сложить в базу 500 млн ивентов (из десятка числовых полей и пары коротких строковых) в сутки? Мы в складываем на порядок больше строк, потоковых в 5ти новодовый на блинах в хетзнере и еще дополнительно раскладывает этиже данные в Summing таблицы, для очень быстрой аггрегации Далее нам нужно достать быстро , минимально от времени записи, данные сжатые но по всего 20К ключам -> select ... where id IN ( local_csv_file ) Отрабатывает пулей - где в local_csv_file лежат ID полей которые нам нужно достать.

Alexey
28.02.2017
20:36:44
Т.е. однозначно за CH, так?

Ivan
28.02.2017
20:38:28
странно на канале кликхауса спрашивать кликхаус или нет

ну и кх пока не успел накосячить

Google
Alexey
28.02.2017
20:38:59
Дык я задачу обсуждаю. Подходит или нет. :)

Igor
28.02.2017
20:39:28
Т.е. однозначно за CH, так?
если мне вопрос , я попытался ответить в статье "запускаем ch срываем джекпот" на хабре)

Alexey
28.02.2017
20:40:40
https://habrahabr.ru/company/smi2/blog/314558/ Онн?

Igor
28.02.2017
20:40:50
ага

мы отказались от кассандры и infinidb ... и я стал чуточку спокойнее спать - зная что CH нормально справляется и запаса много. Лежащий ночью кластер кассандры в полном рассинхроне ... или infiniDB у которая просто теряла данные... в прошлом)) Совет: попробуйте , но подход не совсем key-value используйте

hamper ?
28.02.2017
20:49:08
есть же много нормальных kv, aerospike например, или там все же часто нужны запросы не по ключам?

nikoinlove
28.02.2017
20:50:19
А ктото известный использует его?

Мы отказались в него смотреть потому что не нашли саксесс стори:)

Igor
28.02.2017
20:51:00
aerospike не взлетел как хотелось.... тестили понравился... ооочень быстрый KV

но не помню что отпугнуло то-ли цена то-ли еще что то

Andrey
28.02.2017
20:52:01
nikoinlove
28.02.2017
20:52:18
Аэроспайк

Andrey
28.02.2017
20:52:38
половина РТБшек точно его юзают)

nikoinlove
28.02.2017
20:52:52
Мы вот ща параллельно кх и кассандру варим

Ну можно живой пример чтоб они этим хвастались?)

Andrey
28.02.2017
20:53:25
таргетикс на хабре цикл статей

https://www.google.ru/search?newwindow=1&q=targetix+site%3Ahabrahabr.ru&oq=targetix+site%3Ahabrahabr.ru&gs_l=serp.3...1344.4715.0.5047.8.8.0.0.0.0.280.849.5j2j1.8.0....0...1c.1.64.serp..0.4.572...35i39k1j30i10k1.fXjCPAE-Ezw

nikoinlove
28.02.2017
20:54:36
Увидел слова спарк и дотнет. Испугался

Andrey
28.02.2017
20:54:50
угу, у них C#

тем более они недавно расширили лицензию бесплатную

Google
Andrey
28.02.2017
20:55:27
но тут не чат Аероспайка всё же..

nikoinlove
28.02.2017
20:56:14
Норм, пусть в кх код пишут, а не болтают:)

Кроссдатацентер репликация платная, ужс

У нас денег нету

hamper ?
28.02.2017
21:25:46
Ну можно живой пример чтоб они этим хвастались?)
Мы в нескольких dmp его использовали, хотя название ничего не скажет все равно, так что особо известными не назвать, раньше пробовали кассандру (было медленновато), riak (продержался пару месяцев и сдох полностью прямо на продакшне, еле вытащили данные и перенесли все в аэроспайк срочно переписав логику) потом уже просто на аэроспайке делали, очень удобно и быстро, хотя вот минусы тоже встречаются, например у него примерно раз в 5 минут несколько запросов может подвиснуть на 1-2 секунды, из за этого график 95 персентили слегка зубчиками идет.

Вот это все еще актуально для него например http://varyous-simbir.blogspot.ru/2015/11/aerospike.html

И главное не стопать кластер аэроспайка (для этого надо как минимум все нужные неймспейсы сразу прописать), иначе он на холодном старте может около часа подниматься.

И это всего на паре террабайт данных (около пары миллиардов ключей)

Алексей
28.02.2017
22:18:54
Доброго времени суток! Подскажите, пожалуста, настроили реплику КХ, данные реплициуются, но получаем ошибку <Error> DB::StorageReplicatedMergeTree::queueTask()::<lambda(DB::StorageReplicatedMergeTree::LogEntryPtr&)>: Code: 86, e.displayText() = DB::Exception: Received error from remote server http://server:9000/?endpoint=DataPartsExchange:/clickhouse/tables/i/i/i302/replicas/fra1-01&part=20170228_20170228_1645_1645_0&shard=&compress=false. HTTP status code: 400, body: Port 9000 is for clickhouse-client program.

не очень понимаю откуда порт 9000 берется

Alex
28.02.2017
22:25:19
А что в конфиге, настройка interserver_http_port?

Алексей
28.02.2017
22:45:29
точно 9000 стоит, спасибо его нужно на 8123 поменять, я правильно понимаю?

Страница 77 из 723