@ru_devops

Страница 957 из 999
ptchol
13.09.2018
09:53:38
Все так и есть

Он синг тред. Не просто один процесс, а прям и один поток

И как бы редис как бд так се затея

Alex
13.09.2018
09:54:46
ну мне надо быстро отдавать данные за последние два месяца.... и очень важно скорость работы

Google
Alex
13.09.2018
09:54:55
объем данных не очень большой.

оперативы хватает.

Bogdan (SirEdvin)
13.09.2018
09:55:58
Это называется кеш, но данные лучше еще где-то хранить

Alex
13.09.2018
09:56:17
ну я думал данные хранить в тех файлах, которые редис сам и создает

Sergey
13.09.2018
09:57:08
Рассматривай redis как memcached.

Bogdan (SirEdvin)
13.09.2018
09:57:54
ну я думал данные хранить в тех файлах, которые редис сам и создает
Как только все бд не влезет в память (а такое таки когда-то наступит), то будет печально

А так редис можно масштабировать на чтение слейвами

Artem
13.09.2018
09:58:18
кассандру в руки ?

ptchol
13.09.2018
09:58:23
Лучше данные хранить все таки надёжно и персистентно в какой то бд, и хранить там столько месяцев сколько нужно. И сделать некий тулинг, который будет наполнять редис нужными данными из той бд, тоесть подогревать их

Bogdan (SirEdvin)
13.09.2018
09:58:44
+1 к идеи выше

Artem
13.09.2018
09:58:46
Редис однопоточен, кстати - если память позволяет, ребята часто поднимают несколько редисов прямо на одном серваке, как раз с репликацией

Artem
13.09.2018
10:00:14
такое, но очень быстрое)

Google
Sergey
13.09.2018
10:00:23
Лучше данные хранить все таки надёжно и персистентно в какой то бд, и хранить там столько месяцев сколько нужно. И сделать некий тулинг, который будет наполнять редис нужными данными из той бд, тоесть подогревать их
А нужен ли для этого тул? Ну в том плане что делаешь insert в бд и сразу же в редис данные добавляешь? Прогревать только при рестарте редиса надо будет.

ptchol
13.09.2018
10:00:54
Я скорее подразумевал что какой то функционал, который наполняет редис, где он будет вопрос третий

Alex
13.09.2018
10:10:00
а что посоветуете из многопотомчного?

Sergey
13.09.2018
10:10:53
бд, которую ты знаешь?

Alex
13.09.2018
10:11:16
ты про кликхаус?

или я не понял вопроса)

по факту готов разобраться в любой БД. думал может есть какая-то класика

надо часто писать и и редко, Но сложно читать

Vladimir
13.09.2018
10:34:14
Вопрос в том как надо читать

И как писатт

Апдейты, делиты

Alex
13.09.2018
10:35:09
никаких апдейтов и деликтов

только инсерт и селект

по сути это статистика

пишем часто, читаем по запросу

Vladimir
13.09.2018
10:36:37
ты про кликхаус?
Ну тогда он выглядит нормально, как раз под статистику и аналитику

Alex
13.09.2018
10:37:41
так хотелось ченить оперативного.... чтобы диск не сильно юзать. кх на сколько я понимаю - только диск и процессор.

оператива на скорость не влияет.

Google
Alex
13.09.2018
10:38:02
она нужна - много - но не влияет.

Alex
13.09.2018
11:11:10
касандра смотрится по очень неплохо по одной из записей конфы

Alex
13.09.2018
11:14:13
платный сразу нет:(

Magistr
13.09.2018
11:14:15
ну или кх тоже подходит

Alex
13.09.2018
11:14:36
интересно, что б ыстрей кх или касандра

если брать равное количество нод... касандра читает из оперативы

кх с диска

Magistr
13.09.2018
11:15:04
что быстрей сишечка или жава

Alex
13.09.2018
11:15:21
я понимаю что вопрос такой себе

Magistr
13.09.2018
11:15:48
да и задачи они разные решают

Alex
13.09.2018
11:16:21
оператива по идее намного быстрей отдает. плюс в кх много лишнего

Хм... а кх умеет в оперативу складывать данные? ну типа кеша какого нить

Vladimir
13.09.2018
11:17:36
интересно, что б ыстрей кх или касандра
кх будет быстрее при грамотном использовании (судя по тому чт оты описал). Интереснее сравнить со сциллой

но не очень понятно зачем тебе это

кх читает довольно шустро, я бы на твоем месте сначала бы проверил как он работает на твоих данных, а потом бы уже думал как бы соптимизировать конкретные вопросы

ибо вероятно что тебя все устроит и тебе будет плевать что там диск

оператива по идее намного быстрей отдает. плюс в кх много лишнего
опиши задачу подробнее, тогда можно будет подсказать что ты понимаешь не так, что понимаешь так и сделать предположения как оно у тебя будет

Google
Vladimir
13.09.2018
11:20:03
мне просто кажется ты не понимаешь что хочешь

Alex
13.09.2018
11:20:10
у нас очень ограничена инфраструктура. у нас уже есть сервер без реплик кх. читает так себе. там конечно стоят hdd диски в raid 10

Vladimir
13.09.2018
11:20:16
и страдаешь преждевременной оптимизацией

Alex
13.09.2018
11:20:24
сейчас опишу

Admin
ERROR: S client not available

Alex
13.09.2018
11:23:31
Ко м не приходят данные из очереди. Приходит строка. паршу строку и полчаю около 10 параметров со значениями. по сути 9 из этих 10 параметров являются набором, по которому нужно хранить список 10ого параметра. Грубо говорят количество уникальных записаей этого (10ого) параметра. И в дальнейшем, чтобы можно было быстро получать кол-во уникальных записей 10ого параметра по запросу-фильтру, который может в себя включать любой из 9 параметров, что в ключе или все сразу.

думаю сложно описал)

Alex
13.09.2018
11:24:30
выборка может быть по любому из них или нескольким

Vladimir
13.09.2018
11:24:31
и нужно делать какую-то математику (условный uniq() ) 10-ого в зависимости от того какие первые 9?

Alex
13.09.2018
11:24:35
что запросят по тому и фильтровать

Vladimir
13.09.2018
11:25:46
ну КХ не любит множественные индексы во первых. В смысле если у тебя есть прям типичные группы параметров которые есть всегда (или почти всегда) в where, их стоит вынести в индекс, а остальные, возможно, даже не надо перечислять. Или даже сделать 9 таблиц с разными индексами (по каждой из колонок)

это раз

во вторых вопрос как идет вставка, ну потому что КХ не любит единичные инсерты и вообще оптимизация таблиц там относительно дорогая

Alex
13.09.2018
11:27:20
вставки щас как раз решаются как делать. но вообще не пробелма сделать раз в 5 секунд закидывать агрегарированные данные

Vladimir
13.09.2018
11:27:51
вставки щас как раз решаются как делать. но вообще не пробелма сделать раз в 5 секунд закидывать агрегарированные данные
можно и сырые данные, главное помнить что кликхаусу намного прям легче работать когда у тебя 1 инсерт на 1М строк, чем когда 1М инсертов по 1 строке

и это же ускоряет чтение в том числе

и хотя бы буффер-таблица для вставок, или нативное чтение из кафки - поможет.

или чтобы писатели писали пореже

Google
Alex
13.09.2018
11:31:01
Владимир спасибо. Что касается лучше сразу много, чем много раз по одному - это вообщем-то известно). это касается почти всех баз в разумной мере. мне видимо не хватает знаний по кх. а тчо значит нативное чтение из кафки?

@Civiloid

Vladimir
13.09.2018
11:32:08
ваще @clickhouse_ru там есть и разработчик и комьюнити большое

https://clickhouse.yandex/docs/ru/single/#kafka или так

Alex
13.09.2018
11:33:14
да. я я там уже состою. просто нее уверен, что именно кх мне подходит больше всего.

Vladimir
13.09.2018
11:33:58
Владимир спасибо. Что касается лучше сразу много, чем много раз по одному - это вообщем-то известно). это касается почти всех баз в разумной мере. мне видимо не хватает знаний по кх. а тчо значит нативное чтение из кафки?
у КХ это просто более ярко выражено. Фактически каждый инсерт - 1 файл. Есть фоновый процесс который склеивает файлы в более жирные, но он фоновый.

файлы сортированы внутри по индексу

поэтому в КХ много мелких файлов это боль, фактически ты получаешь недосортированный данные и всякое такое.

это несколько менее больно во многих других базах просто

Terminator
13.09.2018
11:42:07
@asya_ivanova будет жить. Поприветствуем!

@dvragulin будет жить. Поприветствуем!

@Zaklad71 будет жить. Поприветствуем!

Bogdan (SirEdvin)
13.09.2018
14:17:20
Тонкая настройка балансировки нагрузки https://habr.com/post/423085/

Страница 957 из 999