
ptchol
13.09.2018
09:53:38
Все так и есть
Он синг тред. Не просто один процесс, а прям и один поток
И как бы редис как бд так се затея

Alex
13.09.2018
09:54:46
ну мне надо быстро отдавать данные за последние два месяца.... и очень важно скорость работы

Google

Alex
13.09.2018
09:54:55
объем данных не очень большой.
оперативы хватает.

Bogdan (SirEdvin)
13.09.2018
09:55:58
Это называется кеш, но данные лучше еще где-то хранить

Alex
13.09.2018
09:56:17
ну я думал данные хранить в тех файлах, которые редис сам и создает

Sergey
13.09.2018
09:57:08
Рассматривай redis как memcached.

Bogdan (SirEdvin)
13.09.2018
09:57:54
А так редис можно масштабировать на чтение слейвами

Artem
13.09.2018
09:58:18
кассандру в руки ?

ptchol
13.09.2018
09:58:23
Лучше данные хранить все таки надёжно и персистентно в какой то бд, и хранить там столько месяцев сколько нужно. И сделать некий тулинг, который будет наполнять редис нужными данными из той бд, тоесть подогревать их

Bogdan (SirEdvin)
13.09.2018
09:58:44
+1 к идеи выше

Artem
13.09.2018
09:58:46
Редис однопоточен, кстати - если память позволяет, ребята часто поднимают несколько редисов прямо на одном серваке, как раз с репликацией

ptchol
13.09.2018
10:00:03

Artem
13.09.2018
10:00:14
такое, но очень быстрое)

Google

Sergey
13.09.2018
10:00:23

Sergey
13.09.2018
10:00:38

ptchol
13.09.2018
10:00:54
Я скорее подразумевал что какой то функционал, который наполняет редис, где он будет вопрос третий

Alex
13.09.2018
10:10:00
а что посоветуете из многопотомчного?

Sergey
13.09.2018
10:10:53
бд, которую ты знаешь?

Alex
13.09.2018
10:11:16
ты про кликхаус?
или я не понял вопроса)
по факту готов разобраться в любой БД. думал может есть какая-то класика
надо часто писать и и редко, Но сложно читать

Vladimir
13.09.2018
10:34:14
Вопрос в том как надо читать
И как писатт
Апдейты, делиты

Alex
13.09.2018
10:35:09
никаких апдейтов и деликтов
только инсерт и селект
по сути это статистика
пишем часто, читаем по запросу

Vladimir
13.09.2018
10:36:37
ты про кликхаус?
Ну тогда он выглядит нормально, как раз под статистику и аналитику

Alex
13.09.2018
10:37:41
так хотелось ченить оперативного.... чтобы диск не сильно юзать. кх на сколько я понимаю - только диск и процессор.
оператива на скорость не влияет.

Google

Alex
13.09.2018
10:38:02
она нужна - много - но не влияет.

Vladimir
13.09.2018
10:38:18

Alex
13.09.2018
11:11:10
касандра смотрится по очень неплохо по одной из записей конфы

Magistr
13.09.2018
11:14:03

Alex
13.09.2018
11:14:13
платный сразу нет:(

Magistr
13.09.2018
11:14:15
ну или кх тоже подходит

Alex
13.09.2018
11:14:36
интересно, что б ыстрей кх или касандра
если брать равное количество нод... касандра читает из оперативы
кх с диска

Magistr
13.09.2018
11:15:04
что быстрей сишечка или жава

Alex
13.09.2018
11:15:21
я понимаю что вопрос такой себе

Magistr
13.09.2018
11:15:48
да и задачи они разные решают

Alex
13.09.2018
11:16:21
оператива по идее намного быстрей отдает. плюс в кх много лишнего
Хм... а кх умеет в оперативу складывать данные? ну типа кеша какого нить

Vladimir
13.09.2018
11:17:36
но не очень понятно зачем тебе это
кх читает довольно шустро, я бы на твоем месте сначала бы проверил как он работает на твоих данных, а потом бы уже думал как бы соптимизировать конкретные вопросы
ибо вероятно что тебя все устроит и тебе будет плевать что там диск

Google

Vladimir
13.09.2018
11:20:03
мне просто кажется ты не понимаешь что хочешь

Alex
13.09.2018
11:20:10
у нас очень ограничена инфраструктура. у нас уже есть сервер без реплик кх. читает так себе. там конечно стоят hdd диски в raid 10

Vladimir
13.09.2018
11:20:16
и страдаешь преждевременной оптимизацией

Alex
13.09.2018
11:20:24
сейчас опишу

Admin
ERROR: S client not available

Vladimir
13.09.2018
11:20:39

Alex
13.09.2018
11:23:31
Ко м не приходят данные из очереди. Приходит строка. паршу строку и полчаю около 10 параметров со значениями. по сути 9 из этих 10 параметров являются набором, по которому нужно хранить список 10ого параметра. Грубо говорят количество уникальных записаей этого (10ого) параметра. И в дальнейшем, чтобы можно было быстро получать кол-во уникальных записей 10ого параметра по запросу-фильтру, который может в себя включать любой из 9 параметров, что в ключе или все сразу.
думаю сложно описал)

Vladimir
13.09.2018
11:24:09

Alex
13.09.2018
11:24:30
выборка может быть по любому из них или нескольким

Vladimir
13.09.2018
11:24:31
и нужно делать какую-то математику (условный uniq() ) 10-ого в зависимости от того какие первые 9?

Alex
13.09.2018
11:24:35
что запросят по тому и фильтровать

Vladimir
13.09.2018
11:25:46
ну КХ не любит множественные индексы во первых. В смысле если у тебя есть прям типичные группы параметров которые есть всегда (или почти всегда) в where, их стоит вынести в индекс, а остальные, возможно, даже не надо перечислять. Или даже сделать 9 таблиц с разными индексами (по каждой из колонок)
это раз
во вторых вопрос как идет вставка, ну потому что КХ не любит единичные инсерты и вообще оптимизация таблиц там относительно дорогая

Alex
13.09.2018
11:27:20
вставки щас как раз решаются как делать. но вообще не пробелма сделать раз в 5 секунд закидывать агрегарированные данные

Vladimir
13.09.2018
11:27:51
и это же ускоряет чтение в том числе
и хотя бы буффер-таблица для вставок, или нативное чтение из кафки - поможет.
или чтобы писатели писали пореже

Google

Alex
13.09.2018
11:31:01
Владимир спасибо. Что касается лучше сразу много, чем много раз по одному - это вообщем-то известно). это касается почти всех баз в разумной мере. мне видимо не хватает знаний по кх. а тчо значит нативное чтение из кафки?
@Civiloid

Vladimir
13.09.2018
11:32:08
ваще @clickhouse_ru там есть и разработчик и комьюнити большое
https://clickhouse.yandex/docs/ru/single/#kafka или так

Alex
13.09.2018
11:33:14
да. я я там уже состою. просто нее уверен, что именно кх мне подходит больше всего.

Vladimir
13.09.2018
11:33:58
файлы сортированы внутри по индексу
поэтому в КХ много мелких файлов это боль, фактически ты получаешь недосортированный данные и всякое такое.
это несколько менее больно во многих других базах просто

Terminator
13.09.2018
11:42:07
@asya_ivanova будет жить. Поприветствуем!
@dvragulin будет жить. Поприветствуем!
@Zaklad71 будет жить. Поприветствуем!

Bogdan (SirEdvin)
13.09.2018
14:17:20
Тонкая настройка балансировки нагрузки
https://habr.com/post/423085/