@ru_devops

« Назад

Страница 957 из 999

Далее »

ptchol

13.09.2018
09:53:38

Все так и есть

Он синг тред. Не просто один процесс, а прям и один поток

И как бы редис как бд так се затея

Alex

13.09.2018
09:54:46

ну мне надо быстро отдавать данные за последние два месяца.... и очень важно скорость работы

Google

Alex

13.09.2018
09:54:55

объем данных не очень большой.

оперативы хватает.

Bogdan (SirEdvin)

13.09.2018
09:55:58

Это называется кеш, но данные лучше еще где-то хранить

Alex

13.09.2018
09:56:17

ну я думал данные хранить в тех файлах, которые редис сам и создает

Sergey

13.09.2018
09:57:08

Рассматривай redis как memcached.

Bogdan (SirEdvin)

13.09.2018
09:57:54

ну я думал данные хранить в тех файлах, которые редис сам и создает

Как только все бд не влезет в память (а такое таки когда-то наступит), то будет печально

А так редис можно масштабировать на чтение слейвами

Artem

13.09.2018
09:58:18

кассандру в руки ?

ptchol

13.09.2018
09:58:23

Лучше данные хранить все таки надёжно и персистентно в какой то бд, и хранить там столько месяцев сколько нужно. И сделать некий тулинг, который будет наполнять редис нужными данными из той бд, тоесть подогревать их

Bogdan (SirEdvin)

13.09.2018
09:58:44

+1 к идеи выше

Artem

13.09.2018
09:58:46

Редис однопоточен, кстати - если память позволяет, ребята часто поднимают несколько редисов прямо на одном серваке, как раз с репликацией

ptchol

13.09.2018
10:00:03

Редис однопоточен, кстати - если память позволяет, ребята часто поднимают несколько редисов прямо на одном серваке, как раз с репликацией

Это скейлит чтение путем дублирования данных в памяти. Такое се.

Artem

13.09.2018
10:00:14

такое, но очень быстрое)

Google

Sergey

13.09.2018
10:00:23

Лучше данные хранить все таки надёжно и персистентно в какой то бд, и хранить там столько месяцев сколько нужно. И сделать некий тулинг, который будет наполнять редис нужными данными из той бд, тоесть подогревать их

А нужен ли для этого тул? Ну в том плане что делаешь insert в бд и сразу же в редис данные добавляешь? Прогревать только при рестарте редиса надо будет.

Sergey

13.09.2018
10:00:38

Лучше данные хранить все таки надёжно и персистентно в какой то бд, и хранить там столько месяцев сколько нужно. И сделать некий тулинг, который будет наполнять редис нужными данными из той бд, тоесть подогревать их

+100500 редис - in-memory кэш для "горячих" данных, которые есть где-то ещё и которые не жалко про... протерять, в общем.

ptchol

13.09.2018
10:00:54

А нужен ли для этого тул? Ну в том плане что делаешь insert в бд и сразу же в редис данные добавляешь? Прогревать только при рестарте редиса надо будет.

Это все равно тулинг, пусть и встроенный в ваш код )

Я скорее подразумевал что какой то функционал, который наполняет редис, где он будет вопрос третий

Alex

13.09.2018
10:10:00

а что посоветуете из многопотомчного?

Sergey

13.09.2018
10:10:53

бд, которую ты знаешь?

Alex

13.09.2018
10:11:16

ты про кликхаус?

или я не понял вопроса)

по факту готов разобраться в любой БД. думал может есть какая-то класика

надо часто писать и и редко, Но сложно читать

Vladimir

13.09.2018
10:34:14

Вопрос в том как надо читать

И как писатт

Апдейты, делиты

Alex

13.09.2018
10:35:09

никаких апдейтов и деликтов

только инсерт и селект

по сути это статистика

пишем часто, читаем по запросу

Vladimir

13.09.2018
10:36:37

ты про кликхаус?

Ну тогда он выглядит нормально, как раз под статистику и аналитику

Alex

13.09.2018
10:37:41

так хотелось ченить оперативного.... чтобы диск не сильно юзать. кх на сколько я понимаю - только диск и процессор.

оператива на скорость не влияет.

Google

Alex

13.09.2018
10:38:02

она нужна - много - но не влияет.

Vladimir

13.09.2018
10:38:18

так хотелось ченить оперативного.... чтобы диск не сильно юзать. кх на сколько я понимаю - только диск и процессор.

Дисковый кэш тебя несколько спасет)

Alex

13.09.2018
11:11:10

касандра смотрится по очень неплохо по одной из записей конфы

Magistr

13.09.2018
11:14:03

так хотелось ченить оперативного.... чтобы диск не сильно юзать. кх на сколько я понимаю - только диск и процессор.

посмотри аэроспайк правда он счас платным стал

Alex

13.09.2018
11:14:13

платный сразу нет:(

Magistr

13.09.2018
11:14:15

ну или кх тоже подходит

Alex

13.09.2018
11:14:36

интересно, что б ыстрей кх или касандра

если брать равное количество нод... касандра читает из оперативы

кх с диска

Magistr

13.09.2018
11:15:04

что быстрей сишечка или жава

Alex

13.09.2018
11:15:21

я понимаю что вопрос такой себе

Magistr

13.09.2018
11:15:48

да и задачи они разные решают

Alex

13.09.2018
11:16:21

оператива по идее намного быстрей отдает. плюс в кх много лишнего

Хм... а кх умеет в оперативу складывать данные? ну типа кеша какого нить

Vladimir

13.09.2018
11:17:36

интересно, что б ыстрей кх или касандра

кх будет быстрее при грамотном использовании (судя по тому чт оты описал). Интереснее сравнить со сциллой

Хм... а кх умеет в оперативу складывать данные? ну типа кеша какого нить

https://clickhouse-docs.readthedocs.io/ru/latest/table_engines/memory.html

но не очень понятно зачем тебе это

кх читает довольно шустро, я бы на твоем месте сначала бы проверил как он работает на твоих данных, а потом бы уже думал как бы соптимизировать конкретные вопросы

ибо вероятно что тебя все устроит и тебе будет плевать что там диск

оператива по идее намного быстрей отдает. плюс в кх много лишнего

опиши задачу подробнее, тогда можно будет подсказать что ты понимаешь не так, что понимаешь так и сделать предположения как оно у тебя будет

Google

Vladimir

13.09.2018
11:20:03

мне просто кажется ты не понимаешь что хочешь

Alex

13.09.2018
11:20:10

у нас очень ограничена инфраструктура. у нас уже есть сервер без реплик кх. читает так себе. там конечно стоят hdd диски в raid 10

Vladimir

13.09.2018
11:20:16

и страдаешь преждевременной оптимизацией

Alex

13.09.2018
11:20:24

сейчас опишу

Admin

ERROR: S client not available

Vladimir

13.09.2018
11:20:39

у нас очень ограничена инфраструктура. у нас уже есть сервер без реплик кх. читает так себе. там конечно стоят hdd диски в raid 10

какого рода запросы? какие индексы? что значит "так себе"?

Alex

13.09.2018
11:23:31

Ко м не приходят данные из очереди. Приходит строка. паршу строку и полчаю около 10 параметров со значениями. по сути 9 из этих 10 параметров являются набором, по которому нужно хранить список 10ого параметра. Грубо говорят количество уникальных записаей этого (10ого) параметра. И в дальнейшем, чтобы можно было быстро получать кол-во уникальных записей 10ого параметра по запросу-фильтру, который может в себя включать любой из 9 параметров, что в ключе или все сразу.

думаю сложно описал)

Vladimir

13.09.2018
11:24:09

Ко м не приходят данные из очереди. Приходит строка. паршу строку и полчаю около 10 параметров со значениями. по сути 9 из этих 10 параметров являются набором, по которому нужно хранить список 10ого параметра. Грубо говорят количество уникальных записаей этого (10ого) параметра. И в дальнейшем, чтобы можно было быстро получать кол-во уникальных записей 10ого параметра по запросу-фильтру, который может в себя включать любой из 9 параметров, что в ключе или все сразу.

у тебя в ключе все 9 параметров и выборка всегда по всем 9и?

Alex

13.09.2018
11:24:30

выборка может быть по любому из них или нескольким

Vladimir

13.09.2018
11:24:31

и нужно делать какую-то математику (условный uniq() ) 10-ого в зависимости от того какие первые 9?

Alex

13.09.2018
11:24:35

что запросят по тому и фильтровать

Vladimir

13.09.2018
11:25:46

ну КХ не любит множественные индексы во первых. В смысле если у тебя есть прям типичные группы параметров которые есть всегда (или почти всегда) в where, их стоит вынести в индекс, а остальные, возможно, даже не надо перечислять. Или даже сделать 9 таблиц с разными индексами (по каждой из колонок)

это раз

во вторых вопрос как идет вставка, ну потому что КХ не любит единичные инсерты и вообще оптимизация таблиц там относительно дорогая

Alex

13.09.2018
11:27:20

вставки щас как раз решаются как делать. но вообще не пробелма сделать раз в 5 секунд закидывать агрегарированные данные

Vladimir

13.09.2018
11:27:51

вставки щас как раз решаются как делать. но вообще не пробелма сделать раз в 5 секунд закидывать агрегарированные данные

можно и сырые данные, главное помнить что кликхаусу намного прям легче работать когда у тебя 1 инсерт на 1М строк, чем когда 1М инсертов по 1 строке

и это же ускоряет чтение в том числе

и хотя бы буффер-таблица для вставок, или нативное чтение из кафки - поможет.

или чтобы писатели писали пореже

Google

Alex

13.09.2018
11:31:01

Владимир спасибо. Что касается лучше сразу много, чем много раз по одному - это вообщем-то известно). это касается почти всех баз в разумной мере. мне видимо не хватает знаний по кх. а тчо значит нативное чтение из кафки?

@Civiloid

Vladimir

13.09.2018
11:32:08

Владимир спасибо. Что касается лучше сразу много, чем много раз по одному - это вообщем-то известно). это касается почти всех баз в разумной мере. мне видимо не хватает знаний по кх. а тчо значит нативное чтение из кафки?

https://clickhouse.yandex/docs/en/single/index.html#document-table_engines/kafka

ваще @clickhouse_ru там есть и разработчик и комьюнити большое

https://clickhouse.yandex/docs/ru/single/#kafka или так

Alex

13.09.2018
11:33:14

да. я я там уже состою. просто нее уверен, что именно кх мне подходит больше всего.

Vladimir

13.09.2018
11:33:58