@hadoopusers

Страница 177 из 182
Sergey
25.10.2018
11:48:16
:DDD

Daniel
25.10.2018
11:50:13
dihydrotestosterone

Stanislav
25.10.2018
11:50:40
ну ок, тогда вопрос какое удобнее всего будет завести в авсе чтобы без геморроя
Вопрос из разряда - есть сервер, что поставить :) почему не аэроспайк?

Google
Grigory
25.10.2018
11:50:40
dihydrotestosterone
не туда поисковой запрос втсавил

Евгений
25.10.2018
11:51:48
Ват
Рили, ват? Касандра без кластера О_о

Alexey
25.10.2018
11:51:53
Вопрос из разряда - есть сервер, что поставить :) почему не аэроспайк?
а я о нём не слышал. ща посмотрю, спасибо за наводку.

KrivdaAllStars
25.10.2018
11:52:12
Ват
Ну без геморроя , создал тераформом инстансы , ансиблом все разлил и поднял через докер Кассандру

Рили, ват? Касандра без кластера О_о
А чо нет , ты переменные среды пропиши контейнеру и все

Daniel
25.10.2018
11:53:21
Думаю да
Спасибо

Евгений
25.10.2018
11:53:58
KrivdaAllStars
25.10.2018
11:53:58
Ну прост тип, а что из коробки то кластером будет проще ?

Google
KrivdaAllStars
25.10.2018
11:54:48
Аэроспайк
+, но он после скольких то над в кластре не платный разве ?

Daniel
25.10.2018
11:55:01
Может еще что то, но это то что я видел. И втф в проде на порядок меньше.

KrivdaAllStars
25.10.2018
11:55:25
Но вообще как бы сова правильно говорит :)

Daniel
25.10.2018
11:55:32
+, но он после скольких то над в кластре не платный разве ?
Свыше 6 и свыше 4 лярдов объектов на одной ноде

Старый
25.10.2018
11:56:26
Аэроспайк
он же платный

и 4 млрд обьектов я вчера тупо на тестах записал

Daniel
25.10.2018
11:57:05
он же платный
Только что написали

Daniel
25.10.2018
11:57:22
KrivdaAllStars
25.10.2018
11:57:41
Но тут несколько нод, две ноды уже 8 миллиардов

Старый
25.10.2018
11:58:02
Вы молодец
пока не очень, тк не могу совершить чудо и заставить кассандру работать не 30/1 а 120/1

Старый
25.10.2018
11:59:13
Это как ?
ну мин тема в кассандре на 30 гб данных 1 гб оперативы на ноду, иначе не будет работать компакшен при хдд

Alexey
25.10.2018
12:01:27
(кассандра мне чёт не оч, если что. в предыдущей конторе её в конце концов ритуально сожгли, потому что затрахались. но там вообще психанули, и смигрировали на BigQuery)

Старый
25.10.2018
12:02:11
(кассандра мне чёт не оч, если что. в предыдущей конторе её в конце концов ритуально сожгли, потому что затрахались. но там вообще психанули, и смигрировали на BigQuery)
у меня разрабы не захотели осваивать хадуп, и обвязки, они сложные а кассандра с примери ключами и тп им оч понравилась, и с го дружит из коробки

Andrey
25.10.2018
12:04:51
у меня разрабы не захотели осваивать хадуп, и обвязки, они сложные а кассандра с примери ключами и тп им оч понравилась, и с го дружит из коробки
все это хорошо, но проектировать схему данных для кассандры надо очень вдумчиво, расписывать какие запросы будут, иначе кина не будет. И что сложного в хадупе нашли?

Старый
25.10.2018
12:06:10
Это для всяк nosql
а для этого на ноде с кассандрой будет спарк

Google
Andrey
25.10.2018
12:06:38
Это для всяк nosql
не для всякого, например эластик

Grigory
25.10.2018
12:07:08
ладно, для всех колоночных бд

Andrey
25.10.2018
12:07:10
а для этого на ноде с кассандрой будет спарк
как будто это спасет от неоптимального чтения

Старый
25.10.2018
12:07:37
у меня получилось 150 нод с кассандра+спарк

по 30 тб

и 1,5 пб чистого пространства

Grigory
25.10.2018
12:07:57
не для всякого, например эластик
да всеравно эти миграции схем и перестроение индексов даже на эластике ниоч

Andrey
25.10.2018
12:07:57
ладно, для всех колоночных бд
кассандра не колоночная бд

Grigory
25.10.2018
12:10:19
кассандра не колоночная бд
ну да; давай не документо ориентированная; но я имел ввиду не кассандру а классические больше таблицы в своем предложении

Andrey
25.10.2018
12:12:04
для этого даже спец. термин придумали: https://en.wikipedia.org/wiki/Wide_column_store

Grigory
25.10.2018
12:12:31
ну ты прост эластик в пример привел)

Старый
25.10.2018
12:14:04
ну да; давай не документо ориентированная; но я имел ввиду не кассандру а классические больше таблицы в своем предложении
мне предстоит брать json и по колонкам и строкам данные распределять, а потом через спарк делать будет датасатанист выборку и графики

правда у меня в паре колонок будет более 6 млрд записей

как вот это делать переваривать, не ясно

Andrey
25.10.2018
12:15:52
ну ты прост эластик в пример привел)
я его как пример NoSQL, кстати как kv с требованием пары сотен запросов в секунду справится :)

Grigory
25.10.2018
12:16:50
да один фиг в палне индексов большие таблицы скучные

а то как он расфигачивать будет и как хранить это не аткая проблема

как угодно можн (value часть)

Andrey
25.10.2018
12:17:50
мне предстоит брать json и по колонкам и строкам данные распределять, а потом через спарк делать будет датасатанист выборку и графики
и снова вангую, что такой подход будет работать очень-очень плохо, тебе надо чтобы запросы попадали в индекс касандры, если этого не будет, будет сплошное разочарование

Grigory
25.10.2018
12:18:12
а разве у эластика не над в индекс попадать

Google
Grigory
25.10.2018
12:18:32
лексикграфические выборки то везде быстрее будут

но да вообще может те правда нужен эластик Хрыч

Andrey
25.10.2018
12:19:30
а разве у эластика не над в индекс попадать
там каждое поле может быть индексом в каком то смысле

Старый
25.10.2018
12:19:45
у меня начальство вообще думает сделать 640 гб вместо 1 тб на ноду, но если закупка будет так, то я сразу заявление напишу

Grigory
25.10.2018
12:20:11
а зачем тебе много места для тестов то

Старый
25.10.2018
12:20:21
Grigory
25.10.2018
12:20:22
взлетит если тогда наращивайте мощу

Старый
25.10.2018
12:22:19
взлетит если тогда наращивайте мощу
ну тесты у меня пройдут на 5120 голдах, 256 гб рамы и 21 обьём хдд

Старый
25.10.2018
12:32:39
много памяти на ноду
наоборот мало, разрабы кассандры говорят 30 к 1

KrivdaAllStars
25.10.2018
12:33:04
обнолвять проще будет

но я то не знаю ничего

Andrey
25.10.2018
12:33:53
наоборот мало, разрабы кассандры говорят 30 к 1
на ноду кассандры не более 32 гигов выделяй

Старый
25.10.2018
12:34:51
на ноду кассандры не более 32 гигов выделяй
????а спарк я туда как тогда раз, а во вторых ты мне писюки тогда ставить советуешь?

Grigory
25.10.2018
12:35:07
стойки рядом или в одной и все по локалке пустить

KrivdaAllStars
25.10.2018
12:35:36
прост у вас тачки оч мощные

Google
Andrey
25.10.2018
12:35:48
????а спарк я туда как тогда раз, а во вторых ты мне писюки тогда ставить советуешь?
не распарсил, почему в одной куче кассандра и спарк, они же в разных jvm будут

Grigory
25.10.2018
12:35:51
ага

а скок ядер на тачках

Старый
25.10.2018
12:35:55
стойки рядом или в одной и все по локалке пустить
ну они будут воткнуты по 40г линии из 4 портов

Grigory
25.10.2018
12:35:56
я не понял

потомучто если по 30 ядер на тачке то не так и плохо

или 60

Andrey
25.10.2018
12:36:26
спарк чем будет управляться, сам по себе, раз вы хадуп не осилили?

KrivdaAllStars
25.10.2018
12:36:29
я не понял
там к кассандре и кафке пожелание, чтобы ничего тяжелого на этой же физ ноде не было

Grigory
25.10.2018
12:36:42
главное чтоб диски выдрежали

и спу был

Старый
25.10.2018
12:36:58
а скок ядер на тачках
20 ядер на ноду физических и 40 с потоками

KrivdaAllStars
25.10.2018
12:37:06
ну спарку впринципе плохо
я про смену контекста

Страница 177 из 182