
Старый
10.10.2018
18:36:49
оффтоп уже ж
а вот не совсем, у меня вон кейс как раз с этим чудом природы будет

Grigory
10.10.2018
18:37:12
ну пока 1 процесс на контейнер все нормально
какая группа сносится там?
джава в сигоуппы не влазит но это лечится костыльно да, проблема джавы

Google

Старый
10.10.2018
18:37:55
и таких 16 нод

Grigory
10.10.2018
18:38:35
ну у кубера конкретно определенные проблемы с процессами которые больше чем 10% тачки едят же
спарк нативно на кубере тоже нехотя работает; не очень предназначен пока он для этого, цели у ребят были другие видимо

Старый
10.10.2018
18:40:07
и заявляют, все уже всё давно в кубер перенесли

Grigory
10.10.2018
18:40:52
какие-то небылицы тут; оффтоп это уже потому что не докера проблемы а кубера
А чем те помогло бы руками разворачивать, что бы ты победил?

Старый
10.10.2018
18:42:18

Grigory
10.10.2018
18:42:28
а чем это тебе помогло бы
чем тут конкретно контейнеры тебе мешают то

Старый
10.10.2018
18:43:04
я мог бы от игнайта до приложения по юникс сокету отдавать данные, тем самым меньше нагружая сеть

Grigory
10.10.2018
18:43:17
а тут чо

Google

Старый
10.10.2018
18:44:00
плюс куда меньше возни с семтью

Grigory
10.10.2018
18:44:41
ну ток в начале
не меньше чем с мезосом

Старый
10.10.2018
18:53:03

Daniel
10.10.2018
18:53:33

Старый
10.10.2018
18:54:26

Grigory
10.10.2018
18:54:57
да конечно все шедулеры и менеджеры ресурсов не нужны
на самом деле даже ансибл не нужен
можно прост сшников накатать, и раскатывать

Старый
10.10.2018
18:55:45

Grigory
10.10.2018
18:56:15

Daniel
10.10.2018
18:56:16

Grigory
10.10.2018
18:56:34

Рамиль
10.10.2018
18:56:34

Grigory
10.10.2018
18:56:48
Я лучше дам сокет на эпп

Рамиль
10.10.2018
18:56:51
у меня на центосе седьмом и рхеле седьмом все работало как надо

Старый
10.10.2018
18:56:53

Daniel
10.10.2018
18:57:24

Grigory
10.10.2018
18:57:48

Google

Grigory
10.10.2018
18:57:54
я прост цитирую

Старый
10.10.2018
18:58:23

Grigory
10.10.2018
18:58:35
если по назначению используешь жизнь прекрасна же
Если нет то это твоя проблема а не технологий

Старый
10.10.2018
18:59:09

Grigory
10.10.2018
18:59:35
ну это твой личный багет просто

Oleksandr
10.10.2018
18:59:59

Daniel
10.10.2018
19:01:28

Старый
10.10.2018
19:02:51
а пересобрать зависимые пакеты, обновляя в репе что-то, эт вообще не про дебы

Daniel
10.10.2018
19:03:41
вот и остается арч

Старый
10.10.2018
19:04:17

Daniel
10.10.2018
19:05:12
с ораклом отрадясь не было проблем (если не начинать на его фс ставить), а кассандру поставить это tar -xzf?

Grigory
10.10.2018
19:05:29
хбейз тож распаковать архив

Daniel
10.10.2018
19:06:08
ну ему еще небось настройки для мастера и нод надо прописать, тыркнуть мордой в зукипер

Старый
10.10.2018
19:06:17

Grigory
10.10.2018
19:06:25
С контейнером изи будет

Daniel
10.10.2018
19:06:43

Google

Grigory
10.10.2018
19:06:52

Daniel
10.10.2018
19:07:07
нет хоста нет проблем

Grigory
10.10.2018
19:07:12
Ну я про то что разницы какая ось хбейз ставить нет
И зк
Чо там может случиться

Daniel
10.10.2018
19:07:39
с зк понятно, ток конфиг поправить, а хбейз я не ставил

Grigory
10.10.2018
19:07:50
его как хадуп ставить
ток проще
Хдфс тип имею ввиду
да или также
Путь до хдфс да зк указал
если нет хдфс то можно локально
Самая простая и неприхотливая большая таблица

Старый
10.10.2018
19:08:46
Нет хост
?а как ты потом это в кубер запихнёшь и туда же 40 нод?

Grigory
10.10.2018
19:08:47
ну для утарвлки
мы про это ж

KrivdaAllStars
10.10.2018
20:54:32

Сергей
11.10.2018
05:04:41
Доброе утро. Имеется hive на spark движке, индексированная таблица в 6млн строк в паркете. Поиск по индексированному полю одной записи занимает 20-30 секунд. Есть смысл тюнить или это норм?

Andrey
11.10.2018
05:05:30
А мощностей сколько?

Google

Сергей
11.10.2018
05:06:03

Daniel
11.10.2018
05:06:29
есть смысл переложить в json, и сделать cat | jq
ставлю что будет быстрее
на одном нежирном узле

Andrey
11.10.2018
05:07:02

Сергей
11.10.2018
05:07:09

Stanislav
11.10.2018
05:08:01

Сергей
11.10.2018
05:08:17
Пытаемся разобраться как хранить.

Daniel
11.10.2018
05:09:21
на последнем митапе спаркистов в мск был отличный доклад про паркет

Сергей
11.10.2018
05:10:04

Daniel
11.10.2018
05:10:44
https://www.youtube.com/watch?v=YuiXHAiRmf8&feature=youtu.be

Сергей
11.10.2018
05:11:18

Stanislav
11.10.2018
05:17:08
Пытаемся разобраться как хранить.
Я так понимаю, что с хранением проблем нет ) проблема с доставанием ) вся связка интересная - хайв на спарке с паркетом. Почему не хайв на тезе + орц? Да и при таких размерах, кеширующие прослойки здорово ускоряют запросы - хайв3, ллап, импала.

Сергей
11.10.2018
05:21:41
Тут тоже вопрос чем...
sqoop в паркет опробовал. В orc ещё нет.
А да, источник - оракловая базенка.

Stanislav
11.10.2018
05:29:34
Насколько я понимаю, данные считать вы собираетесь всё-таки через Спарк, а не через скл ждбц спарка?