@hadoopusers

Страница 97 из 182
Daniel
30.04.2018
18:34:13
эм я 10 минутъ жду пока кофе в турке сварится

Artem
30.04.2018
18:34:15
у нас за хадуп в AWS $10k счет ежемесячно

в турке кофе варится за пару минут)

Daniel
30.04.2018
18:34:50
в турке кофе варится за пару минут)
терпеть не могу на сильном огне приготовленный

Google
Daniel
30.04.2018
18:35:01
так же и с хадуп сессиями

наверное

Artem
30.04.2018
18:35:02
так а разница… пенка взошла - снимай)

если ты про арабику

Евгений
30.04.2018
18:35:15
у нас было 20к$, мы их тратили два года, но это же был дипломный проект, так что от силы пару дней в месяц запускали чё-то)

на самом деле всё в локалочке, чтобы бабло зря не тратить)

Grigory
30.04.2018
18:35:34
терпеть не могу на сильном огне приготовленный
копи лувак попробуй 10 минут повари

Artem
30.04.2018
18:35:38
лал

Daniel
30.04.2018
18:35:48
Artem
30.04.2018
18:36:04
копи лувак попробуй 10 минут повари
он будет кричать и ругаться матом

не в смысле Даниэль, а кофе)

Daniel
30.04.2018
18:36:23
легкий оттенок шоколада не все любят, Гриш) но это тема для понва

Grigory
30.04.2018
18:36:42
ну это уже к теме снобизма)

Google
Grigory
30.04.2018
18:36:52
я воздержусь от комментариев

Daniel
30.04.2018
18:36:56
))

Евгений
30.04.2018
18:37:34
10к$ в месяц - это за 3 года полчается 21млн рубликов. Какой конфиг кластера был?

Grigory
30.04.2018
18:37:42
ну или за 10 лет

мы говорим обо все что апаче и в течении 10 единиц времени

Eduard
02.05.2018
13:16:10
а ганглия чего говорит?
Пересобрал кластер чтобы добавить на него ганглию - все стало нормально работать. Но в любом случае спасибо)

Oleksandr
02.05.2018
17:20:54
кто юзает aws batch, есть ли там годный гуй? чтобы хотя бы умел показывать весь граф выполнения (цепочку dependsOs)

Arcady
03.05.2018
17:41:01
о как https://github.com/skale-me/skale

на порядок быстрее спарка. вот только ...

Евгений
03.05.2018
17:50:46
Вот только нахрена он на js, если дсы всё равно не хотят отказываться от scikit-learn и 100500 библиотек с нейронками, у которых естественно нет обёртки на js?)

Arcady
03.05.2018
17:53:50
да не. даже не поэтому. Где поддержка HDFS и пр.

Andrey
03.05.2018
17:55:21
а чо вычислительный кластер на фронте

бабушек заманил на сайт - плюс сто экзекуторов

Akceptor
08.05.2018
06:58:48
умеет ли Spark из коробки читать parquet файлы, или ему как для CSv еще нужна какая-то либа?

Grigory
08.05.2018
06:59:23
для csv ему не нужна доп либа

умеет

Eduard
08.05.2018
10:31:14
Ребята, подскажите плз куда копать: diagnostics: Application application_1525167810468_0154 failed 1 times due to AM Container for appattempt_1525167810468_0154_000001 exited with exitCode: -100 Failing this attempt.Diagnostics: Container released on a *lost* nodeFor more detailed output, check the application tracking page

Spark джоб в EMR кластере падает с такой ошибкой

Google
Eduard
08.05.2018
10:32:29


Судя по всему это нехватка памяти

Джоб работал с 8:05 до 9:20 примерно

как гуглить чтобы понять в каком месте приложения неэффективная операция? )

Grigory
09.05.2018
07:20:02
Как я помню нужен либa parquet databricks
Нет такой из коробки спарк умеет

Эшер
09.05.2018
07:41:38
Misha
09.05.2018
07:50:51
Csv да

Но parquet разве?

Nick
09.05.2018
07:51:18
Паркет давно в Спарке

Misha
09.05.2018
07:51:32
Понятно, спасибо

Grigory
09.05.2018
17:40:24
@krivdathetriewe ты теперь питонист?

Pavel
10.05.2018
11:37:24
Кто нибудь может подсказать хороший ресурс для подготовки к собеседованию на должность Hadoop администратора сборки Cloudera?

Pavel
10.05.2018
11:42:37
Неделя до двух

Little
10.05.2018
11:42:59
http://www.gasl.org/refbib/Bible_King_James_Version.pdf

авось поможет

Pavel
10.05.2018
11:53:25
Особенно Genesis! ? А если серьезно, где есть хороший источник кейсов и их решений? ?

KrivdaAllStars
10.05.2018
11:54:17
Пошарьте :) тож почитаю , интересно что у них там есть в программе

Google
Pavel
10.05.2018
12:06:19
Документация в чтении, но кейсов там нет?

Stanislav
10.05.2018
12:17:27
Pavel
10.05.2018
12:18:29
Уже изучил. Та же документация в итоге оказалась. ?

Stanislav
10.05.2018
12:19:52
А так большей частью зукипер, реализация ХА для всех основных сервисов - неймноды и прочее. Ну ещё керберизация и общая теория hdfs. Вроде от админов ничего не спрашивают.

Дык

Что там изобретать то )

Pavel
10.05.2018
12:24:03
Что там изобретать то )
Круто! Спасибо за направление!

Stanislav
10.05.2018
12:24:49
Опыт какой-то есть? Самое продуктивное, развернуть в авс или где там кластер. Сразу все окинешь взглядом

А, ещё шедулеры и как распределить миллион аналитиков на 3 серверах

Pavel
10.05.2018
12:28:23
Есть опыт в установке с HA Cloudera Enterprise

Sergey
10.05.2018
12:35:29
ребяты! а кто баловался с CSD в Cloudera? че этой сволочи не нравится в настройках logging для кастомного сервиса? почему я не вижу в Cloudera Manager для конкретного инстанса роли вкладку Log Files? в service.sdl так пишу: "logging" : { "dir" : "/var/log/analdestroyer", "filename" : "destroymenow.out", "loggingType" : "other" },

при проверке service.sdl через cm_ext/validator никаких ворнингов-ошибок...

Tsh
10.05.2018
12:50:55
Отличное название лога

Stanislav
10.05.2018
12:52:22
Невозможно
Найти миллион аналитиков?)

Sergey
10.05.2018
12:52:23
kawaii

Александр
10.05.2018
17:47:43
Доброго времени суток ! Есть задача взять данные в формате паркет(parquet), и научиться с ними работать(читай - парсить) Гугл скинул пару вариантов невнятных, и не очень говорящую доку. Это действительно мало информации по формату или я просто мало читаю ?

Александр
10.05.2018
17:48:55
мало читаешь)
Что читать кроме офф доки ?

Страница 97 из 182