Daniel
30.04.2018
18:34:13
эм
я 10 минутъ жду пока кофе в турке сварится
Artem
30.04.2018
18:34:15
у нас за хадуп в AWS $10k счет ежемесячно
в турке кофе варится за пару минут)
Daniel
30.04.2018
18:34:50
Google
Daniel
30.04.2018
18:35:01
так же и с хадуп сессиями
наверное
Artem
30.04.2018
18:35:02
так а разница… пенка взошла - снимай)
если ты про арабику
Евгений
30.04.2018
18:35:15
у нас было 20к$, мы их тратили два года, но это же был дипломный проект, так что от силы пару дней в месяц запускали чё-то)
на самом деле всё в локалочке, чтобы бабло зря не тратить)
Grigory
30.04.2018
18:35:34
Artem
30.04.2018
18:35:38
лал
Daniel
30.04.2018
18:35:48
Artem
30.04.2018
18:36:04
не в смысле Даниэль, а кофе)
Daniel
30.04.2018
18:36:23
легкий оттенок шоколада не все любят, Гриш)
но это тема для понва
Grigory
30.04.2018
18:36:42
ну это уже к теме снобизма)
Google
Grigory
30.04.2018
18:36:52
я воздержусь от комментариев
Daniel
30.04.2018
18:36:56
))
Евгений
30.04.2018
18:37:34
10к$ в месяц - это за 3 года полчается 21млн рубликов. Какой конфиг кластера был?
Grigory
30.04.2018
18:37:42
ну или за 10 лет
мы говорим обо все что апаче и в течении 10 единиц времени
Eduard
02.05.2018
13:16:10
а ганглия чего говорит?
Пересобрал кластер чтобы добавить на него ганглию - все стало нормально работать. Но в любом случае спасибо)
Oleksandr
02.05.2018
17:20:54
кто юзает aws batch, есть ли там годный гуй?
чтобы хотя бы умел показывать весь граф выполнения (цепочку dependsOs)
Arcady
03.05.2018
17:41:01
о как https://github.com/skale-me/skale
на порядок быстрее спарка. вот только ...
Евгений
03.05.2018
17:50:46
Вот только нахрена он на js, если дсы всё равно не хотят отказываться от scikit-learn и 100500 библиотек с нейронками, у которых естественно нет обёртки на js?)
Arcady
03.05.2018
17:53:50
да не. даже не поэтому. Где поддержка HDFS и пр.
Andrey
03.05.2018
17:55:21
а чо вычислительный кластер на фронте
бабушек заманил на сайт - плюс сто экзекуторов
Akceptor
08.05.2018
06:58:48
умеет ли Spark из коробки читать parquet файлы, или ему как для CSv еще нужна какая-то либа?
Grigory
08.05.2018
06:59:23
для csv ему не нужна доп либа
умеет
Эшер
08.05.2018
06:59:56
Eduard
08.05.2018
10:31:14
Ребята, подскажите плз куда копать:
diagnostics: Application application_1525167810468_0154 failed 1 times due to AM Container for appattempt_1525167810468_0154_000001 exited with exitCode: -100
Failing this attempt.Diagnostics: Container released on a *lost* nodeFor more detailed output, check the application tracking page
Spark джоб в EMR кластере падает с такой ошибкой
Google
Eduard
08.05.2018
10:32:29
Судя по всему это нехватка памяти
Джоб работал с 8:05 до 9:20 примерно
как гуглить чтобы понять в каком месте приложения неэффективная операция? )
Misha
09.05.2018
05:27:58
Grigory
09.05.2018
07:20:02
Эшер
09.05.2018
07:41:38
Misha
09.05.2018
07:50:51
Csv да
Но parquet разве?
Nick
09.05.2018
07:51:18
Паркет давно в Спарке
Misha
09.05.2018
07:51:32
Понятно, спасибо
Grigory
09.05.2018
17:40:24
@krivdathetriewe ты теперь питонист?
Pavel
10.05.2018
11:37:24
Кто нибудь может подсказать хороший ресурс для подготовки к собеседованию на должность Hadoop администратора сборки Cloudera?
Little
10.05.2018
11:41:19
Pavel
10.05.2018
11:42:37
Неделя до двух
Little
10.05.2018
11:42:59
http://www.gasl.org/refbib/Bible_King_James_Version.pdf
авось поможет
Pavel
10.05.2018
11:53:25
Особенно Genesis! ? А если серьезно, где есть хороший источник кейсов и их решений? ?
KrivdaAllStars
10.05.2018
11:54:17
Пошарьте :) тож почитаю , интересно что у них там есть в программе
Артем
10.05.2018
11:56:29
Google
Pavel
10.05.2018
12:06:19
Документация в чтении, но кейсов там нет?
Stanislav
10.05.2018
12:17:27
Pavel
10.05.2018
12:18:29
Уже изучил. Та же документация в итоге оказалась. ?
Stanislav
10.05.2018
12:19:52
А так большей частью зукипер, реализация ХА для всех основных сервисов - неймноды и прочее. Ну ещё керберизация и общая теория hdfs. Вроде от админов ничего не спрашивают.
Дык
Что там изобретать то )
Pavel
10.05.2018
12:24:03
Stanislav
10.05.2018
12:24:49
Опыт какой-то есть? Самое продуктивное, развернуть в авс или где там кластер. Сразу все окинешь взглядом
А, ещё шедулеры и как распределить миллион аналитиков на 3 серверах
Pavel
10.05.2018
12:28:23
Есть опыт в установке с HA Cloudera Enterprise
Sergey
10.05.2018
12:35:29
ребяты! а кто баловался с CSD в Cloudera? че этой сволочи не нравится в настройках logging для кастомного сервиса? почему я не вижу в Cloudera Manager для конкретного инстанса роли вкладку Log Files?
в service.sdl так пишу:
"logging" : {
"dir" : "/var/log/analdestroyer",
"filename" : "destroymenow.out",
"loggingType" : "other"
},
при проверке service.sdl через cm_ext/validator никаких ворнингов-ошибок...
Tsh
10.05.2018
12:50:55
Отличное название лога
KrivdaAllStars
10.05.2018
12:51:22
Stanislav
10.05.2018
12:52:22
Sergey
10.05.2018
12:52:23
kawaii
Александр
10.05.2018
17:47:43
Доброго времени суток ! Есть задача взять данные в формате паркет(parquet), и научиться с ними работать(читай - парсить) Гугл скинул пару вариантов невнятных, и не очень говорящую доку. Это действительно мало информации по формату или я просто мало читаю ?
Grigory
10.05.2018
17:48:39
Александр
10.05.2018
17:48:55