
Nick
14.07.2017
07:26:47
не ты не понял
смотри есть железная нода

Grigory
14.07.2017
07:26:55
Да понял да

Nick
14.07.2017
07:27:00
с dcos

Google

Nick
14.07.2017
07:27:03
когда она стартует
хорошо бы сделать mount
ноhdfs где-то на другой ноде может еще не стартануть
мало того, он может стартовать на той же ноде)
cyclic dependency)

Grigory
14.07.2017
07:28:06
мде;
ну гластер тоже рабочий вариант, и очень хороший

Nick
14.07.2017
07:28:37
да я думаю nfs на мастере сделаю
а хдфс юзать уже для бизнес тем

Grigory
14.07.2017
07:28:56
но я на старом месте выкинул его, потому что и гластер и хдфс +- одно и тоже
Ну гластер пользовался для синха тбов

Nick
14.07.2017
07:29:31
ну не, хдфс всеж по круче в плане не проебать данные

Grigory
14.07.2017
07:31:19
да мне кажется мы все пробовали, но остановились на фьюзе; почему - точно не помню

Google

Grigory
14.07.2017
07:31:35
админ долго на меня злобц держал что я убил его гластер
затаил

Nick
14.07.2017
07:33:40
fuse на hdfs?
какой драйвер юзал
и был ли у него кэш там

Grigory
14.07.2017
07:37:08
это вопрос конечно
Толи клаудера была

Nick
14.07.2017
07:49:41
У них джавовый драйвер ж
Не тру)

Grigory
14.07.2017
07:53:07
) ну фьюз сам по себе такой

Nick
14.07.2017
08:08:17
Не
Там есть дрова нормальные
На си писанные)

Danis
15.07.2017
02:31:32
Привет всем, коллеги ?
Рад узнать про такой замечательный канал.
Подскажите самый простой способ познакомиться с зоопарком Hadoop, пожалуйста.

KrivdaTheTriewe
15.07.2017
03:06:32

Danis
15.07.2017
03:08:59
А нет чего-то более поверхностного, или это все таки самое то?

KrivdaTheTriewe
15.07.2017
03:18:35
hortonwotks лабораторные

Andrey
15.07.2017
05:11:17
Пара курсов по hdfs и mapreduce есть на udacity

Google

Andrey
15.07.2017
05:11:51
Курсы по Spark есть на coursera
Неплохой обзорный курс по всему стеку есть на linuxacademy

Danis
15.07.2017
05:38:50
Странно, что раньше не слышал о linuxacademy. Нашел этот курс:
https://linuxacademy.com/bigdata/training/course/name/big-data-essentials
Действительно, рассматриваются много инструментов. Только пока не пойму, платно это все или бесплатно.
Сейчас прохожу курс на Udacity.
Но кажется много там не узнаю нового.

Andrey
15.07.2017
06:02:36
linuxacademy платный, но там есть триальный месяц вроде

Daniel
15.07.2017
06:09:22
на степике еще был курс от мейла

Danis
15.07.2017
07:26:01
Он устаревший немного и там слишком глубоко рассматривается MapReduce
Углубление в сторону разработки на Java.
На linuxacademy триальные 7 дней только.

KrivdaTheTriewe
17.07.2017
14:34:42
а собирал кто Спарк с поддержкой гпу и прочими радостями?

Kirill
17.07.2017
14:35:16
Кстати, присоединюсь к вопросу про сборку: самый годный дистрибутив это HDP ?
Чтобы сразу был Hadoop, Hive, Spark ?

KrivdaTheTriewe
17.07.2017
14:35:36

Linus
17.07.2017
14:40:33
Всем привет. Может подскажете есть ли возможность использовать хайв 2.1 ллап с паркетом?

Grigory
17.07.2017
14:41:31

Nick
17.07.2017
15:04:50

KrivdaTheTriewe
17.07.2017
15:06:31

Grigory
17.07.2017
15:14:05
вопрос для знатоков zeppelin:
может ли цеплять джарники из s3? и динамически обновлять зависимости при обновлении конкретного джарника там
чтото типа vfs класслоадера, но что бы и с с3 работал (к слову я не проверял умеет ли вфс работать с s3)

Google

Grigory
17.07.2017
17:05:42
погугил, умеет вот это: https://github.com/abashev/vfs-s3 но вопрос в силе)

Nick
17.07.2017
17:13:46
гыгы
а я знаю Абашева

Grigory
17.07.2017
17:38:01

Nick
17.07.2017
17:45:11
лол
@pomadchin ты swagger юзаешь?

Grigory
17.07.2017
17:45:50

Nick
17.07.2017
17:46:06
не с финатрой случаем?

Grigory
17.07.2017
17:46:07
лол
И главное он ПОТЕР сообщение

KrivdaTheTriewe
17.07.2017
17:46:48
потому что я тоже работаю

Grigory
17.07.2017
17:47:03
неа

Nick
17.07.2017
17:47:11
@pomadchin я тут решил scalapb-json с finatra-swagger подружить, чет жопа)
ну а че делать)

Grigory
17.07.2017
17:48:07
сочувствую тебе)

Nick
17.07.2017
17:48:25
мне западро модель переписывать и потом перекладываниями заниматься

Grigory
17.07.2017
17:48:26
меня дикая скука одолевает кога речь заходит о чем-то документация-подобном
поентому я сам стараюсь этим не заниматься, но раздавать советы, да

Nick
17.07.2017
17:49:06
походу придется заняться этои хуиней

Grigory
17.07.2017
17:49:13
кому-то надо ):

Nick
17.07.2017
17:49:13
что очень печально, да

Google

KrivdaTheTriewe
17.07.2017
17:49:22

Grigory
17.07.2017
17:49:50
но у меня все в тестах)
и юнит и интеграционные есть

Nick
17.07.2017
17:50:09
@pomadchin может там можно кастомные сериализаторы/десериализаторы замутить?

Grigory
17.07.2017
17:50:29
ну так 'етл' часто выходит за рамки etl (что ты назвал бизнес логикуой но потер)

KrivdaTheTriewe
17.07.2017
17:50:49
бизнеслогика сложная , которую фиг тестами покроешь
то есть обычно сложные аналитические отчёты на спарке

Grigory
17.07.2017
17:51:35
не ковырял финатру особо

KrivdaTheTriewe
17.07.2017
17:52:55
что-то универсальное можно покрыть тестами , а вот сложную логику пользователя нет , так как пользователь и результата ожидаемого толком не знает