@hadoopusers

Страница 19 из 182
Nick
14.07.2017
07:26:47
не ты не понял

смотри есть железная нода

Grigory
14.07.2017
07:26:55
Да понял да

Nick
14.07.2017
07:27:00
с dcos

Google
Nick
14.07.2017
07:27:03
когда она стартует

хорошо бы сделать mount

ноhdfs где-то на другой ноде может еще не стартануть

мало того, он может стартовать на той же ноде)

cyclic dependency)

Grigory
14.07.2017
07:28:06
мде;

ну гластер тоже рабочий вариант, и очень хороший

Nick
14.07.2017
07:28:37
да я думаю nfs на мастере сделаю

а хдфс юзать уже для бизнес тем

Grigory
14.07.2017
07:28:56
но я на старом месте выкинул его, потому что и гластер и хдфс +- одно и тоже

Ну гластер пользовался для синха тбов

Nick
14.07.2017
07:29:31
ну не, хдфс всеж по круче в плане не проебать данные

Grigory
14.07.2017
07:31:19
да мне кажется мы все пробовали, но остановились на фьюзе; почему - точно не помню

Google
Grigory
14.07.2017
07:31:35
админ долго на меня злобц держал что я убил его гластер

затаил

Nick
14.07.2017
07:33:40
fuse на hdfs?

какой драйвер юзал

и был ли у него кэш там

Grigory
14.07.2017
07:37:08
это вопрос конечно

Толи клаудера была

Nick
14.07.2017
07:49:41
У них джавовый драйвер ж

Не тру)

Grigory
14.07.2017
07:53:07
) ну фьюз сам по себе такой

Nick
14.07.2017
08:08:17
Не

Там есть дрова нормальные

На си писанные)

Danis
15.07.2017
02:31:32
Привет всем, коллеги ?

Рад узнать про такой замечательный канал.

Подскажите самый простой способ познакомиться с зоопарком Hadoop, пожалуйста.

Danis
15.07.2017
03:08:59
А нет чего-то более поверхностного, или это все таки самое то?

KrivdaTheTriewe
15.07.2017
03:18:35
hortonwotks лабораторные

Andrey
15.07.2017
05:11:17
Пара курсов по hdfs и mapreduce есть на udacity

Google
Andrey
15.07.2017
05:11:51
Курсы по Spark есть на coursera

Неплохой обзорный курс по всему стеку есть на linuxacademy

Danis
15.07.2017
05:38:50
Странно, что раньше не слышал о linuxacademy. Нашел этот курс: https://linuxacademy.com/bigdata/training/course/name/big-data-essentials Действительно, рассматриваются много инструментов. Только пока не пойму, платно это все или бесплатно.

Сейчас прохожу курс на Udacity.

Но кажется много там не узнаю нового.

Andrey
15.07.2017
06:02:36
linuxacademy платный, но там есть триальный месяц вроде

Daniel
15.07.2017
06:09:22
на степике еще был курс от мейла

Danis
15.07.2017
07:26:01
Он устаревший немного и там слишком глубоко рассматривается MapReduce

Углубление в сторону разработки на Java.

На linuxacademy триальные 7 дней только.

KrivdaTheTriewe
17.07.2017
14:34:42
а собирал кто Спарк с поддержкой гпу и прочими радостями?

Kirill
17.07.2017
14:35:16
Кстати, присоединюсь к вопросу про сборку: самый годный дистрибутив это HDP ? Чтобы сразу был Hadoop, Hive, Spark ?

Linus
17.07.2017
14:40:33
Всем привет. Может подскажете есть ли возможность использовать хайв 2.1 ллап с паркетом?

Grigory
17.07.2017
14:41:31
а собирал кто Спарк с поддержкой гпу и прочими радостями?
спарк нет как не очень юзерфрендли проект и заброшенный к тому же можешь использовать (хотя бы как пример)

KrivdaTheTriewe
17.07.2017
15:06:31
джава ж не умеет эт все)
но я слышал про проект, плюс был некий тензорфреймс, и там было сказано, что-то про гпу

Grigory
17.07.2017
15:14:05
вопрос для знатоков zeppelin: может ли цеплять джарники из s3? и динамически обновлять зависимости при обновлении конкретного джарника там

чтото типа vfs класслоадера, но что бы и с с3 работал (к слову я не проверял умеет ли вфс работать с s3)

Google
Grigory
17.07.2017
17:05:42
погугил, умеет вот это: https://github.com/abashev/vfs-s3 но вопрос в силе)

Nick
17.07.2017
17:13:46
гыгы

а я знаю Абашева

Grigory
17.07.2017
17:38:01
Nick
17.07.2017
17:45:11
лол

@pomadchin ты swagger юзаешь?

Grigory
17.07.2017
17:45:50
Nick
17.07.2017
17:46:06
не с финатрой случаем?

Grigory
17.07.2017
17:46:07
лол
И главное он ПОТЕР сообщение

KrivdaTheTriewe
17.07.2017
17:46:48
потому что я тоже работаю

Grigory
17.07.2017
17:47:03
неа

Nick
17.07.2017
17:47:11
@pomadchin я тут решил scalapb-json с finatra-swagger подружить, чет жопа)

ну а че делать)

Grigory
17.07.2017
17:48:07
сочувствую тебе)

Nick
17.07.2017
17:48:25
мне западро модель переписывать и потом перекладываниями заниматься

Grigory
17.07.2017
17:48:26
меня дикая скука одолевает кога речь заходит о чем-то документация-подобном

поентому я сам стараюсь этим не заниматься, но раздавать советы, да

Nick
17.07.2017
17:49:06
походу придется заняться этои хуиней

Grigory
17.07.2017
17:49:13
кому-то надо ):

Nick
17.07.2017
17:49:13
что очень печально, да

Google
KrivdaTheTriewe
17.07.2017
17:49:22
поентому я сам стараюсь этим не заниматься, но раздавать советы, да
b очень хорошо писать етл для спарка, там даже тесты не нужны обычно )

Grigory
17.07.2017
17:49:50
b очень хорошо писать етл для спарка, там даже тесты не нужны обычно )
ну я не оч понимаю что ты понимаешь под етл в твоем случае

но у меня все в тестах)

и юнит и интеграционные есть

Nick
17.07.2017
17:50:09
@pomadchin может там можно кастомные сериализаторы/десериализаторы замутить?

Grigory
17.07.2017
17:50:29
ну так 'етл' часто выходит за рамки etl (что ты назвал бизнес логикуой но потер)

KrivdaTheTriewe
17.07.2017
17:50:49
бизнеслогика сложная , которую фиг тестами покроешь

то есть обычно сложные аналитические отчёты на спарке

KrivdaTheTriewe
17.07.2017
17:52:55
что-то универсальное можно покрыть тестами , а вот сложную логику пользователя нет , так как пользователь и результата ожидаемого толком не знает

Страница 19 из 182