@hadoopusers

Страница 39 из 182
Grigory
26.09.2017
15:13:27
скриношт сделай как выглядят дубликаты в ярне

вдруг у мя совсем другое было

Oleksandr
26.09.2017
15:13:35
1.6, да, через него и смотрю

Grigory
26.09.2017
15:13:41
Хы

Google
Oleksandr
26.09.2017
15:14:17


Andrey
26.09.2017
15:14:59
как ты его запускаешь?

Oleksandr
26.09.2017
15:18:07
а можно скрипт запуска сюда? И на какой платформе делаете?
cli oozie, spark-submit, из релевантных параметров <argument>--executor-memory</argument> <argument>10G</argument> <argument>--num-executors</argument> <argument>2</argument> <argument>--conf</argument> <argument>&quot;spark.executor.extraJavaOptions=-XX:+UseG1GC&quot;</argument> <argument>--conf</argument> <argument>spark.yarn.maxAppAttempts=4</argument> <argument>--conf</argument> <argument>spark.yarn.am.attemptFailuresValidityInterval=1h</argument> <argument>--conf</argument> <argument>spark.yarn.max.executor.failures=8</argument> <argument>--conf</argument> <argument>spark.yarn.executor.failuresValidityInterval=1h</argument> <argument>--queue</argument> <argument>streaming</argument> <argument>--class</argument> <argument>...</argument> <argument>--sparkMaster</argument> <argument>yarn-cluster</argument> <argument>--sparkMemory</argument> <argument>10G</argument>

Andrey
26.09.2017
15:19:11
а если без oozie попробовать?

просто спарк скриптом из шела

Oleksandr
26.09.2017
15:19:55
попробую, спасибо

а в чем предположительно косяк оози? (результат не сразу будет видно)

Andrey
26.09.2017
15:21:27
мы его не используем, но я предположу, что он запускает джобу и не видит ее в ярне. Мб изза того, что ты имя задаешь свое, мб сам ярн не отдает oozie данные (права или еще что то)

но я бы начал с копания oozie

Oleksandr
26.09.2017
15:21:48
кстати, имя-то как раз не пробрасывается почему-то тут :)

во всех остальных стримилках appName резолвится нормально, а тут подставляется имя класса

походу да, в этом косяк, спасибо

Andrey
26.09.2017
15:22:51
нзчт)

Google
Andrey
26.09.2017
15:24:08
а правда что в клаудере виндовс функции в спарке выключены?)

KrivdaTheTriewe
26.09.2017
15:24:26
Andrey
26.09.2017
15:25:12
ну это правильно, ведь надо писать на скале

а вот без оконных функций как то печально чтоли

Grigory
26.09.2017
15:26:14
Кривда обожатель винды

Daniel
26.09.2017
15:26:29
а в чем предположительно косяк оози? (результат не сразу будет видно)
у нас на кастомной запускалке флинка такая же фигня была кривая обработка статуса джоба из-за имени

KrivdaTheTriewe
26.09.2017
15:27:52
у нас на кастомной запускалке флинка такая же фигня была кривая обработка статуса джоба из-за имени
у меня из-за того, что я скривил с названием джобы, крон запустил штук 15 копий одной джобы, а дальше уже ограничение ярновское сработало )

Andrey
26.09.2017
15:30:13
мне кажется все пользователи этого мощнейшего фреймворка (крона) наступали на подобные грабли

Oleksandr
26.09.2017
15:36:30
у нас на кастомной запускалке флинка такая же фигня была кривая обработка статуса джоба из-за имени
походу реально в этом дело пробросил повыше имя аппликухи --name, вроде завелось

Daniel
26.09.2017
15:37:57
мне кажется все пользователи этого мощнейшего фреймворка (крона) наступали на подобные грабли
проблема то не в нем, а как с его апи работаешь =) ну и вроде релизнули или готовят 2.0, можно будет начинать сначала =)

Andrey
26.09.2017
15:40:10
api крона это кронтаб?)

Daniel
26.09.2017
15:42:08
а блин, продолбал что речь о кроне %)

Grigory
26.09.2017
15:58:35
кронтаб 2

Andrew
29.09.2017
08:34:57
Господа, может кто-нибудь что-нибудь сказать по теме Spark vs Ignite?

Nick
29.09.2017
08:36:30
Vs?

Для какой задачи

Andrew
29.09.2017
08:42:57
я извиняюсь за некорректность вопроса, но не в разрезе конкретной задачи. хотелось бы услышать success story типа "мудохались три года со спраком, а вот запилили игнайт и всё взлетело". или наоборот.

Google
Daniel
29.09.2017
08:44:04
вопрос конкретнее не стал

Andrey
29.09.2017
08:44:07
Мудохались пол года со спарком и все взлетело

Daniel
29.09.2017
08:44:52
у них кейсы изначально разные, несмотря на попытки гридгейна влезть в рынок мл

Anton
29.09.2017
09:00:58
да да рынок одного банка

Grigory
29.09.2017
09:44:08
Мудохались с этой бигдатой и все прапало

Оказалось можно было использовать акку монгу

Andrey
29.09.2017
09:44:43
Grigory
29.09.2017
09:44:56
и все взлетело

Andrey
29.09.2017
09:45:27
и оказалось быстрее чем спарк кассандра мл бигдата фронтенд блокчейн

Grigory
29.09.2017
09:45:57
чем го

Oleksandr
29.09.2017
14:11:39
чем го
https://thinkfaster.co/2017/05/big-data-with-golang-instead-of-mapreduce/

Grigory
29.09.2017
14:18:26
https://thinkfaster.co/2017/05/big-data-with-golang-instead-of-mapreduce/
Мне понравилось 'ю кант Райт э мапер визаут рдьюсер'

Grigory
29.09.2017
14:19:16
think faster jump higher maaan, you're not a part of a SYSTEM

Drop dat Spark on a ground

к слову статья какраз про то что файл лучшая дб

Oleksandr
29.09.2017
14:51:27
до тех пор, пока не нужны транзакции, мвсс и оно влазит в память

так-то да, однострочник на перле для огромного количества задач будет быстрее, чем кластер спарка)

KrivdaTheTriewe
29.09.2017
14:53:27
в книге праты перл быстрее С на некотррых задачах)

Книжка с собачкой

Google
Алексей
29.09.2017
20:00:22
добрый вечер. господа посоветуйте что почитать для кикстарта по хадупу. предстоит разобраться со связкой hadoop+kafka+flink. пока кроме названия и примерного понимания чего и зачем ничего не знаю. начинать с оф док не хочу. не тот уровень пока.

@ptchol ? @demeliorator ?

Daniel
29.09.2017
20:06:10
оф доки имхо норм (у кафки и флинка) есть гайды но можно плясать от задачи

Алексей
29.09.2017
20:07:16
до док я доберуть. ща хочу обзорное что нить. типа паттернов проектирования, описание привычных стеков, такое вот

задача пока выглядит даже в голове у заказчика как "мало писать, много читать. прикрутить сбоку bi что бы были выборки. "

Daniel
29.09.2017
20:09:02
https://www.confluent.io/blog/apache-kafka-getting-started/

Алексей
29.09.2017
20:09:24
спасибо

Daniel
29.09.2017
20:09:44
https://flink.apache.org/introduction.html

с кафкой флинк умеет работать (следить за версиями только надо) у нас самый "жирный" джоб 150к в секунду переваривает с флинком из кафки в кафку

Алексей
29.09.2017
20:13:10
моя роль в проекте собрать стейдж среду на основе уловного готового прода. прод пока не видел. :)

Daniel
29.09.2017
20:16:28
у нас клаудера, на ней флинк, кафка на отдельных тачках (пока на виртуалках) там нет вроде рокет сайенса - поставить первое и третье, написать джоб на 2ом и задеплоить на первое

"вроде" это про клаудеру, я её слава богу сам не ставил ни разу)

Linus
30.09.2017
08:25:54
Apache Spark on Kubernetes - Spark 2.2.0 Documentation https://apache-spark-on-k8s.github.io/userdocs/

Страница 39 из 182