
Grigory
26.09.2017
15:13:27
скриношт сделай как выглядят дубликаты в ярне
вдруг у мя совсем другое было

Oleksandr
26.09.2017
15:13:35
1.6, да, через него и смотрю

Grigory
26.09.2017
15:13:41
Хы

Google

Oleksandr
26.09.2017
15:14:17

Andrey
26.09.2017
15:14:59
как ты его запускаешь?


Oleksandr
26.09.2017
15:18:07
а можно скрипт запуска сюда? И на какой платформе делаете?
cli oozie, spark-submit, из релевантных параметров
<argument>--executor-memory</argument>
<argument>10G</argument>
<argument>--num-executors</argument>
<argument>2</argument>
<argument>--conf</argument>
<argument>"spark.executor.extraJavaOptions=-XX:+UseG1GC"</argument>
<argument>--conf</argument>
<argument>spark.yarn.maxAppAttempts=4</argument>
<argument>--conf</argument>
<argument>spark.yarn.am.attemptFailuresValidityInterval=1h</argument>
<argument>--conf</argument>
<argument>spark.yarn.max.executor.failures=8</argument>
<argument>--conf</argument>
<argument>spark.yarn.executor.failuresValidityInterval=1h</argument>
<argument>--queue</argument>
<argument>streaming</argument>
<argument>--class</argument>
<argument>...</argument>
<argument>--sparkMaster</argument>
<argument>yarn-cluster</argument>
<argument>--sparkMemory</argument>
<argument>10G</argument>


Andrey
26.09.2017
15:19:11
а если без oozie попробовать?
просто спарк скриптом из шела

Oleksandr
26.09.2017
15:19:55
попробую, спасибо
а в чем предположительно косяк оози? (результат не сразу будет видно)

Andrey
26.09.2017
15:21:27
мы его не используем, но я предположу, что он запускает джобу и не видит ее в ярне. Мб изза того, что ты имя задаешь свое, мб сам ярн не отдает oozie данные (права или еще что то)
но я бы начал с копания oozie

Oleksandr
26.09.2017
15:21:48
кстати, имя-то как раз не пробрасывается почему-то тут :)
во всех остальных стримилках appName резолвится нормально, а тут подставляется имя класса
походу да, в этом косяк, спасибо

Andrey
26.09.2017
15:22:51
нзчт)

Google

KrivdaTheTriewe
26.09.2017
15:23:31

Andrey
26.09.2017
15:24:08
а правда что в клаудере виндовс функции в спарке выключены?)

Grigory
26.09.2017
15:24:09

KrivdaTheTriewe
26.09.2017
15:24:26

Andrey
26.09.2017
15:25:12
ну это правильно, ведь надо писать на скале
а вот без оконных функций как то печально чтоли

Grigory
26.09.2017
15:26:14
Кривда обожатель винды

Daniel
26.09.2017
15:26:29

KrivdaTheTriewe
26.09.2017
15:27:52

Andrey
26.09.2017
15:30:13
мне кажется все пользователи этого мощнейшего фреймворка (крона) наступали на подобные грабли

Oleksandr
26.09.2017
15:36:30

Daniel
26.09.2017
15:37:57

Andrey
26.09.2017
15:40:10
api крона это кронтаб?)

Daniel
26.09.2017
15:42:08
а блин, продолбал что речь о кроне %)

Grigory
26.09.2017
15:58:35
кронтаб 2

Andrew
29.09.2017
08:34:57
Господа, может кто-нибудь что-нибудь сказать по теме Spark vs Ignite?

Nick
29.09.2017
08:36:30
Vs?
Для какой задачи

Andrew
29.09.2017
08:42:57
я извиняюсь за некорректность вопроса, но не в разрезе конкретной задачи. хотелось бы услышать success story типа "мудохались три года со спраком, а вот запилили игнайт и всё взлетело". или наоборот.

Google

Daniel
29.09.2017
08:44:04
вопрос конкретнее не стал

Andrey
29.09.2017
08:44:07
Мудохались пол года со спарком и все взлетело

Daniel
29.09.2017
08:44:52
у них кейсы изначально разные, несмотря на попытки гридгейна влезть в рынок мл

Anton
29.09.2017
09:00:58
да да рынок одного банка

Grigory
29.09.2017
09:44:08
Мудохались с этой бигдатой и все прапало
Оказалось можно было использовать акку монгу

Andrey
29.09.2017
09:44:43

Grigory
29.09.2017
09:44:56
и все взлетело

Andrey
29.09.2017
09:45:27
и оказалось быстрее чем спарк кассандра мл бигдата фронтенд блокчейн

Grigory
29.09.2017
09:45:57
чем го

Oleksandr
29.09.2017
14:11:39
чем го
https://thinkfaster.co/2017/05/big-data-with-golang-instead-of-mapreduce/

Grigory
29.09.2017
14:18:26

Oleksandr
29.09.2017
14:18:43

Grigory
29.09.2017
14:19:16
think faster jump higher maaan, you're not a part of a SYSTEM
Drop dat Spark on a ground
к слову статья какраз про то что файл лучшая дб

Oleksandr
29.09.2017
14:51:27
до тех пор, пока не нужны транзакции, мвсс и оно влазит в память
так-то да, однострочник на перле для огромного количества задач будет быстрее, чем кластер спарка)

KrivdaTheTriewe
29.09.2017
14:53:27
в книге праты перл быстрее С на некотррых задачах)
Книжка с собачкой

Google

Алексей
29.09.2017
20:00:22
добрый вечер. господа посоветуйте что почитать для кикстарта по хадупу.
предстоит разобраться со связкой hadoop+kafka+flink. пока кроме названия и примерного понимания чего и зачем ничего не знаю. начинать с оф док не хочу. не тот уровень пока.
@ptchol ? @demeliorator ?

Daniel
29.09.2017
20:06:10
оф доки имхо норм (у кафки и флинка)
есть гайды
но можно плясать от задачи

Алексей
29.09.2017
20:07:16
до док я доберуть. ща хочу обзорное что нить. типа паттернов проектирования, описание привычных стеков, такое вот
задача пока выглядит даже в голове у заказчика как "мало писать, много читать. прикрутить сбоку bi что бы были выборки. "

Daniel
29.09.2017
20:09:02
https://www.confluent.io/blog/apache-kafka-getting-started/

Алексей
29.09.2017
20:09:24
спасибо

Daniel
29.09.2017
20:09:44
https://flink.apache.org/introduction.html
с кафкой флинк умеет работать (следить за версиями только надо)
у нас самый "жирный" джоб 150к в секунду переваривает с флинком из кафки в кафку

Алексей
29.09.2017
20:13:10
моя роль в проекте собрать стейдж среду на основе уловного готового прода.
прод пока не видел. :)

Daniel
29.09.2017
20:16:28
у нас клаудера, на ней флинк, кафка на отдельных тачках (пока на виртуалках)
там нет вроде рокет сайенса - поставить первое и третье, написать джоб на 2ом и задеплоить на первое
"вроде" это про клаудеру, я её слава богу сам не ставил ни разу)

Linus
30.09.2017
08:25:54
Apache Spark on Kubernetes - Spark 2.2.0 Documentation
https://apache-spark-on-k8s.github.io/userdocs/