Grigory
26.09.2017
15:13:27
скриношт сделай как выглядят дубликаты в ярне
вдруг у мя совсем другое было
Oleksandr
26.09.2017
15:13:35
1.6, да, через него и смотрю
Grigory
26.09.2017
15:13:41
Хы
Google
Oleksandr
26.09.2017
15:14:17
Andrey
26.09.2017
15:14:59
как ты его запускаешь?
Oleksandr
26.09.2017
15:18:07
а можно скрипт запуска сюда? И на какой платформе делаете?
cli oozie, spark-submit, из релевантных параметров
<argument>--executor-memory</argument>
<argument>10G</argument>
<argument>--num-executors</argument>
<argument>2</argument>
<argument>--conf</argument>
<argument>"spark.executor.extraJavaOptions=-XX:+UseG1GC"</argument>
<argument>--conf</argument>
<argument>spark.yarn.maxAppAttempts=4</argument>
<argument>--conf</argument>
<argument>spark.yarn.am.attemptFailuresValidityInterval=1h</argument>
<argument>--conf</argument>
<argument>spark.yarn.max.executor.failures=8</argument>
<argument>--conf</argument>
<argument>spark.yarn.executor.failuresValidityInterval=1h</argument>
<argument>--queue</argument>
<argument>streaming</argument>
<argument>--class</argument>
<argument>...</argument>
<argument>--sparkMaster</argument>
<argument>yarn-cluster</argument>
<argument>--sparkMemory</argument>
<argument>10G</argument>
Andrey
26.09.2017
15:19:11
а если без oozie попробовать?
просто спарк скриптом из шела
Oleksandr
26.09.2017
15:19:55
попробую, спасибо
а в чем предположительно косяк оози? (результат не сразу будет видно)
Andrey
26.09.2017
15:21:27
мы его не используем, но я предположу, что он запускает джобу и не видит ее в ярне. Мб изза того, что ты имя задаешь свое, мб сам ярн не отдает oozie данные (права или еще что то)
но я бы начал с копания oozie
Oleksandr
26.09.2017
15:21:48
кстати, имя-то как раз не пробрасывается почему-то тут :)
во всех остальных стримилках appName резолвится нормально, а тут подставляется имя класса
походу да, в этом косяк, спасибо
Andrey
26.09.2017
15:22:51
нзчт)
Google
KrivdaTheTriewe
26.09.2017
15:23:31
Andrey
26.09.2017
15:24:08
а правда что в клаудере виндовс функции в спарке выключены?)
Grigory
26.09.2017
15:24:09
KrivdaTheTriewe
26.09.2017
15:24:26
Andrey
26.09.2017
15:25:12
ну это правильно, ведь надо писать на скале
а вот без оконных функций как то печально чтоли
Grigory
26.09.2017
15:26:14
Кривда обожатель винды
Daniel
26.09.2017
15:26:29
KrivdaTheTriewe
26.09.2017
15:27:52
Andrey
26.09.2017
15:30:13
мне кажется все пользователи этого мощнейшего фреймворка (крона) наступали на подобные грабли
Oleksandr
26.09.2017
15:36:30
Daniel
26.09.2017
15:37:57
Andrey
26.09.2017
15:40:10
api крона это кронтаб?)
Daniel
26.09.2017
15:42:08
а блин, продолбал что речь о кроне %)
Grigory
26.09.2017
15:58:35
кронтаб 2
Andrew
29.09.2017
08:34:57
Господа, может кто-нибудь что-нибудь сказать по теме Spark vs Ignite?
Nick
29.09.2017
08:36:30
Vs?
Для какой задачи
Andrew
29.09.2017
08:42:57
я извиняюсь за некорректность вопроса, но не в разрезе конкретной задачи. хотелось бы услышать success story типа "мудохались три года со спраком, а вот запилили игнайт и всё взлетело". или наоборот.
Google
Daniel
29.09.2017
08:44:04
вопрос конкретнее не стал
Andrey
29.09.2017
08:44:07
Мудохались пол года со спарком и все взлетело
Daniel
29.09.2017
08:44:52
у них кейсы изначально разные, несмотря на попытки гридгейна влезть в рынок мл
Anton
29.09.2017
09:00:58
да да рынок одного банка
Grigory
29.09.2017
09:44:08
Мудохались с этой бигдатой и все прапало
Оказалось можно было использовать акку монгу
Andrey
29.09.2017
09:44:43
Grigory
29.09.2017
09:44:56
и все взлетело
Andrey
29.09.2017
09:45:27
и оказалось быстрее чем спарк кассандра мл бигдата фронтенд блокчейн
Grigory
29.09.2017
09:45:57
чем го
Oleksandr
29.09.2017
14:11:39
чем го
https://thinkfaster.co/2017/05/big-data-with-golang-instead-of-mapreduce/
Grigory
29.09.2017
14:18:26
Oleksandr
29.09.2017
14:18:43
Grigory
29.09.2017
14:19:16
think faster jump higher maaan, you're not a part of a SYSTEM
Drop dat Spark on a ground
к слову статья какраз про то что файл лучшая дб
Oleksandr
29.09.2017
14:51:27
до тех пор, пока не нужны транзакции, мвсс и оно влазит в память
так-то да, однострочник на перле для огромного количества задач будет быстрее, чем кластер спарка)
KrivdaTheTriewe
29.09.2017
14:53:27
в книге праты перл быстрее С на некотррых задачах)
Книжка с собачкой
Google
Алексей
29.09.2017
20:00:22
добрый вечер. господа посоветуйте что почитать для кикстарта по хадупу.
предстоит разобраться со связкой hadoop+kafka+flink. пока кроме названия и примерного понимания чего и зачем ничего не знаю. начинать с оф док не хочу. не тот уровень пока.
@ptchol ? @demeliorator ?
Daniel
29.09.2017
20:06:10
оф доки имхо норм (у кафки и флинка)
есть гайды
но можно плясать от задачи
Алексей
29.09.2017
20:07:16
до док я доберуть. ща хочу обзорное что нить. типа паттернов проектирования, описание привычных стеков, такое вот
задача пока выглядит даже в голове у заказчика как "мало писать, много читать. прикрутить сбоку bi что бы были выборки. "
Daniel
29.09.2017
20:09:02
https://www.confluent.io/blog/apache-kafka-getting-started/
Алексей
29.09.2017
20:09:24
спасибо
Daniel
29.09.2017
20:09:44
https://flink.apache.org/introduction.html
с кафкой флинк умеет работать (следить за версиями только надо)
у нас самый "жирный" джоб 150к в секунду переваривает с флинком из кафки в кафку
Алексей
29.09.2017
20:13:10
моя роль в проекте собрать стейдж среду на основе уловного готового прода.
прод пока не видел. :)
Daniel
29.09.2017
20:16:28
у нас клаудера, на ней флинк, кафка на отдельных тачках (пока на виртуалках)
там нет вроде рокет сайенса - поставить первое и третье, написать джоб на 2ом и задеплоить на первое
"вроде" это про клаудеру, я её слава богу сам не ставил ни разу)
Linus
30.09.2017
08:25:54
Apache Spark on Kubernetes - Spark 2.2.0 Documentation
https://apache-spark-on-k8s.github.io/userdocs/