
KrivdaTheTriewe
11.12.2017
14:45:21
вообще много разных ссылок и багов гугол выдал по такой проблеме )


Petr
11.12.2017
14:55:49
Именно что много, но большинство не подходят ибо в client-mode все работает

Google

KrivdaTheTriewe
11.12.2017
15:05:45

Andrey
11.12.2017
15:07:31
spark-submit \
--class com.github.gbraccialli.spark.HiveCommand \
--master yarn-cluster \
--num-executors 1 \
--driver-memory 1g \
--executor-memory 1g \
--executor-cores 1 \
--files /usr/hdp/current/spark-client/conf/hive-site.xml \
--jars /usr/hdp/current/spark-client/lib/datanucleus-api-jdo-3.2.6.jar,/usr/hdp/current/spark-client/lib/datanucleus-rdbms-3.2.9.jar,/usr/hdp/current/spark-client/lib/datanucleus-core-3.2.10.jar \
датануклеус еще
https://community.hortonworks.com/questions/5798/spark-hive-tables-not-found-when-running-in-yarn-c.html
известная проблема
:)

Petr
11.12.2017
23:01:08
джарники прокидывались, датануклеус не помог
помогла смена etc/hive/conf/hive-site.xml
на /usr/hdp/current/spark-client/conf/hive-site.xml
хотя я целенаправленно думал что первый лучше (в нем 780 строк, против 10 строк второго)

Kirill
11.12.2017
23:35:35

KrivdaTheTriewe
12.12.2017
12:43:31
Хозяйке на заметку:
cron driven деплой плох тем, что можно столкнуться с ограничением количества тредов на пользователя под которым куча задач запускается

sherzod
12.12.2017
12:45:09
https://datamoth.github.io
Для батч джобов.

Daniel
12.12.2017
12:46:27

sherzod
12.12.2017
12:46:47
Oozie как планировщик

Google

KrivdaTheTriewe
12.12.2017
12:47:48

sherzod
12.12.2017
12:48:32
Джобы на чём пишете?

KrivdaTheTriewe
12.12.2017
12:48:46
на скале и хайве
в основном три вещи, хайв, спрак, спарк стриминг

Grigory
12.12.2017
12:49:40
да мы тож на эирфлоу

KrivdaTheTriewe
12.12.2017
12:49:43

Grigory
12.12.2017
12:49:55
но я не знаю истиных причин, мое мнение что команда бывших питонистов просто в проекте
но мы их всех на скалу перетащили

KrivdaTheTriewe
12.12.2017
12:50:08

Grigory
12.12.2017
12:50:19
но он конечно может выжрать дофига
но для старта что угодно подойдет а там по ситуации посмотришь

sherzod
12.12.2017
12:51:09

Grigory
12.12.2017
12:51:17
у нас aws батч и емр жобы им шедулятся
всякие даги не самые простые со статуами разными и ветками тыры пыры
сам эирфлоу в контейнерах

KrivdaTheTriewe
12.12.2017
12:51:39
там безос за всех побеспокоился , как я понял

Grigory
12.12.2017
12:52:35
безос?

KrivdaTheTriewe
12.12.2017
12:53:22
а https://ru.wikipedia.org/wiki/%D0%91%D0%B5%D0%B7%D0%BE%D1%81,_%D0%94%D0%B6%D0%B5%D1%84%D1%84

Grigory
12.12.2017
12:54:12
а

Google

Ievgenii
12.12.2017
23:45:04
Кто-то сталкивался с relaxLocality для ResourceRequest в YARN? Я пытаюсь отправить АМ на определённую ноду, а эта штука ни в какую

Dmitry
13.12.2017
07:48:08
коллеги, кто юзал https://toree.apache.org

Grigory
13.12.2017
07:48:28
мы используем
и на скаламитапе московском мой ноутбук был жупитер с этим кернелом

Dmitry
13.12.2017
07:49:08
кул, а запись есть?
не понял пока как депенденси добавлять

Grigory
13.12.2017
07:49:26
гихаб есть)
сча
https://github.com/pomadchin/geotrellis-gis-on-scala

Dmitry
13.12.2017
07:50:04
там чет дока еле живая
@pomadchin можешь сказать куда смотреть если мне например хочется котов затащить

Grigory
13.12.2017
07:54:07
но это старый тори)
у нас сча что-то новое и я точно не знаю как оно там живет. Должно быть не сложно тоже
мне зеппелин прост удобнее; не надо ждать долго пока емр бутстрапнет ноды

Dmitry
13.12.2017
07:55:28
ну я просто натнкулся на убер докер от юпитера
там и питончик и скалка
и вот это вот все
хотел поробовать

Grigory
13.12.2017
07:56:16
знатоки говорят тори лучше чем зепедин

Google

Grigory
13.12.2017
07:56:31
какпо мне тут Эксобар прав больше

Daniel
13.12.2017
07:56:59
Зепелин убогий, по крайней мере чем spark-notebook

Grigory
13.12.2017
07:57:30
да похоже на то
жупитер какой-то более гибкий
посоны карту в него встроили и рил тайм ее рисуют

Daniel
13.12.2017
07:59:14

Dmitry
13.12.2017
07:59:35
ну у тори доки счиатай нет
или я не там смотрел?

Grigory
13.12.2017
08:00:38
честно говооря - мне вообще все доки этих нотбукво кажутся ниоч и аутдейтед.

Dmitry
13.12.2017
08:02:14
я просто хотел в датасайнс поиграть чутка
но от питона меня воротит
scala one love

KrivdaTheTriewe
13.12.2017
08:49:23

Dmitry
13.12.2017
08:49:37
да уж

Daniel
13.12.2017
08:54:10
да не обязательно
зависит от задач
есть же плюсы, р, джулия, джава/скала, луа
и наверняка го, простопотому что все остальное с фатальным недостатком

Dmitry
13.12.2017
08:57:36
ну р никак не лучше питона

Nick
13.12.2017
08:58:02
@pomadchin у тебя весь апач стек?

Grigory
13.12.2017
08:58:58
@gurinderu wat?

Nick
13.12.2017
08:59:36
Ну у тебя все продукты апача юзаются? Просто куда не ткни у тебя это есть

Google

Grigory
13.12.2017
09:00:22
мафия опенсорса просто

Nick
13.12.2017
09:00:48
А dcos почему не привёз?

Grigory
13.12.2017
09:01:00
да он не всрался просто
ну в смсле не панацея)

Nick
13.12.2017
09:01:19
Ну вообще мезос экзекутор наверное штука не плохая

Grigory
13.12.2017
09:01:26
я немного ушел в сторону архитектуры ферймворка и всякого такого а не оркестровки

Nick
13.12.2017
09:01:28
Учитывая что ты Спарком обмазан

Grigory
13.12.2017
09:01:30
мммм не совсем

KrivdaTheTriewe
13.12.2017
09:01:48

Grigory
13.12.2017
09:01:51
не помню что именно но мезос хоть и интересный но ярн нам лучше подошел; хотя конечно же возможно не так говтоил его

Nick
13.12.2017
09:02:00
Чем вам ярн лучше подошёл?

KrivdaTheTriewe
13.12.2017
09:02:27
во первых потому что хайв с ним работает и ещё добрая половина фреймворков