
Nick
05.12.2017
06:45:07
О боже

KrivdaTheTriewe
05.12.2017
08:24:18

Dmitry
05.12.2017
08:24:40
Лол, весь сбертех опять?

Grigory
05.12.2017
08:25:16

Google

Victor
05.12.2017
08:25:52

KrivdaTheTriewe
05.12.2017
08:25:53

Daniel
05.12.2017
08:29:18
Новость старая, да

KrivdaTheTriewe
06.12.2017
16:18:12
кто с нифи работал, скажите, скриптед процессор вообще рабочий?

Дмитрий
06.12.2017
16:44:05

Eugene
07.12.2017
11:17:43
Парни, делал кто-нибудь вывод логов по уровню в чарты на сборке клодэры? К примеру, сколько упало ерроров.

sherzod
07.12.2017
11:18:08
в чем проблема?

Eugene
07.12.2017
11:18:50
Проблема в том, что к примеру, solr не ведет статистику. А спарк подсовывает свои логи в серис hdfs.
И не получается единым подходом просматривать ошибки на кластере.

sherzod
07.12.2017
11:19:49
а не. такое не получится сделать
у клаудеры своя база, и там строго определённые поля (хоть их и очень много)
и потом она все-таки на системную статистику направлена
бизнес-логи лучше самому собирать

Google

Eugene
07.12.2017
11:21:08
Какая практика есть?
желательно, чтобы в чарты пихать их потом.

Евгений
07.12.2017
11:21:38
Обычно сервис сборщик логов юзают и уже из него понимают что где кода почему. Из него уже и нотификации сыпятся в слаки, телеграммы и СМС

sherzod
07.12.2017
11:21:42
logstash + elasticsearch, но это тяжеловастенько

Eugene
07.12.2017
11:23:04
Ну а из любимого тогда?)
Не решал такую задачу?

Евгений
07.12.2017
11:23:44
В каком облаке работаем в таком и ищем подобный сборщик ?♂️

Eugene
07.12.2017
11:24:12
Пока что все пути открыты.
Хочу определить наиболее подходящий.

Vasiliy
07.12.2017
11:25:07
logstash elastic-search kibana — норм связка, я её использую

Eugene
07.12.2017
11:25:33
В принципе, уже второй отзыв в пользу.
Засчитано.)
Спасибо.)

Vasiliy
07.12.2017
11:28:37
там только смотри, часть функционала платная (XPack), но я оттуда ничего не использую, вроде и без него норм, но тебе может понадобиться

Eugene
07.12.2017
11:31:37
Ок, спасибо.

Евгений
07.12.2017
12:45:32
Есть может ребята, что с EMR разбирались? Надо передавать большую конфигу процессу и вот какую проблему обнаружили: https://stackoverflow.com/questions/47658137/how-to-use-hadoopjarstepconfig-stepproperties

sherzod
07.12.2017
12:49:40
Про EMR не скажу, но почему бы не использовать setArgs
в обычном MR передача аргументов норм вроде работает через hadoop jar
а. чтобы не парсить..
а как именно вы пытаетесь получить эти properties в main-е?

Евгений
07.12.2017
12:51:35
Не... Парсить не проблема. Конфиг 65кб

Google

Евгений
07.12.2017
12:52:27
Обычно кидали конфу в хадуп и расширяли site-core который отправляется вместе с таском на ноду

sherzod
07.12.2017
12:53:30
если бы мне в MR job-е прилшлось получать конфиг, я бы воспользовался distributed cache
не очень понятно в чём у вас проблема, у вас есть код окружения который настраивает запускаемый JAR и устанавливает Properties. Потом вы пытаетесь получить доступ к ним из функции main JAR-ника?

Alexey
07.12.2017
12:57:48
задачки заускаются через EMR API. не напрямую, ручного контроля над окружением нет.
btw вопрос вполне конкретный, именно по проперти из класса EMR API.

sherzod
07.12.2017
12:58:45
да но не раскрыто как к ним доступ происходит
System.getProperties?

Alexey
07.12.2017
12:59:09
первое что попробовал

sherzod
07.12.2017
13:01:49
в разрезе обычного хадупа должно работать
пробовали распечатать все проперти в лог (можт префиксы, все дела)?

Alexey
07.12.2017
13:03:29
само собой. нету их там ни в каком виде. вот потому и непонятно.

sherzod
07.12.2017
13:08:06
можно еще попробовать аналог вот этого
import org.apache.hadoop.conf.Configuration;
Configuration config = context.getConfiguration();

Alexey
07.12.2017
13:10:27
:))
эти проперти совсем другим способом устанавливаются. нормально документированным.
но в нашем случае не подходят, потому что в отличие от нормального хадупа EMR валидирует конфиг и валится с ошибкой на неизвестные ему проперти. HDInsight/hortonworks позволяет так делать, собсно, на ём мы так и делаем. а у амазона другой путь.

sherzod
07.12.2017
13:12:26
вообще всегда было интересно, я просто думал что они наклеили на HDFS наклейку S3, а на MR наклейку EMR
так и есть?

Alexey
07.12.2017
13:12:48
вообще не так
EMR это собственный амазоновский пропатченный дистриб хадупа с кучей проприетарных компонентов.

sherzod
07.12.2017
13:13:31
ну в целом так и есть получается)
просто апи очень схожее, названия классов сильно пересекаются

Евгений
07.12.2017
13:13:51

Alexey
07.12.2017
13:14:32
ну с обвесом и неоном, да

Евгений
07.12.2017
13:15:08
и спарком

sherzod
07.12.2017
13:16:37
по проблеме, мне кажется есть смысл положить конфиг рядом с jar в distributed cache
ну конкретно по вопросу да видимо не знаю как работает EMR

Google

Alexey
07.12.2017
13:20:27
too complex and insecure. вот инишку рядом с жарником в s3 bucket сложить можно попытаться. (но не хочется, потому что придётся в него тащить зависимость от aws sdk)

sherzod
07.12.2017
13:20:35
и еще из очевидного, ну мало ли, убедиться что проперти выставляются до запуска..

Alexey
07.12.2017
13:22:00
кстати да. стоит перепроверить. мы powershell юзаем для вызовов, а он сам по себе странный.
угу.
нашлось.
короче, эта бяка складывает их таки в окружение, в переменную HADOOP_CLIENT_OPTS. дописывает в конец как -Dkey=value.
одно но — если есть незаэскейпленный с точки зрения шелла символ, то добавленные проперти молча игнорируются.
хоть бы ворнинг какой в лог кинули :\ но фиг там. просто не дописываются.
вывод — эскейпить надо.
если в настройках есть что-то вроде delimiter=\t, то значит дважды искейпить — \\\\t

sherzod
07.12.2017
13:47:06
windows)

Alexey
07.12.2017
13:54:04
если бы

Demidov
08.12.2017
08:22:49
Всем привет!!! А кто-нибудь запускал Hive на Spark2.2.0

Grigory
08.12.2017
08:34:53
Привет, да
на EMR и локально

Nick
08.12.2017
08:35:09
Привет, нет

sherzod
08.12.2017
08:35:20
а главное, зачем???

Nick
08.12.2017
08:35:21
На dcos

Grigory
08.12.2017
08:35:22

sherzod
08.12.2017
08:35:55
счас начнут про индексы чета говорить

Grigory
08.12.2017
08:35:55
ник а ты запускал на дсос?
@gurinderu запускал не?
просто

Nick
08.12.2017
08:36:43
Что запускал то?

Grigory
08.12.2017
08:36:51

Google

Nick
08.12.2017
08:37:21
Ну да, только что?

sherzod
08.12.2017
08:37:57

Grigory
08.12.2017
08:38:14
моя миссия выполнена

Nick
08.12.2017
08:39:28
lol