@hadoopusers

Страница 54 из 182
Nick
05.12.2017
06:45:07
О боже

Dmitry
05.12.2017
08:24:40
Лол, весь сбертех опять?

Grigory
05.12.2017
08:25:16
Лол, весь сбертех опять?
Они ходят на митапы а код не пишут чо за дела

Google
Victor
05.12.2017
08:25:52
KrivdaTheTriewe
05.12.2017
08:25:53
Лол, весь сбертех опять?
ну просто пост о митапе видимо не сразу сделали

Daniel
05.12.2017
08:29:18
Новость старая, да

KrivdaTheTriewe
06.12.2017
16:18:12
кто с нифи работал, скажите, скриптед процессор вообще рабочий?



Дмитрий
06.12.2017
16:44:05
кто с нифи работал, скажите, скриптед процессор вообще рабочий?
ExecuteScript ? Вполне рабочий, сейчас юзаю в проекте. Python

Eugene
07.12.2017
11:17:43
Парни, делал кто-нибудь вывод логов по уровню в чарты на сборке клодэры? К примеру, сколько упало ерроров.

sherzod
07.12.2017
11:18:08
в чем проблема?

Eugene
07.12.2017
11:18:50
Проблема в том, что к примеру, solr не ведет статистику. А спарк подсовывает свои логи в серис hdfs.

И не получается единым подходом просматривать ошибки на кластере.

sherzod
07.12.2017
11:19:49
а не. такое не получится сделать

у клаудеры своя база, и там строго определённые поля (хоть их и очень много)

и потом она все-таки на системную статистику направлена бизнес-логи лучше самому собирать

Google
Eugene
07.12.2017
11:21:08
Какая практика есть?

желательно, чтобы в чарты пихать их потом.

Евгений
07.12.2017
11:21:38
Обычно сервис сборщик логов юзают и уже из него понимают что где кода почему. Из него уже и нотификации сыпятся в слаки, телеграммы и СМС

sherzod
07.12.2017
11:21:42
logstash + elasticsearch, но это тяжеловастенько

Eugene
07.12.2017
11:23:04
Ну а из любимого тогда?)

Не решал такую задачу?

Евгений
07.12.2017
11:23:44
В каком облаке работаем в таком и ищем подобный сборщик ?‍♂️

Eugene
07.12.2017
11:24:12
Пока что все пути открыты.

Хочу определить наиболее подходящий.

Vasiliy
07.12.2017
11:25:07
logstash elastic-search kibana — норм связка, я её использую

Eugene
07.12.2017
11:25:33
В принципе, уже второй отзыв в пользу.

Засчитано.)

Спасибо.)

Vasiliy
07.12.2017
11:28:37
там только смотри, часть функционала платная (XPack), но я оттуда ничего не использую, вроде и без него норм, но тебе может понадобиться

Eugene
07.12.2017
11:31:37
Ок, спасибо.

Евгений
07.12.2017
12:45:32
Есть может ребята, что с EMR разбирались? Надо передавать большую конфигу процессу и вот какую проблему обнаружили: https://stackoverflow.com/questions/47658137/how-to-use-hadoopjarstepconfig-stepproperties

sherzod
07.12.2017
12:49:40
Про EMR не скажу, но почему бы не использовать setArgs в обычном MR передача аргументов норм вроде работает через hadoop jar

а. чтобы не парсить..

а как именно вы пытаетесь получить эти properties в main-е?

Евгений
07.12.2017
12:51:35
Не... Парсить не проблема. Конфиг 65кб

Google
Евгений
07.12.2017
12:52:27
Обычно кидали конфу в хадуп и расширяли site-core который отправляется вместе с таском на ноду

sherzod
07.12.2017
12:53:30
если бы мне в MR job-е прилшлось получать конфиг, я бы воспользовался distributed cache

не очень понятно в чём у вас проблема, у вас есть код окружения который настраивает запускаемый JAR и устанавливает Properties. Потом вы пытаетесь получить доступ к ним из функции main JAR-ника?

Alexey
07.12.2017
12:57:48
задачки заускаются через EMR API. не напрямую, ручного контроля над окружением нет. btw вопрос вполне конкретный, именно по проперти из класса EMR API.

sherzod
07.12.2017
12:58:45
да но не раскрыто как к ним доступ происходит

System.getProperties?

Alexey
07.12.2017
12:59:09
первое что попробовал

sherzod
07.12.2017
13:01:49
в разрезе обычного хадупа должно работать пробовали распечатать все проперти в лог (можт префиксы, все дела)?

Alexey
07.12.2017
13:03:29
само собой. нету их там ни в каком виде. вот потому и непонятно.

sherzod
07.12.2017
13:08:06
можно еще попробовать аналог вот этого import org.apache.hadoop.conf.Configuration; Configuration config = context.getConfiguration();

Alexey
07.12.2017
13:10:27
:)) эти проперти совсем другим способом устанавливаются. нормально документированным. но в нашем случае не подходят, потому что в отличие от нормального хадупа EMR валидирует конфиг и валится с ошибкой на неизвестные ему проперти. HDInsight/hortonworks позволяет так делать, собсно, на ём мы так и делаем. а у амазона другой путь.

sherzod
07.12.2017
13:12:26
вообще всегда было интересно, я просто думал что они наклеили на HDFS наклейку S3, а на MR наклейку EMR так и есть?

Alexey
07.12.2017
13:12:48
вообще не так

EMR это собственный амазоновский пропатченный дистриб хадупа с кучей проприетарных компонентов.

sherzod
07.12.2017
13:13:31
ну в целом так и есть получается)

просто апи очень схожее, названия классов сильно пересекаются

Alexey
07.12.2017
13:14:32
ну с обвесом и неоном, да

Евгений
07.12.2017
13:15:08
и спарком

sherzod
07.12.2017
13:16:37
по проблеме, мне кажется есть смысл положить конфиг рядом с jar в distributed cache ну конкретно по вопросу да видимо не знаю как работает EMR

Google
Alexey
07.12.2017
13:20:27
too complex and insecure. вот инишку рядом с жарником в s3 bucket сложить можно попытаться. (но не хочется, потому что придётся в него тащить зависимость от aws sdk)

sherzod
07.12.2017
13:20:35
и еще из очевидного, ну мало ли, убедиться что проперти выставляются до запуска..

Alexey
07.12.2017
13:22:00
кстати да. стоит перепроверить. мы powershell юзаем для вызовов, а он сам по себе странный.

угу. нашлось. короче, эта бяка складывает их таки в окружение, в переменную HADOOP_CLIENT_OPTS. дописывает в конец как -Dkey=value. одно но — если есть незаэскейпленный с точки зрения шелла символ, то добавленные проперти молча игнорируются. хоть бы ворнинг какой в лог кинули :\ но фиг там. просто не дописываются. вывод — эскейпить надо.

если в настройках есть что-то вроде delimiter=\t, то значит дважды искейпить — \\\\t

sherzod
07.12.2017
13:47:06
windows)

Alexey
07.12.2017
13:54:04
если бы

Demidov
08.12.2017
08:22:49
Всем привет!!! А кто-нибудь запускал Hive на Spark2.2.0

Grigory
08.12.2017
08:34:53
Привет, да

на EMR и локально

Nick
08.12.2017
08:35:09
Привет, нет

sherzod
08.12.2017
08:35:20
а главное, зачем???

Nick
08.12.2017
08:35:21
На dcos

Grigory
08.12.2017
08:35:22
Привет, нет
просто нет

sherzod
08.12.2017
08:35:55
счас начнут про индексы чета говорить

Grigory
08.12.2017
08:35:55
ник а ты запускал на дсос?

@gurinderu запускал не?

просто

Nick
08.12.2017
08:36:43
Что запускал то?

Grigory
08.12.2017
08:36:51
Google
Nick
08.12.2017
08:37:21
Ну да, только что?

sherzod
08.12.2017
08:37:57
Grigory
08.12.2017
08:38:14
Ну да, только что?
зришь в корень и @sherzodv догадался

моя миссия выполнена

Nick
08.12.2017
08:39:28
lol

Страница 54 из 182